1)Mapreduce程序启动一个Jobclient实例,开启整个mapreduce作业7 ]* j6 a1 s/ L4 V
2)Jobclient通过getnewjobld()j接口向Jobtarker发出请求,以获得一个新的作业ID。2 |& u' h5 n. }, U
3)Jobclient根据作业指定的输入文件计算数据块的划分,并将完成作业所需要的资源,包括JAR文件,配置文件,数据块,存放到HDFS中属于jobtracker的作业ID命令的目录下,一些文件可能以冗余的方式存放多个节点上。; C. s' p+ v/ c1 m" m8 s