mapreduce的job流程

2020-08-25 20:33发布

3条回答
D滴滴
2020-08-25 20:38

1、 client提交任务,运行一个job

2、 client向jobtracker索取一个新的jobid

3、 client将所有信息上传到分布式系统中。

4、 client通知jobtracker提交任务完毕。

5、 jobtracker将任务初始化,其实就是将任务加入到任务队列中排队。直到运行到这个任务。

6、 jobtracker查看client提交的任务处理的输入是否合法,并作分割。

7、 通知含有数据的tasktracker进行任务。

8、 tasktracker接扫任务后,将client提交的资料从分布式系统中拿出来,启动虚拟机执行任务,其中可以是map任务,也可以是reduce任务,执行map任务的是map task,执行reduce任务的是reduce task。

9、 map任务执行完的中间结果存到内存和硬盘两部分,reduce会通过查看map的执行地点,主动来拿数据,并且做reduce任务。

10、 上述流程结束后,就是真正map和reduce代码的执行流程了。


一周热门 更多>