当前位置: 首页 > news >正文

中投中原建设有限公司官方网站百度网盟推广官方网站

中投中原建设有限公司官方网站,百度网盟推广官方网站,led灯什么网站做推广好,怎么做网站企业介绍shuffle流程概括 因为频繁的磁盘I/O操作会严重的降低效率,因此“中间结果”不会立马写入磁盘,而是优先存储到Map节点的“环形内存缓冲区”,在写入的过程中进行分区(partition),也就是对于每个键值对来说&a…

shuffle流程概括

因为频繁的磁盘I/O操作会严重的降低效率,因此“中间结果”不会立马写入磁盘,而是优先存储到Map节点的“环形内存缓冲区”,在写入的过程中进行分区(partition),也就是对于每个键值对来说,都增加了一个partition属性值,然后连同键值对一起序列化成字节数组写入到缓冲区(缓冲区采用的就是字节数组,默认大小为100M)。当写入的数据量达到预先设置的阙值后(MapReduce.Map.io.sort.spill.percent,默认0.80,或者80%)便会启动溢写出线程将缓冲区中的那部分数据溢出写(spill)到磁盘的临时文件中,并在写入前根据key进行排序(sort)和合并(combine,可选操作)。溢出写过程按轮询方式将缓冲区中的内容写到MapReduce.cluster.local.dir属性指定的目录中。当整个Map任务完成溢出写后,会对磁盘中这个Map任务产生的所有临时文件(spill文件)进行归并(merge)操作生成最终的正式输出文件,此时的归并是将所有spill文件中的相同partition合并到一起,并对各个partition中的数据再进行一次排序(sort),生成key和对应的value-list,文件归并时,如果溢写文件数量超过参数min.num.spills.for.combine的值(默认为3)时,可以再次进行合并。至此,Map端shuffle过程结束,接下来等待reduce task来拉取数据。对于reduce端的shuffle过程来说,reduce task在执行之前的工作就是不断地拉取当前job里每个Map task的最终结果,然后对从不同地方拉取过来的数据不断地做merge最后合并成一个分区相同的大文件,然后对这个文件中的键值对按照key进行sort排序,排好序之后紧接着进行分组,分组完成后才将整个文件交给reduce task处理。

分区是发生在溢出写过程之前,也就是当满足溢出写条件时,首先进行分区,然后分区内排序,并且选择性的combine,最后写出到磁盘。

【Reducer如何知道自己应该处理哪些数据】

因为Map端进行partition的时候,实际上就相当于指定了每个Reducer要处理的数据(partition就对应了Reducer),所以Reducer在拷贝数据的时候只需拷贝与自己对应的partition中的数据即可。每个Reducer会处理一个或者多个partition。

【Reducer如何知道要从哪台机器上去的Map输出】

Map任务完成后,它们会使用心跳机制通知它们的Application Master、因此对于指定作业,Application Master知道Map输出和主机位置之间的映射关系。Reducer中的一个线程定期询问Master以便获取Map输出主机的位置。知道获得所有输出位置。

http://www.mnyf.cn/news/36061.html

相关文章:

  • 奉贤网站建设专家网络优化论文
  • 如何做网站认证免费域名注册查询
  • 什么网站可以做字体效果好深圳百度seo代理
  • 企业网站的建立不能缺少哪些细节小红书广告投放平台
  • 政府网站建设园林绿化推广引流平台
  • 益阳做网站h5下一页
  • 网站做网络营销的效果seo查询
  • 网站建立健全举报工作机制html友情链接代码
  • 网站推广运营公司打开百度官网
  • 企业园林设计网站模板电商运营培训正规平台
  • 网站上360 旋转的图是怎么做的浙江新手网络推广
  • 优秀的移动网站seo全网营销公司
  • wordpress调用网站标题江苏网站建设制作
  • 网站建设 会议纪要最新新闻头条
  • 高端企业网站建设的核心是什么营销推广是什么意思
  • 云南省建设厅专家注册网站软文写作的技巧
  • 中山微信网站南昌seo实用技巧
  • 肥西县市建设局网站优化方案的格式及范文
  • wordpress主题限速广州网站营销优化qq
  • logo设计说明自然搜索优化
  • 2017如何免费制作网站超级优化大师下载
  • 多终端网站苏州网站制作
  • 哈尔滨松北区建设局网站做百度seo
  • 甘肃省酒泉市做网站公司网络培训研修总结
  • 网站建设英文游戏推广在哪里接活
  • wordpress 回车换行seo优化推广工程师
  • 织梦做的网站页面打不开前端seo搜索引擎优化
  • 做网站建设的公司有哪些企业网络推广的方法有哪些
  • 网站做淘宝客需要什么拓客app下载
  • 怎么做点击文字进入的网站四川百度推广排名查询