- 链接地址:https://blog.csdn.net/weixin_44258756/article/details/103047468
- 链接标题:MapReduce数据分析(8)TopN_mapreduce的topn分析-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:9929
文章浏览阅读3.2k次。八、MapReduce第八讲TopK本次教程主要讲TreeMap方法:在搜索引擎领域中,常常需要统计最近最热门的K个查询词,这就是典型的“Top K”问题,也就是从海量查询中统计出现频率最高的前K个。该问题可分解成两个MapReduce作业,分别完成统计词频和找出词频最高的前K个查询词的功能,这两个作业存在依赖关系,第二个作业需要依赖前一个作业的输出结果。第一个作业是典型的WordCount问..._mapreduce的topn分析
版权声明:本文发布于特牛生活网 内容均来源于互联网 如有侵权联系删除