特牛生活网

MapReduce数据分析(8)TopN_mapreduce的topn分析-CSDN博客

网友收藏
文章浏览阅读3.2k次。八、MapReduce第八讲TopK本次教程主要讲TreeMap方法:在搜索引擎领域中,常常需要统计最近最热门的K个查询词,这就是典型的“Top K”问题,也就是从海量查询中统计出现频率最高的前K个。该问题可分解成两个MapReduce作业,分别完成统计词频和找出词频最高的前K个查询词的功能,这两个作业存在依赖关系,第二个作业需要依赖前一个作业的输出结果。第一个作业是典型的WordCount问..._mapreduce的topn分析