特牛生活网

基于Idea的Spark大数据分析--scala_基于scala语言的spark数据处理分析-CSDN博客

网友收藏
文章浏览阅读2.8k次,点赞2次,收藏50次。问题重述• 基于Eclipse或IDEA完成Spark大数据分析• Spark1.x或2.x版本均可• 能够读取给定的数据文件• 出租车GPS数据文件(taxi_gps.txt)• 北京区域中心坐标及半径数据文件(district.txt)• 能够输出以下统计信息• A:该出租车GPS数据文件(taxi_gps.txt)包含多少量车?• B:北京每个城区的车辆位置点数(每辆车有多个位置点,允许重复)开发环境:Spark版本 spark-2.1.1-bin-hadoop2.7Scala版_基于scala语言的spark数据处理分析