特牛生活网

spark+kafka实时数据分析-CSDN博客

网友收藏
文章浏览阅读5.5k次,点赞12次,收藏76次。spark+kafka实时数据分析一、项目内容1. 项目流图2. 数据处理和python操作kafka本项目采用的数据集压缩包为data_format.zip点击这里下载data_format.zip数据集,该数据集压缩包是淘宝2015年双11前6个月(包含双11)的交易数据(交易数据有偏移,但是不影响实验的结果),里面包含3个文件,分别是用户行为日志文件user_log.csv 、回头客训练集train.csv 、回头客测试集test.csv. 在这个案例中只是用user_log.csv这个文件