- 链接地址:https://blog.csdn.net/qq_42082701/article/details/125478165
- 链接标题:大数据之Spark案例实操完整使用(第六章)-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:2625
文章浏览阅读2.3k次,点赞4次,收藏18次。上面的数据图是从数据文件中截取的一部分内容,表示为电商网站的用户行为数据,主要包含用户的 4 种行为:搜索,点击,下单,支付。数据规则如下:➢ 数据文件中每行数据采用下划线分隔数据➢ 每一行数据表示用户的一次行为,这个行为只能是 4 种行为的一种➢ 如果搜索关键字为 null,表示数据不是搜索数据➢ 如果点击的品类 ID 和产品 ID 为-1,表示数据不是点击数据➢ 针对于下单行为,一次可以下单多个商品,所以品类 ID 和产品 ID 可以是多个,id 之间采用逗号分隔,如果本次不是下单行为,则数据采用 nu_spark案例
版权声明:本文发布于特牛网址导航 内容均来源于互联网 如有侵权联系删除
标签:spark案例