文章浏览阅读5k次,点赞5次,收藏43次。简介:小红书作为生活分享类社区,目前有8500万用户,年同比增长为300%,大约每天有30亿条笔记在发现首页进行展示。推荐是小红书非常核心且重要的场景之一,本文主要分享在推荐业务......
admin
文章浏览阅读526次。1 【数仓模块-字典构建篇】1.1 地理位置字典构建1.1.1 需求说明在埋点日志中,有用户的地理位置信息,但是原始数据形式是GPS坐标;但是GPS坐标在后续(地理位置维度分析)的分析中不好使用!直接去匹配......
admin
文章浏览阅读1.7k次,点赞43次,收藏42次。在日常的开发中,除了使用Spring Boot这个企业级快速构建项目的框架之外,随着业务数据量的大幅度增加,对元数据库造成的压力成倍剧增。在此背景下,Redis这个NoSQL数据库已然整个项......
admin
大数据之Scala 集合 完整使用一、集合简介1、不可变集合继承图2、可变集合继承图二、数组1、不可变数组1)第一种方式定义数组2)案例实操3)第二种方式定义数组4)案例实操2、可变数组1)定义变长数组2)案例实操3、不可变......
admin
文章浏览阅读255次。1、下载解压scala压缩包去官网https://www.scala-lang.org/download/2.10.4.html下载scala与jdk版本是相匹配的,如果jdk版本过低,解压配置完环境变量后,测试scala -version可能会出现如下问题:意思是说jdk版本过低,需要更......
admin
文章浏览阅读868次。DWM 层部分的代码主要的责任,是通过计算把一种明细转变为另一种明细以应对后续的统计。学完本阶段内容要求掌握_电商实时数仓可视化项目dwm层...
admin
文章浏览阅读327次。 随着大数据时代的到来及数据分析技术的进步,各行各业对数据分析的关注度也越来越高,同时很多企业意识到通过数据分析而获得的知识和信息对企业的日常经营活动具有积极的促进作用。但如何才能......
admin
文章浏览阅读789次。#include "stdio.h"#include "string.h"#define MAX 1024void getDigits(int *a,char *str){ int len = strlen(str); int i=0; char c; for(i=0;i=0;i--) { if(c[i]!=0) break; }...
admin
雪的期许擅长ACM:数据结构:动态规划+图论,ACM:数学+概率论+数论+组合数学,ACM:贪心+搜索+模拟+大数运算,等方面的知识,雪的期许关注算法,python,c++,java,django,c语言,nginx,golang,mysql,后端,sql领域....
admin
文章浏览阅读1.3k次。架构项目框架数仓架构存储压缩Snappy与LZOLZO安装:读取LZO文件时,需要先创建索引,才可以进行切片。框架版本选型Apache:运维麻烦,需要自己调研兼容性。CDH:国内使用最多,不开源,已开始收费。老版......
admin
文章浏览阅读413次。大数据专家已经意识到Spark和Python在标准JVM上的重要性,但是围绕“ Scala或Python是大数据项目中的哪个选择”这一话题存在着共同的争论。两者之间的差异可以根据性能,学习曲线,并发性,类型安全性,可......
admin
文章浏览阅读329次。1、克隆并启动虚拟机第1步,若master已开启,首先将其关闭第2步,在左侧导航栏中,右键单击master客户机,选择“管理”-“克隆”选项,打开“克隆虚拟机向导”,单击下一步第3步,配置克隆源,单击下一......
admin
文章浏览阅读780次。一、var val都是修饰变量的。val修饰的是一个值。定义了一个值,name是一个名字,name的类型是string,name的值是17val name:String = “17”name:名字 value:17var修饰的是一个变量scala> var money:Int = 10000;money:Int = 10000;......
admin
大数据专家已经意识到Spark和Python在标准JVM上的重要性,但是围绕“ Scala或Python是大数据项目中的哪个选择”这一话题存在着共同的争论。两者之间的差异可以根据性能,学习曲线,并发性,类型安全性,可用性及其高级功能来......
admin
文章浏览阅读2k次,点赞3次,收藏9次。大数据机器学习之KNN(k近邻)算法Spark mllib实现案例背景在大数据场景下,spark框架提供了支持分类,聚合,协同过滤,回归四大类场景的mllib模块本文讲述的knn刚好是spark mllib不支持,但......
admin
文章目录 1 计量数字化助力计量大数据体系构建 1.1 计量数字化保证计量数据的准确统一 1.2 计量数字化保障计量数据安全可信 1.3 计量数字化保证计量数据全生命周期的质量可靠与可追...
admin
文章浏览阅读4.7k次。第2章 日记采集阿里巴巴日志采集的两大体系Web端,基于浏览器日志采集技术方案:Aplus.JSAPP端,无线客户端日志采集技术方案:UserTrack2.1 浏览器的页面日志采集页面浏览日志的采集,也就是当一个页面被浏......
admin
友情链接申请要求: 不违法不降权 权重相当 请联系QQ:737597453