资源浏览查阅17次。基于哈希技术和MapReduce的大数据集K-近邻算法实现代码更多下载资源、学习资料请访问CSDN文库频道....
admin 2024-01-21
资源浏览查阅196次。基于哈希技术和MapReduce的大数据集K-近邻算法实现的完整代码更多下载资源、学习资料请访问CSDN文库频道....
admin 2024-01-21
文章浏览阅读409次。大数据技术之_19_Spark学习_08_Spark 机器学习_02_凸优化算法 + 线性回归算法 + FPGrowth 关联规则算法 + 决策树 + 随机森林算法_关联算法 优化方案...
admin 2024-01-23
前言 Hadoop / Spark / MapReduce 介绍...
admin 2024-01-23
文章浏览阅读4.8k次,点赞2次,收藏12次。百度面试题1、海量日志数据,提取出某日访问百度次数最多的那个IP。IP 是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每......
admin 2024-01-23
文章浏览阅读718次。GraphX之Connected Components算法及Spark实现Connected ComponentsDemo扩展Connected Components源码Compute the connected component membership of each vertex and return a graph with the vertex value containing the lowest vertex id in the connected component containing......
admin 2024-01-22
文章浏览阅读556次。第4章 凸优化算法4.1 梯度下降4.2 牛顿法4.3 拟牛顿法4.4 BFGS 算法第5章 L1、L2 正则化5.1 从经验风险最小化到结构经验最小化5.2 范数与正则项5.3 贝叶斯先验第6章 线性回归算法6.1 数学模型6.2 线性回归的应用6.2 S......
admin 2024-01-22
tag排序-刷题预备知识-2. TopK 解法总结, Java实现 dbc,tag数组-刷题预备知识-6. 数组的前缀和(preSum), lt.303 + lt.304 1.2,tag排序-刷题预备知识-1.《快排, 堆排, 归并》最常见写法和优化,Java实现 2,算法,数据结构,leetcode...
admin 2024-01-22
文章浏览阅读1.8k次。日常扯:好饿啊,还没吃晚饭。这周心态爆炸,水一个论文总结吧原文连接:知网:大数据环境下决策树算法并行化研究主要研究问题 决策数算法(ID3)并行化为什么重要 大数据环境下像决策树这种传统算法......
admin 2024-01-24
文章浏览阅读1w次,点赞12次,收藏39次。第一讲 大数据算法概述大数据算法概述第一讲作业第二讲 亚线性算法亚线性算法概述亚线性算法概述单元测验第三讲 亚线性算法例析亚线性算法例析第三讲作业第四讲 外存算法概述外......
admin 2024-01-23
1.代码和原理驱动讲解Spark2.4的各个技术点(全部手敲代码),全程图文解读,2.能够对常见的Spark2.4性能问题,使用各种技术进行性能调优,3.熟练掌握Spark2.4全体系的知识和操作,可以开发各种复杂的大数据离线批处理程序,4.透彻......
admin 2024-01-22
文章浏览阅读834次。GraphX之Pregel算法原理及Spark实现Pregel案例:求顶点5到其他各点的最短距离Pregel原理分析Pregel源码 def pregel[A: ClassTag]( initialMsg: A, maxIterations: Int = Int.MaxValue, activeDirection: EdgeDirection = EdgeDirection.Either)(......
admin 2024-01-22
文章浏览阅读799次。SVM 的高泛化和学习能力使其适⽤于处理高维数据,例如⼤数据和⼊侵检测。但是,在实施 IDS 时需要注意许多挑战,例如以高⼊侵检测率和低误报率实时提供响应。此外,⼤量特征和识别它们之间复杂关系的......
admin 2024-01-22
导读:读书,能让我们遇到好的书中好的方法、思想,不时的看看,就会让我们的头脑中思考的神经通路发达起来,慢慢地,我们就能够有了一些 积累,就会有了好的思维习惯。云栖社区小编为你整理出了2019年5月下旬最值得一......
admin 2024-09-18
文章浏览阅读3.9k次,点赞2次,收藏7次。1. 什么是梯度下降?梯度下降法(英语:Gradient descent)是一个一阶最优化算法,通常也称为最速下降法。 要使用梯度下降法找到一个函数的局部极小值,必须向函数上当前点对应梯度(......
admin 2024-01-24
文章浏览阅读6.4k次,点赞3次,收藏7次。1. 聚类1.1 什么是聚类?所谓聚类问题,就是给定一个元素集合D,其中每个元素具有n个可观察属性,使用算法将集合D划分成k个子集,要求每个子集内部的元素之间相异度尽可能低,而不......
admin 2024-01-24
文章浏览阅读1.3k次。文章目录简介那么这种题目或者这种问题到底解决的难点和关键点是什么?相关解法:真正的最优解。scala版本简介什么是TopN问题?举个例子:怎么在几十亿的数字中找到前50个数字(升序或者降序)。诸如......
admin 2024-01-23
友情链接申请要求: 不违法不降权 权重相当 请联系QQ:737597453