文章浏览阅读4.3k次,点赞46次,收藏4次。 大家好,我是不温卜火,是一名计算机学院大数据专业大二的学生,昵称来源于成语—不温不火,本意是希望自己性情温和。作为一名互联网行业的小白,博主写博客一方面是为了......
admin 2024-01-23
文章浏览阅读294次。堆栈溢出解决方案进入spark安装目录下的conf文件夹cd /opt/spark/conf/cp spark-defaults.conf.template spark-defaults.confvi spark-defaults.confspark.driver.extraJavaOptions="-Xss30M"_saprk-submit错误exception in thread "main" java.lang.......
admin 2024-01-23
文章浏览阅读453次。stage 的计算模式原文链接:https://blog.csdn.net/wyqwilliam/article/details/81123227stage 的计算模式就是:pipeline 模式,即计算过程中数据不会落地,也就是不会存到 磁盘,而是放在内存中直接给下一个函数使用,stage ......
admin 2024-01-24
文章浏览阅读788次。使用actor时要注意的风险:1)receive中case不匹配时,此actor可能被一些无关的消息占满而无法接收更多消息,所以在实际编程时用case _ 方式,2)消息发送是异步的。消息何时到达无法保证,所以写程序时不应......
admin 2024-01-23
文章浏览阅读8.3k次,点赞2次,收藏7次。小问题可能存在大问题,希望大神帮忙解答。Spark本地运行模式中单线程与多线程问题之setMaster("local")可以运行,但是设置成setMaster("local[3]")或setMaster("local[*]")则报......
admin 2024-01-23
文章浏览阅读8.2k次,点赞2次,收藏3次。19/07/09 17:00:48 INFO SecurityManager: SecurityManager: authentication disabled; ui acls disabled; users with view permissions: Set(root); groups with view permissions: Set(); users with modify pe..._service 'sparkdriver' could not bind on a r......
admin 2024-01-24
文章浏览阅读339次。1.设置合理的消费并行度最优的方案是:kafka分区数:broker *3/6/9kafka分区能不能增加,能不能减少?kafka分区数是可以增加的,但是不能减少2.序列化java的序列化,很沉重,会序列化好多无关的,耗时特别长..._dstream 消费......
admin 2024-01-21
文章浏览阅读3.5k次,点赞5次,收藏2次。错误信息Error:(29, 15) value $ is not a member of StringContext df.select($"name", $"age" + 1).show()解决方案··· //在创建SparkSession之后 import sparkSession.implicits._ ···..._value '$' is not a member o......
admin 2024-01-24
文章浏览阅读1.6k次。【[2020.6] 数据挖掘:基于Spark框架的K-Means聚类2】在Iris数据集上借助pyspark实现K-Means聚类Iris(鸢尾花)数据集Iris数据集简介Iris数据集下载和处理基于pypark的K-Means 聚类实验与参数分析Spark组件MLlib[^2]实验步骤......
admin 2024-01-23
文章浏览阅读1.6k次。【[2020.6] 数据挖掘:基于Spark框架的K-Means聚类2】在Iris数据集上借助pyspark实现K-Means聚类Iris(鸢尾花)数据集Iris数据集简介Iris数据集下载和处理基于pypark的K-Means 聚类实验与参数分析Spark组件MLlib[^2]实验步骤......
admin 2024-01-23
文章浏览阅读1k次,点赞2次,收藏8次。hadoop启动后安全模式问题问题:正常启动hadoop集群后,准备在hadoop里创建一个目录结果出现如下:[root@master ~]# hdfs dfs -mkdir -p /spark/data/words/mkdir: Cannot create directory /spark/data/words. Name node is in......
admin 2024-01-22
文章浏览阅读2.2k次,点赞2次,收藏2次。1. 本地Master负责调度资源1.1 命令行bin/spark-submit --class cn.spark.com.WordCountForHDFS \--master spark:node01:8080 \--executor-memory 1g \ //每个executor分配1g的内存--total-executor-cores 4 \ //所有的executor加起来核......
admin 2024-01-24
大数据技术之_16_Scala学习_11_客户信息管理系统+并发编程模型 Akka+Akka 网络编程-小黄鸡客服案例+Akka 网络编程-Spark Master Worker 进程通讯项目_scala黑窗口出现y/n...
admin 2023-10-10
文章浏览阅读326次。大数据高速计算引擎Spark课程内容:MapReduce、Spark、Flink(实时) => 3代计算引擎;昨天、今天、未来MapReduce、Spark:类MR的处理引擎;底层原理非常相似;数据分区、map task、reduce task、shuffle第一部分 Spark Cor......
admin 2023-11-11
文章浏览阅读1w次。py4j.protocol.Py4JJavaError: An error occurred while calling z:org.apache.spark.api.python.PythonRDD.collectAndServe.异常的解决办法:通常是新手在刚开始使用 pyspark 的时候,对于 spark 文件读取路径不太理解导致的异常pyspark 读取本地......
admin 2024-01-23
文章浏览阅读300次。1. 问题:2. 解决适用于win7、win10在windows环境下的eclipse或者idea中编写spark应用时,有时为了验证程序功能需要以本地模式运行测试。常常会遇到如下的异常:java.io.Exception: Could not locate executable null\bin\winutils.ex......
admin 2024-01-24
文章浏览阅读374次。目录3.6 Action3.7 Key-Value RDD操作3.7.1 创建Pair RDD3.7.2 Transformation操作 1、类似 map 操作 2、聚合操作【重要、难点】 3、排序操作 4、join操作3.7.3 Action操作3.8 输入与输出3.8.1 文件输入与输出 1、文本......
admin 2023-11-11
友情链接申请要求: 不违法不降权 权重相当 请联系QQ:737597453