资源浏览查阅153次。Spark面试题全解-2019最新版面试题史上最全Spark面试题spark面试题更多下载资源、学习资料请访问CSDN文库频道....
admin 2024-01-22
资源浏览查阅137次。2018/6/5spark相关的面试题跟答案,带着问題学习效果更佳哟。)-about云开发活到老spark面试题更多下载资源、学习资料请访问CSDN文库频道....
admin 2024-01-22
文章浏览阅读1.3k次。一、Spark 的运行流程?二、Spark 有哪些组件?三. Spark 中的 RDD 机制理解吗?四、RDD的操作分类五、如何区分 RDD 的宽窄依赖?为什么要设计宽窄依赖?六、RDD 持久化原理?七、Checkpoint 检查点机制?八、Check......
admin 2024-01-24
Spark任务的基本运行流程简介,Spark on yarn 提交作业的流程,Spark中的Driver和Executor的个人理解...
admin 2024-01-23
hive-sql金典面试题分别用sql,spark-sql(DSL),Spark-rdd形式实现,spark...
admin 2024-01-22
文章浏览阅读6.8k次。版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声..._shuffle通常是由具有宽依赖的操作触发的...
admin 2024-01-23
老王的小知识擅长【大数据】Spark,【大数据】Scala,【大数据】面试题,等方面的知识,老王的小知识关注hive,storm,spark,hadoop,etl领域....
admin 2023-10-11
文章浏览阅读3.3w次,点赞12次,收藏155次。一、简答题1.Spark master使用zookeeper进行HA的,有哪些元数据保存在Zookeeper?答:spark通过这个参数spark.deploy.zookeeper.dir指定master元数据在zookeeper中保存的位置,包括Worker,Driver和Application......
admin 2024-01-24
文章浏览阅读196次。1.Application使用SparkSubmit提交的个计算应用,一个Application中可以触发一到多次Action,触发一次Action形成一个DAG,一个DAG对应一个Job,一个Application中可以有一到多个Job2.JobDriver向Executor提交的作业,触发一次Acition形......
admin 2024-01-22
文章浏览阅读707次。大数据基础面试题五:Spark Core & SQL & Streaming目录大数据基础面试题五:Spark Core & SQL & Streaming十一、 Spark Core & SQL11.1 Spark解决什么问题11.2 Spark为什么会有自己的资源调度器11.3 Spark运行模式11.4 S......
admin 2024-01-22
文章浏览阅读628次。1、Shuffle优化配置 - spark.shuffle.file.buffer默认值:32k参数说明:该参数用于设置shuffle write task的BufferedOutputStream的buffer缓冲大小。将数据写到磁盘文件之前,会先写入buffer缓冲中,待缓冲写满之后,才会溢写到......
admin 2024-01-25
文章浏览阅读161次。Spark有yarn-client和yarn-cluster两种模式,主要区别在于:Driver程序的运行节点。yarn-client:Driver程序运行在客户端,适用于交互、调试,希望立即看到app的输出。yarn-cluster:Driver程序运行在由ResourceManager启动的APP......
admin 2024-01-23
文章浏览阅读343次。1.案例一需求:求同一个用户连续登录三天及以上的用户1.1 数据准备guid01,2018-03-01guid01,2018-02-28guid01,2018-03-01guid01,2018-03-04guid01,2018-03-02guid01,2018-03-05guid01,2018-03-06guid01,2018-03-07guid02,2018-03-01guid02,2018-03-02guid02,2018-03-......
admin 2024-01-22
友情链接申请要求: 不违法不降权 权重相当 请联系QQ:737597453