特牛网址导航

pyspark原理简介_pyspark的python子进程资源从哪来-CSDN博客

网友收藏
文章浏览阅读2.5w次,点赞7次,收藏9次。这是前段时间在看spark的python支持的时候,简单过了一下pyspark里的python代码,整理了一个大致流程。虽然几乎不会python,但基本上能看懂pyspark是怎么让不同虚拟机之间传输数据的、如何在python环境调用java类的、pyspark SDK的丰富程度取决于什么、需要做些什么流程和封装等。我看了下,应该只有Pyspark Internals这篇wiki里介绍了pyspark的实现机制,大体是下面这张图就可以表示_pyspark的python子进程资源从哪来