特牛网址导航

Spark之SparkSQL_spark sql-CSDN博客

网友收藏
文章浏览阅读4.2k次,点赞3次,收藏43次。什么是SparkSQLSparkSQL是Spark用于结构化数据处理的模块SparkSQL的原理SparkSQL提供了两个编程抽象,DataFrame和DataSetDataFrame 1)DataFrame是一种类似RDD的分布式数据集,类似于传统数据库中的二维表格。2)DataFrame与RDD的主要区别在于,DataFrame带有schema元信息,即DataFrame所表示的二维表数据集的每一列都带有名称和类型。..._spark sql
标签:spark sql