特牛网址导航

基于spark的Scala编程—RDD、DataFrame和DataSet的区别_dataframe和dataset是谁提出的-CSDN博客

网友收藏
文章浏览阅读660次。本文主要介绍RDD、DataFrame和DataSet这三者到底有什么区别,主要介绍以下几个方面:分别出现在spark的哪些版本?各自的优缺点是什么?应该如何选择使用哪个类别?分别出现在spark的哪些版本?RDD是spark一开始就提出的概念,DataFrame是spark1.3.0版本提出来的,spark1.6.0版本又引入了DateSet的,但是在spark2.0版本中,Dat..._dataframe和dataset是谁提出的