特牛生活网

【精选】[SPARK][HBASE]spark读取文件,生成hfile并批量导入hbase以及遇到的spark运行时候的问题_spark hbase hfile-CSDN博客

网友收藏
文章浏览阅读998次,点赞4次,收藏9次。目录1.使用scala读取文件,生成hfile,bulkload2.展示一下java代码,不如scala快3.暂时认为最靠谱的put批量操作如果你支持scala,恭喜你,很容易一般写spark程序,文件路径都设置成hdfs路径,不容易报错;要不然容易踩坑,(⊙o⊙)…我踩坑了、将文件上传到hdfs吧。文件路径就写成 hdfs:///注意:1.使用spark的saveAsNewAPIHadoopFile一定要对rowkey,列族,子列 进行排序,否则执行的时候会报错: java.io.IOExcept_spark hbase hfile