0
点赞
收藏
分享

微信扫一扫

Spark SQL创读取文本文件

alanwhy 2022-10-31 阅读 100


1.在本地创建一个文件,有id、name、age三列,用空格分隔,然后上传到hdfs上.

vim /root/person.txt

1 zhangsan 20
2 lisi 29
3 wangwu 25
4 zhaoliu 30
5 tianqi 35
6 kobe 40

上传数据文件到HDFS上:

hadoop fs -put /root/person.txt /

2.打开spark-shell

/export/servers/spark/bin/spark-shell

 

Spark SQL创读取文本文件_hdfs

创建RDD:

Spark SQL创读取文本文件_上传_02

3.定义case class

Spark SQL创读取文本文件_spark_03

4.将RDD和case class关联

Spark SQL创读取文本文件_spark_04

5.将RDD转换成DataFrame

Spark SQL创读取文本文件_上传_05

6.查看数据和schema

Spark SQL创读取文本文件_上传_06

7.注册表

Spark SQL创读取文本文件_spark_07

8.执行SQL

Spark SQL创读取文本文件_hdfs_08

9.也可以通过SparkSession构建DataFrame

Spark SQL创读取文本文件_spark_09

 

举报

相关推荐

0 条评论