Spark SQL创读取文本文件-CFANZ编程社区

1.在本地创建一个文件，有id、name、age三列，用空格分隔，然后上传到hdfs上.

vim /root/person.txt

1 zhangsan 20
2 lisi 29
3 wangwu 25
4 zhaoliu 30
5 tianqi 35
6 kobe 40

上传数据文件到HDFS上：

hadoop fs -put /root/person.txt /

2.打开spark-shell

/export/servers/spark/bin/spark-shell

Spark SQL创读取文本文件_hdfs

创建RDD:

Spark SQL创读取文本文件_上传_02

3.定义case class

Spark SQL创读取文本文件_spark_03

4.将RDD和case class关联

Spark SQL创读取文本文件_spark_04

5.将RDD转换成DataFrame

Spark SQL创读取文本文件_上传_05

6.查看数据和schema

Spark SQL创读取文本文件_上传_06

7.注册表

Spark SQL创读取文本文件_spark_07

8.执行SQL

Spark SQL创读取文本文件_hdfs_08

9.也可以通过SparkSession构建DataFrame

Spark SQL创读取文本文件_spark_09