Java教程

06 Spark SQL 及其DataFrame的基本操作

本文主要是介绍06 Spark SQL 及其DataFrame的基本操作,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

Spark SQL DataFrame的基本操作

文件路径:

file='url'

文本:

json:

创建:

spark.read.text(file)

spark.read.json(file)

打印数据

df.show()默认打印前20条数据,df.show(n)

文本:

 

json:

打印概要

df.printSchema()

文本:

 json:

查询总行数

df.count()

df.head(3) #list类型,list中每个元素是Row类

文本:

json:

输出全部行

df.collect() #list类型,list中每个元素是Row类(文本与json数据差异与上df.head()同)

查询概况

df.describe().show()

文本:

json:

取列(仅json文件可使用以下命令)

df['name']

df.name

df.select()

df.filter()

df.groupBy()

df.sort()

这篇关于06 Spark SQL 及其DataFrame的基本操作的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!