6. RDD综合练习：更丰富的操作 - 为之网

Java教程

6. RDD综合练习：更丰富的操作

本文主要是介绍6. RDD综合练习：更丰富的操作，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

集合运算练习

union()， intersection()，subtract(), cartesian()

内连接与外连接

join(), leftOuterJoin(), rightOuterJoin(), fullOuterJoin()

多个考勤文件，签到日期汇总，出勤次数统计

三、综合练习：学生课程分数

1、网盘下载sc.txt文件，通过RDD操作实现以下数据分析:

2、持久化 scm.cache()

3、总共有多少学生？map(), distinct(), count()

4、开设了多少门课程？

5、生成（姓名，课程分数）键值对RDD，观察keys(),values()

6、每个学生选修了多少门课？map(), countByKey()

7、每门课程有多少个学生选？map(), countByValue()

8、有多少个100分？

9、Tom选修了几门课？每门课多少分？filter(), map() RDD

10、Tom选修了几门课？每门课多少分？map(),lookup() list

11、Tom的成绩按分数大小排序。filter(), map(), sortBy()

12、Tom的平均分。map(),lookup(),mean()

（没有numpy库的可自行安装pip install numpy，安装成功后重进pyspark即可）

13、生成（课程，分数）RDD，观察keys(),values()

14、每个分数+5分。mapValues(func)

15、求每门课的选修人数及所有人的总分。combineByKey()

16、求每门课的选修人数及平均分，精确到2位小数。map()，round()

17、求每门课的选修人数及平均分。用reduceByKey()实现，并比较与combineByKey()的异同。

reduceByKey：是对key的value进行merge操作，在一个(K,V)的RDD上调用，返回一个(K,V)的RDD，使用指定的reduce函数，将相同key的值聚合到一起，与groupByKey类似，reduce任务的个数可以通过第二个可选的参数来设置，最重要的是它能够在本地先进行merge操作，并且merge操作可以通过函数自定义；

CombineByKey：是一个比较底层的算子（高阶函数），用法如下：
combineByKey(createCombiner,mergeValue,mergeCombiners,partitioner,mapSideCombine)。

createCombiner: V => C ，这个函数把当前的值作为参数，此时我们可以对其做些附加操作(类型转换)并把它返回 (这一步类似于初始化操作)
mergeValue: (C, V) => C，该函数把元素V合并到之前的元素C(createCombiner)上 (这个操作在每个分区内进行)
mergeCombiners: (C, C) => C，该函数把2个元素C合并 (这个操作在不同分区间进行)。

18、结果可视化。 pyecharts.charts,Bar()

这篇关于6. RDD综合练习：更丰富的操作的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

您可能喜欢

栏目导航

前端开发

HTML5教程

CSS教程

Javascript

jQuery教程

AJAX教程

Node.js教程

XML教程

正则表达式

后端开发

Go教程

C/C++教程

消息队列MQ

Net Core教程

Asp.net教程

Java教程

PHP教程

移动端开发

微信公众号开发

小程序开发

Swift教程

IOS教程

Kotlin教程

Android开发

数据库

Redis教程

MongoDB教程

PostgreSQL教程

Oracle教程

MariaDB教程

SqLite教程

MySql教程

SqlServer教程

服务器运维

Kubernetes

Docker容器

linux shell

Nginx教程

网站安全

PowerShell教程

Linux教程

人工智能

TensorFlow教程

Python教程

机器学习

人工智能学习

区块链

区块链技术

游戏开发

游戏编程

Unity3D教程

网站运营

网站策划

网站优化

建站知识

大数据/云计算

云计算

Hadoop教程

软件工程

软件/开发工具使用

Git教程

资讯