Java教程

4.RDD操作

本文主要是介绍4.RDD操作,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

一、 RDD创建

  1. 从本地文件系统中加载数据创建RDD将本地文件TextOne.txt中的数据导入RDD中

          

   2.从HDFS加载数据创建RDD

   启动hdfs

   
   上传文件

   
   查看文件

           
   加载

           
   停止hdfs

           

  1. 通过并行集合(列表)创建RDD
    输入列表
    字符串
    numpy生成数组

   

二、 RDD操作

  1.转换操作

   map(func)显式定义函数lambda函数

   

   filter(func)
   显式定义函数
   lambda函数

   

 

   2.行动操作

   foreach(print)
   foreach(lambda a:print(a.upper())

       

   collect()

   

 

这篇关于4.RDD操作的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!