IntelliJ IDEA开发Spark案例之WordCount（非Maven、离线版）

本文主要是介绍IntelliJ IDEA开发Spark案例之WordCount（非Maven、离线版），对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

教程目录

0x00 教程内容
0x01 新建Scala项目
- - - - 1. 新建Scala项目
      - 2. 项目配置
0x02 编写Scala代码
- - - - 1. 新建Scala类
      - 2. 编写WordCount代码
      - 3. 本地执行
0x03 打包到服务器执行
- - - - 1. 设置打包工程
      - 2. 打包操作
      - 3. 上传服务器并执行
0x04 统计结果展示
0xFF 总结

0x00 教程内容

新建Scala项目
编写Scala代码
打包到服务器执行

实验前提：
a. 安装好了windows本地的scala
b. 安装好了IDEA的scala插件
c. 安装好了JDK

0x01 新建Scala项目

1. 新建Scala项目

a. 新建一个Scala项目，先选择Java，然后在右边选择Scala，配置好解压之后的scala包，其他的默认
在这里插入图片描述
b. 如果有提示，可以随便选一个

2. 项目配置

a. 右击src，建一个包，比如：com.shaonaiyi
在这里插入图片描述
b. 然后编辑项目结构，加入我们的Scala SDK（找到我们win本地的Scala主目录即可）：

导入之后点击OK
c. 导入我们的Spark依赖jar包（选择Spark主目录下的jars目录，然后一直OK）：

0x02 编写Scala代码

1. 新建Scala类

a. 右击包名：com.shaonaiyi，创建Scala Class，然后选择Kind为Object：
在这里插入图片描述

2. 编写WordCount代码

a. 修改Wordcount类为：

package com.shaonaiyi

import org.apache.spark.SparkContext

object Wordcount {

  def main(args: Array[String]): Unit = {

    var sc = new SparkContext("local[2]","Wordcount")
    var file = sc.textFile("spark-wc.iml")
    var wordRDD = file.flatMap(_.split(" ")).map((_,1)).reduceByKey(_ + _).sortBy(_._2)
    wordRDD.foreach(println(_))
  }

}