本文主要是介绍08 分布式计算MapReduce--词频统计,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
WordCount程序任务:
程序
|
WordCount
|
输入
|
一个包含大量单词的文本文件
|
输出
|
文件中每个单词及其出现次数(频数),
并按照单词字母顺序排序,
每个单词和其频数占一行,单词和频数之间有间隔
|
1.用你最熟悉的编程环境,编写非分布式的词频统计程序。
- 读文件
- 分词(text.split列表)
- 按单词统计(字典,key单词,value次数)
- 排序(list.sort列表)
- 输出
这篇关于08 分布式计算MapReduce--词频统计的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!