楼主: Lisrelchen
1153 0

[Case Study]Word Count using Python, Scala and Java [推广有奖]

  • 0关注
  • 62粉丝

VIP

已卖:4194份资源

院士

67%

还不是VIP/贵宾

-

TA的文库  其他...

Bayesian NewOccidental

Spatial Data Analysis

东西方数据挖掘

威望
0
论坛币
50288 个
通用积分
83.6306
学术水平
253 点
热心指数
300 点
信用等级
208 点
经验
41518 点
帖子
3256
精华
14
在线时间
766 小时
注册时间
2006-5-4
最后登录
2022-11-6

楼主
Lisrelchen 发表于 2015-11-16 00:06:43 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
Python
  1. text_file = spark.textFile("hdfs://...")
  2. counts = text_file.flatMap(lambda line: line.split(" ")) \
  3.              .map(lambda word: (word, 1)) \
  4.              .reduceByKey(lambda a, b: a + b)
  5. counts.saveAsTextFile("hdfs://...")
复制代码
Scala
  1. val textFile = spark.textFile("hdfs://...")
  2. val counts = textFile.flatMap(line => line.split(" "))
  3.                  .map(word => (word, 1))
  4.                  .reduceByKey(_ + _)
  5. counts.saveAsTextFile("hdfs://...")
复制代码
Java
  1. JavaRDD<String> textFile = spark.textFile("hdfs://...");
  2. JavaRDD<String> words = textFile.flatMap(new FlatMapFunction<String, String>() {
  3.   public Iterable<String> call(String s) { return Arrays.asList(s.split(" ")); }
  4. });
  5. JavaPairRDD<String, Integer> pairs = words.mapToPair(new PairFunction<String, String, Integer>() {
  6.   public Tuple2<String, Integer> call(String s) { return new Tuple2<String, Integer>(s, 1); }
  7. });
  8. JavaPairRDD<String, Integer> counts = pairs.reduceByKey(new Function2<Integer, Integer, Integer>() {
  9.   public Integer call(Integer a, Integer b) { return a + b; }
  10. });
  11. counts.saveAsTextFile("hdfs://...");
复制代码


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Case study python SCALA Using Count Java Word

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-25 11:01