楼主: Lisrelchen
1122 0

[Case Study]WordCount using Scala [推广有奖]

  • 0关注
  • 62粉丝

VIP

已卖:4194份资源

院士

67%

还不是VIP/贵宾

-

TA的文库  其他...

Bayesian NewOccidental

Spatial Data Analysis

东西方数据挖掘

威望
0
论坛币
50288 个
通用积分
83.6306
学术水平
253 点
热心指数
300 点
信用等级
208 点
经验
41518 点
帖子
3256
精华
14
在线时间
766 小时
注册时间
2006-5-4
最后登录
2022-11-6

楼主
Lisrelchen 发表于 2015-11-15 23:54:51 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
  1. 为了在IDEA中编写scala,今天安装配置学习了IDEA集成开发环境。IDEA确实很优秀,学会之后,用起来很顺手。关于如何搭建scala和IDEA开发环境,请看文末的参考资料。
  2. 用Scala和Java实现WordCount,其中Java实现的JavaWordCount是spark自带的例子($SPARK_HOME/examples/src/main/java/org/apache/spark/examples/JavaWordCount.java)
  3. 1.环境
  4. OS:Red Hat Enterprise Linux Server release 6.4 (Santiago)
  5. Hadoop:Hadoop 2.4.1
  6. JDK:1.7.0_60
  7. Spark:1.1.0
  8. Scala:2.11.2
  9. 集成开发环境:IntelliJ IDEA 13.1.3
  10. 注意:需要在客户端windows环境下安装IDEA、Scala、JDK,并且为IDEA下载scala插件。

  11. 2.Scala实现单词计数

  12. 1 package com.hq
  13. 2
  14. 3 /**
  15. 4 * User: hadoop
  16. 5 *
  17. Date: 2014/10/10 0010
  18. 6 *
  19. Time: 18:59
  20. 7  */
  21. 8 import org.apache.spark.SparkConf
  22. 9 import org.apache.spark.SparkContext
  23. 10 import org.apache.spark.SparkContext._
  24. 11
  25. 12 /**
  26. 13 * 统计字符出现次数
  27. 14  */
  28. 15 object WordCount {
  29. 16   def main(args: Array[String]) {
  30. 17     if (args.length < 1) {
  31. 18       System.err.println("Usage: <file>")
  32. 19 System.exit(1)
  33. 20     }
  34. 21
  35. 22 val conf = new SparkConf()
  36. 23 val sc = new SparkContext(conf)
  37. 24 val line = sc.textFile(args(0))
  38. 25
  39. 26 line.flatMap(_.split(" ")).map((_, 1)).reduceByKey(_+_).collect().foreach(println)
  40. 27
  41. 28 sc.stop()
  42. 29   }
  43. 30 }
复制代码


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Case study Count SCALA study Using examples windows 参考资料 release 客户端

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-6 09:42