- 阅读权限
- 255
- 威望
- 0 级
- 论坛币
- 50288 个
- 通用积分
- 83.6306
- 学术水平
- 253 点
- 热心指数
- 300 点
- 信用等级
- 208 点
- 经验
- 41518 点
- 帖子
- 3256
- 精华
- 14
- 在线时间
- 766 小时
- 注册时间
- 2006-5-4
- 最后登录
- 2022-11-6
已卖:4194份资源
院士
还不是VIP/贵宾
TA的文库 其他... Bayesian NewOccidental
Spatial Data Analysis
东西方数据挖掘
- 威望
- 0 级
- 论坛币
 - 50288 个
- 通用积分
- 83.6306
- 学术水平
- 253 点
- 热心指数
- 300 点
- 信用等级
- 208 点
- 经验
- 41518 点
- 帖子
- 3256
- 精华
- 14
- 在线时间
- 766 小时
- 注册时间
- 2006-5-4
- 最后登录
- 2022-11-6
|
经管之家送您一份
应届毕业生专属福利!
求职就业群
感谢您参与论坛问题回答
经管之家送您两个论坛币!
+2 论坛币
- 为了在IDEA中编写scala,今天安装配置学习了IDEA集成开发环境。IDEA确实很优秀,学会之后,用起来很顺手。关于如何搭建scala和IDEA开发环境,请看文末的参考资料。
- 用Scala和Java实现WordCount,其中Java实现的JavaWordCount是spark自带的例子($SPARK_HOME/examples/src/main/java/org/apache/spark/examples/JavaWordCount.java)
- 1.环境
- OS:Red Hat Enterprise Linux Server release 6.4 (Santiago)
- Hadoop:Hadoop 2.4.1
- JDK:1.7.0_60
- Spark:1.1.0
- Scala:2.11.2
- 集成开发环境:IntelliJ IDEA 13.1.3
- 注意:需要在客户端windows环境下安装IDEA、Scala、JDK,并且为IDEA下载scala插件。
- 2.Scala实现单词计数
- 1 package com.hq
- 2
- 3 /**
- 4 * User: hadoop
- 5 *
- Date: 2014/10/10 0010
- 6 *
- Time: 18:59
- 7 */
- 8 import org.apache.spark.SparkConf
- 9 import org.apache.spark.SparkContext
- 10 import org.apache.spark.SparkContext._
- 11
- 12 /**
- 13 * 统计字符出现次数
- 14 */
- 15 object WordCount {
- 16 def main(args: Array[String]) {
- 17 if (args.length < 1) {
- 18 System.err.println("Usage: <file>")
- 19 System.exit(1)
- 20 }
- 21
- 22 val conf = new SparkConf()
- 23 val sc = new SparkContext(conf)
- 24 val line = sc.textFile(args(0))
- 25
- 26 line.flatMap(_.split(" ")).map((_, 1)).reduceByKey(_+_).collect().foreach(println)
- 27
- 28 sc.stop()
- 29 }
- 30 }
复制代码
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
|
|
|