楼主: Lisrelchen
860 0

[Case Study]Text Search using Python, Scala and Java [推广有奖]

  • 0关注
  • 62粉丝

VIP

院士

67%

还不是VIP/贵宾

-

TA的文库  其他...

Bayesian NewOccidental

Spatial Data Analysis

东西方数据挖掘

威望
0
论坛币
49957 个
通用积分
79.5487
学术水平
253 点
热心指数
300 点
信用等级
208 点
经验
41518 点
帖子
3256
精华
14
在线时间
766 小时
注册时间
2006-5-4
最后登录
2022-11-6

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
  1. text_file = spark.textFile("hdfs://...")
  2. errors = text_file.filter(lambda line: "ERROR" in line)
  3. # Count all the errors
  4. errors.count()
  5. # Count errors mentioning MySQL
  6. errors.filter(lambda line: "MySQL" in line).count()
  7. # Fetch the MySQL errors as an array of strings
  8. errors.filter(lambda line: "MySQL" in line).collect()
复制代码
  1. Val textFile = spark.textFile("hdfs://...")
  2. val errors = textFile.filter(line => line.contains("ERROR"))
  3. // Count all the errors
  4. errors.count()
  5. // Count errors mentioning MySQL
  6. errors.filter(line => line.contains("MySQL")).count()
  7. // Fetch the MySQL errors as an array of strings
  8. errors.filter(line => line.contains("MySQL")).collect()
复制代码
  1. JavaRDD<String> textFile = spark.textFile("hdfs://...");
  2. JavaRDD<String> errors = textFile.filter(new Function<String, Boolean>() {
  3.   public Boolean call(String s) { return s.contains("ERROR"); }
  4. });
  5. // Count all the errors
  6. errors.count();
  7. // Count errors mentioning MySQL
  8. errors.filter(new Function<String, Boolean>() {
  9.   public Boolean call(String s) { return s.contains("MySQL"); }
  10. }).count();
  11. // Fetch the MySQL errors as an array of strings
  12. errors.filter(new Function<String, Boolean>() {
  13.   public Boolean call(String s) { return s.contains("MySQL"); }
  14. }).collect();
复制代码


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Case study python search Using SCALA Java

本帖被以下文库推荐

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 23:57