- 阅读权限
- 255
- 威望
- 0 级
- 论坛币
- 49957 个
- 通用积分
- 79.5487
- 学术水平
- 253 点
- 热心指数
- 300 点
- 信用等级
- 208 点
- 经验
- 41518 点
- 帖子
- 3256
- 精华
- 14
- 在线时间
- 766 小时
- 注册时间
- 2006-5-4
- 最后登录
- 2022-11-6
院士
还不是VIP/贵宾
TA的文库 其他... Bayesian NewOccidental
Spatial Data Analysis
东西方数据挖掘
- 威望
- 0 级
- 论坛币
- 49957 个
- 通用积分
- 79.5487
- 学术水平
- 253 点
- 热心指数
- 300 点
- 信用等级
- 208 点
- 经验
- 41518 点
- 帖子
- 3256
- 精华
- 14
- 在线时间
- 766 小时
- 注册时间
- 2006-5-4
- 最后登录
- 2022-11-6
|
经管之家送您一份
应届毕业生专属福利!
求职就业群
感谢您参与论坛问题回答
经管之家送您两个论坛币!
+2 论坛币
- text_file = spark.textFile("hdfs://...")
- errors = text_file.filter(lambda line: "ERROR" in line)
- # Count all the errors
- errors.count()
- # Count errors mentioning MySQL
- errors.filter(lambda line: "MySQL" in line).count()
- # Fetch the MySQL errors as an array of strings
- errors.filter(lambda line: "MySQL" in line).collect()
复制代码- Val textFile = spark.textFile("hdfs://...")
- val errors = textFile.filter(line => line.contains("ERROR"))
- // Count all the errors
- errors.count()
- // Count errors mentioning MySQL
- errors.filter(line => line.contains("MySQL")).count()
- // Fetch the MySQL errors as an array of strings
- errors.filter(line => line.contains("MySQL")).collect()
复制代码- JavaRDD<String> textFile = spark.textFile("hdfs://...");
- JavaRDD<String> errors = textFile.filter(new Function<String, Boolean>() {
- public Boolean call(String s) { return s.contains("ERROR"); }
- });
- // Count all the errors
- errors.count();
- // Count errors mentioning MySQL
- errors.filter(new Function<String, Boolean>() {
- public Boolean call(String s) { return s.contains("MySQL"); }
- }).count();
- // Fetch the MySQL errors as an array of strings
- errors.filter(new Function<String, Boolean>() {
- public Boolean call(String s) { return s.contains("MySQL"); }
- }).collect();
复制代码
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
|
|
|