楼主: pennyr617
898 4

[有偿编程] R数据文本挖掘相关问题 [推广有奖]

  • 0关注
  • 0粉丝

本科生

98%

还不是VIP/贵宾

-

威望
0
论坛币
841 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
837 点
帖子
51
精华
0
在线时间
143 小时
注册时间
2012-3-31
最后登录
2023-12-4

楼主
pennyr617 发表于 2018-12-25 10:31:09 |AI写论文
20论坛币
现有如下格式文本,需要取出每个序号所对应的机台号(即数字+#的格式字符)和相对应的时间,怎样在R里解决,具体数据详见附件excel表,时间紧急,拜托各位大神帮忙,谢谢~ 文本挖掘掘样本.xlsx (21.97 KB)


序号

其他情况

1

今日轮保1#、12#、17#机组。
24#换烟生产爱尚1小时。
27#换烟生产天香细支1.5小时。
2#更换卷胶泵20分钟。
15#辅联链板断1小时。
5#修包挤商标纸30分钟。
10#技术组整班修跑条。
7#技术组整班修小包透明转塔机构。

2

12#试胶1小时,修yf17电器30分。

3

今日轮保2#、3#、13#机组。
27#换450L齿形带30分钟。
6#修包装机电器1.5小时。

4

6#接班修包装机铝纸电器2小时。
4#修电器30分。
13#白班修卷烟机水松纸翘边7小时。
12#修卷烟机水松纸压辊3小时。
4#修电器30分。



关键词:其他情况 包装机 卷烟机 水松纸 体数据

沙发
hongqp 发表于 2018-12-25 10:50:54
可以使用stringr包中的str_extract_all函数

藤椅
pennyr617 发表于 2018-12-25 13:29:31
那具体怎样写提取处“数字+#"格式机器的表达式呢?还有就是提取出所对应的时间数据?

板凳
fyc7346165 发表于 2018-12-26 15:09:52
  1. library(stringr)
  2. str_extract_all(textdata, "[0-9]+#")
复制代码

报纸
pennyr617 发表于 2018-12-27 14:02:00
如果我想把中间的文字提取出来并进行事项总结,是否要用文本挖掘的数据包呢?R哪些包有这个功能?应用起来复杂不?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-7 14:28