1736 5

[学习分享] 数据清洗的一个问题 [推广有奖]

  • 0关注
  • 1粉丝

本科生

0%

还不是VIP/贵宾

-

威望
0
论坛币
259 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
499 点
帖子
19
精华
0
在线时间
109 小时
注册时间
2016-3-10
最后登录
2020-11-18

楼主
谁肯惠双鱼8 发表于 2018-11-18 14:32:08 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

问题描述: 数据集给出了CCTV-1的节目播放时间的数据,但是实际上,有的播放时间显示的电视节目名称是错误的,如何把错误的节目名称修正为真正的“该时段播放的电视节目名称”。
我自己的方法:把数据中CCTV-1所有时段的电视节目名称与播放时间都找出来,然后一一对应去修改。
缺点:比较繁琐,而且不准确(PS:因为找时间段的时候不知道怎么精确得出数据,都靠眼睛看图_捂脸)
附件:ch1 ch1.txt (3.42 MB)
目前正在自学R语言的数据处理,有的问题也许比较愚蠢,见谅见谅!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:节目名称 电视节目 问题描述 一一对应 数据处理

沙发
谁肯惠双鱼8 发表于 2018-11-18 14:44:41
不好意思,忘记设置悬赏了

藤椅
谁肯惠双鱼8 发表于 2018-11-18 14:45:18
谁肯惠双鱼8 发表于 2018-11-18 14:44
不好意思,忘记设置悬赏了
可以看另一个帖子

板凳
q827049056 发表于 2018-11-20 18:26:58
楼主你要修改的数据集是这个“ch1.txt”文件?如果这里面是有错误的,那么正确的时间应该去哪里找?

个人感觉用爬虫爬下正确的时间,再和这个进行对比就OK了。。。

报纸
谁肯惠双鱼8 发表于 2018-11-20 20:09:42
q827049056 发表于 2018-11-20 18:26
楼主你要修改的数据集是这个“ch1.txt”文件?如果这里面是有错误的,那么正确的时间应该去哪里找?

个人 ...
谢谢回复。这个想法,在实际中应该可以。但是数据就这么多的情况下,我们如何从这个数据中把正确的标签给整理好,然后再替换那些“错误的数据”。这是我想要做到的。

地板
yo82226 发表于 2019-2-15 09:00:42 来自手机
谁肯惠双鱼8 发表于 2018-11-18 14:32
问题描述: 数据集给出了CCTV-1的节目播放时间的数据,但是实际上,有的播放时间显示的电视节目名称是错误 ...
有机会一定要去看看,今年去了乌镇,很喜欢。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-17 01:04