楼主: xiaochong1a
1418 3

[问答] 关于python处理文本问题求助。 [推广有奖]

  • 3关注
  • 0粉丝

已卖:176份资源

讲师

96%

还不是VIP/贵宾

-

威望
0
论坛币
4957 个
通用积分
5.0701
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
12756 点
帖子
178
精华
0
在线时间
738 小时
注册时间
2016-12-2
最后登录
2025-7-28

楼主
xiaochong1a 学生认证  发表于 2017-6-11 16:49:04 |AI写论文
50论坛币
图片1.png

要处理的文本是这种形式的,现在要在文本中把每一个Z4提取出来,经过清洗和分词之后,作为一行写入新的文本中,下一个Z4经过同样的处理作为另一行写入新的文本中,以此类推。最终形成的文本是每一个经过分词处理后的Z4作为一行。

这是目前写的代码:

图片2.png

基本的逻辑是这样的:

对于文本中的每一行

如果开头两个字符是Z4

    打印行

    进行清洗

    写入新的文本

如果开头的两个字符为空

    打印行

    进行清洗

    写入新的文本

  如果开头的两个字符是CR

  加入换行

      结束

这段代码能够提取每一个Z4,并进行清洗。但是输出的结果最后都是一行,没有实现每一个Z4是一行,代码中qingxi += ‘\n’是实现换行的,但是从结果看也没有起作用,不知道该怎么解决这个问题。求大神解答


关键词:Python处理 python ING 不知道 python

沙发
xiaochong1a 学生认证  发表于 2017-6-11 16:54:55
这是要处理的文本

savedrecs (1)(1).txt
下载链接: https://bbs.pinggu.org/a-2269319.html

132.47 KB

要处理的文本

藤椅
shell800 发表于 2017-6-12 18:45:06 来自手机
实际上每次循环是把一行追加保存在new_result里面。
而换行符是保存在qingxi里面。在下次循环的时候qingxi被重现赋值了。
结果就是new_result里面有完整的内容,但是没有换行符。

逻辑不太对。

板凳
shell800 发表于 2017-6-12 18:55:49 来自手机
手机不方便,我觉得大概过程应该是这样
qingxi=findall(line)
result.append(qingxi)

if cr
result.append('\n')

循环完后完整内容在result里。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-2 08:28