原始文件是test.doc,这个文挡是400多个同样格式的文档组成的(我只保留了七个)。每个文档都有update date,generic name,latest news,Licensor, Latest Phase, Active Program, Indication, Action, Substance Origin, Class Description, 等等变量。把它转化成txt后,变量名和每个变量都占一行,变量和变量之间空格隔开。
我想把他们转换成excel文件,因为数据太多,数据里又有表格,所以我就先只取 Update Date,Licensor, Latest Phase,
Active Program, Class Description, Company, Patentee, Patent Data, History 这些数据。
但是像class description, company这种变量,它可能有多于一个的变量值,而且在不同行,我就不知道怎么读取了。
我读取像Licensor这种值的时候,只会用@‘Lincensor’这种语句,结果把文本里其他licensor的语句也读了,
实在是不知道怎么办了。
望高手解答。



雷达卡


京公网安备 11010802022788号







