在IT桔子网站(https://www.itjuzi.com/investevents)爬了融资信息,包括“时间”、“公司”、“轮次”、“融资额”、“投资方”。
其中投资方列里,会有几个投资公司一起投,但是直接把几家公司名字合并成一个了:
源代码是这样的:
这是爬虫代码:investor <- web%>%html_nodes("div.investorset")%>%html_text()
爬出来结果是这样:
问题是,可以将这些公司名字分开吗?
ps. 我有想过:1、有没有这样一个函数,常用风险投资公司的名字作为字段库,用该函数将这些公司进行智能分段
2、或者,是不是有办法在爬的时候直接将他们分开,用“,”或者用什么其他符号也可以,这样就方便将他们分段了
我的想法不知道行不行,有会的大神,请教我!!!请教我!!


雷达卡




京公网安备 11010802022788号







