代码运行思路:
1、用Harzing下载谷歌学术论文的基本信息文件, CSV文件article_title (用Harzing可以快速从谷歌学术下载论文标题等信息,很方便,且免费)(为方便处理,请将CSV文件转化为XLSX文件)
2、Python利用 article_title 中的论文名称在谷歌学术上下载论文对应的 BIB文件,得到 BIB_article文件
3、Python读取BIB_article 的 BIB文件,将BIB数据转化为excel数据, 得到excel_article文件
4、利用Python,将excel和中科院或者JCR数据进行匹配,得到论文分区信息文件: category_article
5、利用article_title文件,在谷歌学术上下载论文的摘要信息,得到 abstract_title (因为Harzing上面的摘要信息缺失很多,单独在谷歌学术上搜索摘要信息,会更全)
6、利用Python将 category_article 文件 和 abstract_title 文件 进行匹配,得到论文的最终数据,包括论文标题,年份,引用量,期刊名,出版商,摘要,作者,期刊分区等信息。
Python代码及其文件:
爬取谷歌学术论文,并给论文添加中科院或者JCR期刊分区的Python代码
(76 Bytes, 需要: RMB 49 元)



雷达卡




京公网安备 11010802022788号







