从目前实际情况来看,以下几点需要注意:
1、不少网站设置访问频率,所以程序要考虑延迟间隔时间;
2、重要数据图形化,所以要考虑OCR方式的图片识别;
3、频繁访问且属异常的ip封锁,所以要考虑IP代理伪装。
实际项目,欢迎补充。
|
楼主: weitingkoala
|
28285
201
[交易平台及行情软件] Python爬虫入门教程 |
| ||||||||||||||
| ||
| ||
| ||
| ||
加好友,备注jr京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


