楼主: wuyy2007
7547 6

【爬虫】金融信息全获取(行情数据,资讯事件,财经日历等) [推广有奖]

  • 0关注
  • 3粉丝

博士生

28%

还不是VIP/贵宾

-

威望
0
论坛币
4858 个
通用积分
5.4654
学术水平
10 点
热心指数
11 点
信用等级
8 点
经验
570 点
帖子
16
精华
0
在线时间
508 小时
注册时间
2015-5-16
最后登录
2024-4-24

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
主要内容
一、交易行情黄金价格(股票,债券,期货,全球大宗等行情同理均可制作接口)
二、资讯信息
主流门户网站信息
华尔街见闻网站的实时新闻事件序列数据
三、财经日历
重大经济数据公布、美联储官员讲话等
四、预期数据
微博指定话题
微博指定搜索
个人微博信息(公开)
五、天气、交通、电影、等等(后续公开)


几点说明
Python 3.5,模块包需要查看代码自行调试(微博数据的账户密码需要填写自己的账户密码)
主要是要看代码里面所体现的处理方法,方能做到举一反三
如果附近代码都搞清楚,网络数据的采集基本能满足70%的科研需求



例子

几点注意

1.需要找到新闻数据的API接口

2.华尔街见闻对时间的算法处理规律


项目过程

1.新闻数据的接口基本格式与时间处理

https://api.wallstreetcn.com/v2/livenews?limit=1000

A这里一直存在个问题没解决即无法获取特点时间段的新闻内容,只能从当前时间往前推limit个条目的内容

B这个js数据基本机构为:

aaa.png

qqq.png

C这个1477719633到底代表那个时刻呢?增1代表增加1秒,经过推算发现0其实对应的就是1971.1.1 08:00:00。Python里面换算就很简单。只要1971.1.1  08:00:00 + datetime.timedelta(seconds=int(数值))即可得到现在时间值


2.创建SQL数据库

A创建表instantnews (time, content)

Btime类型datetime,content类型为varchar



3.Python代码

#!usr/bin/env python

# -*- coding: utf-8 -*-

__author__ = ''


import json

import urllib.request

import datetime

import pymysql


#链接数据库test

conn=pymysql.connect(host=None,user='root',passwd='',db='mysql',charset='utf8')

cur=conn.cursor()

cur.execute('USE test')


#网站默认的最原始时间

starttime=datetime.datetime(1970,1,1,8,0,0)


#读取新闻内容接口

response =urllib.request.urlopen('https://api.wallstreetcn.com/v2/livenews?limit=1000')#可以继续研究两个时间段内的新闻接口代码

http=response.read()

hjson = json.loads(http.decode())



#获取想要的新闻内容和时间

for i in range(0,len(hjson['results'])):#len(hjson['results'])为results整个条目数

time=hjson['results']['createdAt']

content=hjson['results']['contentText']

#print(starttime+datetime.timedelta(seconds=int(time)))

#print(content)

#识别时间

time1=starttime+datetime.timedelta(seconds=int(time))#识别

tim1=datetime.datetime.strftime(time1,'%Y-%m-%d%H:%M:%S')#将时间换算成字符串

#print(datetime.datetime.strftime(time1,'%Y-%m-%d%H:%M:%S'))

cur.execute('INSERT INTO instantnews (time,content) VALUES (\"%s\",\"%s\")',(time1, content))#时间以字符类型存入instantnews

cur.connection.commit()

#关闭数据库

cur.close()


conn.close()


4.结果

微信截图_20161206095751.png


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:发布者 微博 信息 日历 信息 资讯

咨询信息数据.rar

161.21 KB

需要: RMB 2 元  [购买]

适时新闻事件

本附件包括:

  • 华尔街及时新闻的获取.docx

微博数据.rar

7.17 KB

需要: RMB 5 元  [购买]

微博各项内容

交易行情数据.rar

2.96 KB

需要: RMB 2 元  [购买]

黄金(股,债,商品等同理)

财经日历数据.rar

727 Bytes

需要: RMB 5 元  [购买]

金融数据公布事件

沙发
weipeng_1981 发表于 2018-2-14 10:50:53 |只看作者 |坛友微信交流群
和免费的tushare相比,优势在哪里

使用道具

藤椅
louxinyu 发表于 2018-5-8 09:41:16 |只看作者 |坛友微信交流群
tushare也是一个爬虫,自己写,比较灵活,不需要按照接口的格式,而且说不定哪天tushare也收费了,或者不提供服务了

使用道具

板凳
hululu80 发表于 2018-6-6 14:32:53 |只看作者 |坛友微信交流群
真是不能用。以为可以直接用那!

使用道具

报纸
Sandralan 发表于 2021-10-30 18:58:43 |只看作者 |坛友微信交流群
这个可以爬到国内大宗商品资讯吗

使用道具

地板
wuyy2007 在职认证  发表于 2021-11-13 19:37:21 |只看作者 |坛友微信交流群
hululu80 发表于 2018-6-6 14:32
真是不能用。以为可以直接用那!
只是提供一种思路而已

使用道具

7
wuyy2007 在职认证  发表于 2021-11-13 19:38:25 |只看作者 |坛友微信交流群
Sandralan 发表于 2021-10-30 18:58
这个可以爬到国内大宗商品资讯吗
你需要清楚你的数据源是否包含大宗资讯,然后再针对性去设计爬虫程序

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-24 14:49