- 阅读权限
- 255
- 威望
- 0 级
- 论坛币
- 1948 个
- 通用积分
- 8.7693
- 学术水平
- 159 点
- 热心指数
- 165 点
- 信用等级
- 144 点
- 经验
- 6272 点
- 帖子
- 777
- 精华
- 0
- 在线时间
- 665 小时
- 注册时间
- 2010-10-24
- 最后登录
- 2024-4-21
副教授
还不是VIP/贵宾
- 威望
- 0 级
- 论坛币
- 1948 个
- 通用积分
- 8.7693
- 学术水平
- 159 点
- 热心指数
- 165 点
- 信用等级
- 144 点
- 经验
- 6272 点
- 帖子
- 777
- 精华
- 0
- 在线时间
- 665 小时
- 注册时间
- 2010-10-24
- 最后登录
- 2024-4-21
|
经管之家送您一份
应届毕业生专属福利!
求职就业群
感谢您参与论坛问题回答
经管之家送您两个论坛币!
+2 论坛币
- # -*- coding: utf-8 -*-
- import urllib, urllib2,bs4, re, string, Tkinter
- BASEURL='http://www.cninfo.com.cn'
- BASEURL_SEARCH='http://www.cninfo.com.cn/search/search.jsp'
- def gui_init():
- def do_work():
- print startdate_str.get()
- print enddate_str.get()
- print code_str.get()
-
- codes=code_str.get().split(',')
- for code in codes:
- np=getnotice(startdate_str.get(), enddate_str.get(),code )
- print np['title']
- for t in np['title']:
- text1.insert(Tkinter.INSERT, t+'\n')
- frame2.update()
- def get_list():
- try:
- f=open('d:/work/list.txt', 'r')
- a=f.readline()
- print a
- f.close()
- except:
- a=''
- return a
-
- top=Tkinter.Tk()
- frame1=Tkinter.Frame(top,bd=1, relief= Tkinter.GROOVE)
- frame2=Tkinter.Frame(top,bd=1, relief= Tkinter.GROOVE)
- label1=Tkinter.Label(frame1, text='startdate')
- startdate_str=Tkinter.StringVar(frame1,'2013-12-31')
- entry1=Tkinter.Entry(frame1,textvariable=startdate_str)
- label2=Tkinter.Label(frame1, text='enddate')
- enddate_str=Tkinter.StringVar(frame1,'2013-12-31')
- entry2=Tkinter.Entry(frame1,textvariable=enddate_str)
- label3=Tkinter.Label(frame1, text='Code')
- code_str=Tkinter.StringVar(frame1,get_list())
- entry3=Tkinter.Entry(frame1, textvariable=code_str)
- label4=Tkinter.Label(frame1, text='Output')
- text1 =Tkinter.Text(frame2)
- buttom1=Tkinter.Button(frame1,text='Fetch Notice From www.cninfo.com.cn', command = do_work )
- label1.pack(fill=Tkinter.BOTH)
- entry1.pack(fill=Tkinter.BOTH)
- label2.pack(fill=Tkinter.BOTH)
- entry2.pack(fill=Tkinter.BOTH)
- label3.pack(fill=Tkinter.BOTH)
- entry3.pack(fill=Tkinter.BOTH)
- label4.pack(fill=Tkinter.BOTH)
- buttom1.pack(fill=Tkinter.BOTH)
- text1.pack(fill=Tkinter.BOTH)
- frame1.pack(side=Tkinter.LEFT,fill=Tkinter.BOTH)
- frame2.pack(side=Tkinter.RIGHT,fill=Tkinter.BOTH)
- Tkinter.mainloop()
- def getnotice(startTime='2014-06-30', endTime='2014-06-30', stockCode=''):
- postdata = {'endTime': '2014-06-30',
- 'keyword': '',
- 'marketType': '',
- 'noticeType': '',
- 'orderby': 'date11',
- 'pageNo': 1,
- 'startTime': '2014-06-30',
- 'stockCode':''
- }
- postdata['endTime']=endTime
- postdata['startTime']=startTime
- postdata['stockCode']=stockCode
- curpg=1
- pgnum=999
- notice_parsed={'title':[], 'link':[]}
- while curpg<=pgnum:
- postdata['pageNo']=curpg
- req=urllib2.Request(BASEURL_SEARCH, urllib.urlencode(postdata))
- resp=urllib2.urlopen(req)
- raw_html=resp.readlines()
- bs_obj=bs4.BeautifulSoup('\n'.join(raw_html).decode('gbk'))
- try:
- pgnum=max(string.atoi(t.contents[0]) for t in bs_obj.find_all('a', style="cursor:pointer;"))
- except:
- pgnum=1
-
- _np=bs_obj.find_all('a', target='new')
- for _tmp in _np:
- notice_parsed['title'].append(_tmp.text)
- notice_parsed['link'].append(_tmp.attrs['href'])
- print _tmp.text
- curpg +=1
- return notice_parsed
-
- if __name__ =='__main__':
- gui_init()
复制代码
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
|
|
-
总评分: 经验 + 36
论坛币 + 12
学术水平 + 1
热心指数 + 1
信用等级 + 1
查看全部评分
|