请选择 进入手机版 | 继续访问电脑版
楼主: macc891207
1010 1

[问答] 新手求问 def中为什么定义的变量没有最终出现 [推广有奖]

  • 8关注
  • 42粉丝

cc

院士

54%

还不是VIP/贵宾

-

威望
0
论坛币
45927 个
通用积分
760.4880
学术水平
93 点
热心指数
98 点
信用等级
81 点
经验
14244 点
帖子
1915
精华
0
在线时间
2793 小时
注册时间
2010-8-27
最后登录
2024-3-14

macc891207 学生认证  发表于 2018-6-6 23:33:47 |显示全部楼层 |坛友微信交流群

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
def onepage(url):
   r = requests.get(url)
   r.encoding = "utf-8"
   html = r.text

   soup = BeautifulSoup(html, "html.parser")
   comments_sec = soup.find("div", "mod-bd")
   comments_list = comments_sec.find_all("p", "")
   lst = []   
   for i in range(len(comments_list)):
     lst.append(comments_list[i].text.strip())   
   return lst


def parsepage(movie_id, page_num):
    data = []
    for i in range(page_num):
          url = "https://movie.douban.com/subject/"+ str(movie_id) + "/comments?start=" + str(20 * i) + "&limit=20"
          data += onepage(url)
          print("parsing page %d" % (i+1))
          time.sleep(3)#
    return " ".join(data)

程序如上 为什么最后的data显示没有被定义呢

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:def beautiful Comments comment Subject

货币经济学交流群:971362140
你好,我执行了这段代码是可以返回数据的,你试试
  1. import requests
  2. from bs4 import BeautifulSoup
  3. import time
  4. def onepage(url):
  5.     r = requests.get(url)
  6.     r.encoding = "utf-8"
  7.     html = r.text

  8.     soup = BeautifulSoup(html, "html.parser")
  9.     comments_sec = soup.find("div", "mod-bd")
  10.     comments_list = comments_sec.find_all("p", "")
  11.     lst = []   
  12.     for i in range(len(comments_list)):
  13.         lst.append(comments_list[i].text.strip())   
  14.     return lst


  15. def parsepage(movie_id, page_num):
  16.     data = []
  17.     for i in range(page_num):
  18.         url = "https://movie.douban.com/subject/"+ str(movie_id) + "/comments?start=" + str(20 * i) + "&limit=20"
  19.         data += onepage(url)
  20.         print("parsing page %d" % (i+1))
  21.         time.sleep(3)#
  22.     return " ".join(data)

  23. parsepage('26416062', 2)
复制代码

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 00:30