楼主: macc891207
1200 1

[问答] 新手求问 def中为什么定义的变量没有最终出现 [推广有奖]

  • 8关注
  • 42粉丝

cc

已卖:5000份资源

院士

55%

还不是VIP/贵宾

-

威望
0
论坛币
47312 个
通用积分
770.9162
学术水平
94 点
热心指数
99 点
信用等级
82 点
经验
4480 点
帖子
1948
精华
0
在线时间
2806 小时
注册时间
2010-8-27
最后登录
2025-9-8

楼主
macc891207 学生认证  发表于 2018-6-6 23:33:47 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
def onepage(url):
   r = requests.get(url)
   r.encoding = "utf-8"
   html = r.text

   soup = BeautifulSoup(html, "html.parser")
   comments_sec = soup.find("div", "mod-bd")
   comments_list = comments_sec.find_all("p", "")
   lst = []   
   for i in range(len(comments_list)):
     lst.append(comments_list[i].text.strip())   
   return lst


def parsepage(movie_id, page_num):
    data = []
    for i in range(page_num):
          url = "https://movie.douban.com/subject/"+ str(movie_id) + "/comments?start=" + str(20 * i) + "&limit=20"
          data += onepage(url)
          print("parsing page %d" % (i+1))
          time.sleep(3)#
    return " ".join(data)

程序如上 为什么最后的data显示没有被定义呢

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:def beautiful Comments comment Subject

货币经济学交流群:971362140

沙发
杨Yuer参上 发表于 2018-6-23 17:13:31
你好,我执行了这段代码是可以返回数据的,你试试
  1. import requests
  2. from bs4 import BeautifulSoup
  3. import time
  4. def onepage(url):
  5.     r = requests.get(url)
  6.     r.encoding = "utf-8"
  7.     html = r.text

  8.     soup = BeautifulSoup(html, "html.parser")
  9.     comments_sec = soup.find("div", "mod-bd")
  10.     comments_list = comments_sec.find_all("p", "")
  11.     lst = []   
  12.     for i in range(len(comments_list)):
  13.         lst.append(comments_list[i].text.strip())   
  14.     return lst


  15. def parsepage(movie_id, page_num):
  16.     data = []
  17.     for i in range(page_num):
  18.         url = "https://movie.douban.com/subject/"+ str(movie_id) + "/comments?start=" + str(20 * i) + "&limit=20"
  19.         data += onepage(url)
  20.         print("parsing page %d" % (i+1))
  21.         time.sleep(3)#
  22.     return " ".join(data)

  23. parsepage('26416062', 2)
复制代码

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-9 19:53