Python爬虫程序源代码:采集酷狗音乐网站榜单所有歌曲及反反爬https://www.kugou.com/实现目标:python采集酷狗音乐网站音乐
1. 采集榜单所有歌曲2. 实现搜索下载的功能 (有JS逆向) 有反爬
包含:(1) 程序源代码(2) 完整的视频教程,全过程指导 """Python采集酷狗音乐网站音乐 https://www.kugou.com/ [环境使用]: Python 3.10 Pycharm [模块使用]: import hashlib import requests --> pip install requests import time import re import json案例分为两部分: 1. 单首歌曲采集 2. 搜索下载 / 采集所有排行榜上面歌曲 一. 数据来源分析: 1. 明确需求: 明确采集的网址以及数据内容 - 网址:https://www.kugou.com/mixsong/91876lae.html - 数据: 歌曲内容 (链接) 2. 抓包分析: 浏览器上面开发者工具 - 打开开发者工具: F12/ 右键点击检查选择 network (网络) - 刷新网页 - 找音频链接地址: 点击 media (媒体) 歌曲播放链接:https://webfs.hw.kugou.com/20231 ... f1b59a793dfd27e.mp3 - 通过关键字搜索找对应数据包:继续分析, 歌曲链接如何生成的 (存在数据包) 歌曲数据包:https://wwwapi.kugou.com/play/so ... a157255860640f0ce77 二. 代码实现步骤: 1. 发送请求 -> 模拟浏览器对于url地址发送请求 2. 获取数据 -> 获取服务器返回响应数据 3. 解析数据 -> 提取我们需要数据内容 <歌曲链接 / 歌曲名字> 4. 保存数据 -> 获取歌曲内容, 保存本地文件夹 1. 采集榜单所有歌曲2. 实现搜索下载的功能 (有JS逆向) 有反爬 - 先要了解下载不同的歌曲, 需要改变是什么? clienttime: 时间戳(请求当前网页的时间节点) time.time() 可以获取 encode_album_audio_id: 音频ID signature: 签名认证(当它不变, 给她是固定的) signature: 加密参数基本都是js代码生成的 <找到生成位置> 看这个是需要传入什么参数, 然后通过什么加密方式进行加密.。。。。。# 模拟浏览器: 请求头 (字典)headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0Safari/537.36'}while True: # 搜索接口 link ='https://complexsearch.kugou.com/v2/search/song' date = int(time.time() * 1000) key_word = input('请输入你关键字搜索歌曲: (输入0退出)') if key_word == '0': break sign = search_hash(date, key_word) # 请求参数 link_data = { 'callback': 'callback123', 'srcappid': '2919', 'clientver': '1000', 'clienttime': date, 'mid':'e4831702920bb9b873b094956affda0e', 'uuid':'e4831702920bb9b873b094956affda0e', 'dfid': '2mRyxw4RLOqY1EsGk31nnwx5', 'keyword': key_word, 'page': '1', 'pagesize': '30', 'bitrate': '0', 'isfuzzy': '0', 'inputtype': '0', 'platform': 'WebFilter', 'userid': '458167322', 'iscorrection': '1', 'privilege_filter': '0', 'filter': '10', 'token': 'token', 'appid': '1014', 'signature': sign, } # 发送请求……
Python爬虫程序源代码:采集酷狗音乐网站榜单所有歌曲及反反爬的网盘链接.docx
(52.94 KB, 需要: RMB 11 元)


雷达卡



京公网安备 11010802022788号







