python爬取酷狗⾳乐_python使⽤beautifulsoup4爬取酷狗⾳乐
代码实例
这篇⽂章主要介绍了python使⽤beautifulsoup4爬取酷狗⾳乐代码实例,⽂中通过⽰例代码介绍的⾮常详细,对⼤家的学习或者⼯作具有⼀定的参考学习价值,需要的朋友可以参考下
⼩编经常在⽹上听⼀些⾳乐但是有⼀些⽹站好多⾳乐都是付费下载的正好我会点爬⾍技术,空闲时间写了⼀份,截⽌4⽉底没有问题的,会下载到当前⽬录,只要按照bs4库就好,
安装⽅法:pip install beautifulsoup4
完整代码如下:双击就能直接运⾏
from bs4 import BeautifulSoup
import requests
import re
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)
Chrome/72.0.3626.109 Safari/537.36'
python新手代码userid}
url='songsearch.kugou/song_search_v2?&page=1&pagesize=30&userid=-
1&clientver=&platform=WebFilter&tag=em&filter=2&iscorrection=1&privilege_filter=0&_=1555124510574'
#想要爬取别的⽹页直接修改这个json数据地址就⾏
(url,headers=headers)
soup=,'lxml')
title_list=soup.select('.pc_temp_songlist ul li')
hash=re.findall(r',"FileHash":"(.*?)"',r.text)
hash1=re.findall(r',"FileName":"(.*?)"',r.text)
#直接⽤正则匹配隐藏的数据
print(hash)
print(hash1)
q=0
for url in hash:
url_a=f'wwwapi.kugou/yy/index.php?
r=play/getdata&callback=jQuery1910212680783679835_1555073815772&hash={url}&album_id=18784389'
#这个URL不⽤修改的
(url_a,headers=headers)
[40:-3]
b=re.findall('"play_url":"(.*)","authors":',a)[0]
b1=re.sub(r"\\",'',b)
f = (b1)
with open(hash1[q]+'.mp3','wb')as d:
d.t)
print(hash1[q])
q+=1
爬取酷狗的唯⼀难点就是hash值的获取了⼀个多⼩时才到,⽐⽹易云好点就是⾃⼰不⽤写⼀个哈希值,酷狗是⾃⼰就存在的能到,⽹易云是需要函数⽣成的。
以上就是本⽂的全部内容,希望对⼤家的学习有所帮助,也希望⼤家多多⽀持脚本之家。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论