Python基于爬⾍实现全⽹搜索并下载⾳乐
现在写⼀篇博客总是喜欢先谈需求或者本内容的应⽤场景,是的,如果写出来的东西没有任何应⽤价值,确实也没有实际意义。今天的最早的需求是来⾃于如何免费[⽩嫖]下载全⽹优质⾳乐,我去b站上⾯搜索到了⼀个⼤⽜做过的⼀个歌曲搜素神器,界⾯是这样的:
确实很好⽤的,⽽且涵盖了互联⽹上⾯⼤多数主流的⾳乐⽹站,涉及到的版本也很多,可谓⼤⽽全,但是⼀个技术⼈的追求远远不会如此,于是我就想去了解其中背后的原理,因为做过⽹络爬⾍的⼈都知道,爬⾍只能爬取某⼀页或者某些页的⽹站资源,所以我很好奇它背后是怎么实现的?
笔者⼀直以来都是做的基于Python3.7版本的⽹络爬⾍,所以本⽂也是基于此来学习记录的。⾸先爬取的⽹站不是对应的⾳乐⽹站,⽽是⼀个,那⾥汇聚了⼤多数⾳频⾳乐的解析功能,界⾯如下:
所以⾃制⼀个搜索引擎的思想也很直观了,那就是利⽤第三⽅的接⼝,直接对该服务器发起请求即可,然后将获取的数据进⾏解析保存。这⾥以最近⽐较⽕的歌曲“⽩⽉光与朱砂痣”下载为例:
解析的结果如上,获取的数据格式是json类型,并且除了要有歌名以外,还要有⾳乐平台。
源代码实现如下:
import requests
import jsonpath
import os
"""
1.url
2.模拟浏览器请求0 100的随机数
3.解析⽹页源代码
4.保存数据python教材下载
"""
def song_download(url,title,author):
# 创建⽂件夹
os.makedirs("music",exist_ok=True)
path = 'music\{}.mp3'.format(title)
print('歌曲:{0}-{1},正在下载...'.format(title,author))
# 下载(这种读写⽂件的下载⽅式适合少量⽂件的下载)
content = (url).content
with open(file = title + author + '.mp3',mode='wb') as f:
f.write(content)
print('下载完毕,{0}-{1},请试听'.format(title,author))
def get_music_name():
"""
搜索歌曲名称
:return:
"""
name = input("请输⼊歌曲名称:")
print("1.⽹易云:netease\n2.QQ:qq\n3.酷狗:kugou\n4.酷我:kuwo\n5.百度:baidu\n6.喜马拉雅:ximalaya")
platfrom = input("输⼊⾳乐平台类型:")
print("-------------------------------------------------------")
url = 'music.liuzhijin/'
headers = {
"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36",
# 判断请求是异步还是同步
"x-requested-with":"XMLHttpRequest",
}
param = {
"input":name,
"filter":"name",
"type":platfrom,
"page": 1,
}
为什么打不开svg文件res = requests.post(url=url,data=param,headers=headers)
json_text = res.json()
title = jsonpath.jsonpath(json_text,'$..title')
author = jsonpath.jsonpath(json_text,'$..author')
webrtc语音通话
url = jsonpath.jsonpath(json_text, '$..url')
if title:
songs = list(zip(title,author,url))
for s in songs:
print(s[0],s[1],s[2])
print("-------------------------------------------------------")
index = int(input("请输⼊您想下载的歌曲版本:"))
song_download(url[index],title[index],author[index])
else:
print("对不起,暂⽆搜索结果!")
if __name__ == "__main__":
get_music_name()
演⽰⼀下运⾏效果:
然后⽂件下就会出现对应的歌曲.mp3⽂件
并且每次的歌曲检索都是在PyCharm专业版的控制台中进⾏的,这样的⽤户体验就⾮常糟糕,所以针对以上两个问题,我对源代码进⾏了改进。
# 导⼊模块
from tkinter import *
import requests
import jsonpath
import os
quest import urlretrieve
# 2.功能实现
"""
1.url
htmlcaption属性2.模拟浏览器请求
3.解析⽹页源代码
4.保存数据
"""
def song_download(url,title,author):
# 创建⽂件夹
os.makedirs("music",exist_ok=True)
path = 'music\{}.mp3'.format(title)
text.insert(END,'歌曲:{0}-{1},正在下载...'.format(title,author))
# ⽂本框滑动
text.see(END)
# 更新
text.update()
# 下载
urlretrieve(url,path)
text.insert(END,'下载完毕,{0}-{1},请试听'.format(title,author))
# ⽂本框滑动
insert order游戏text.see(END)
# 更新
text.update()
def get_music_name():
"""
搜索歌曲名称
:return:
"""
name = ()
platfrom = ()
# name = '⽩⽉光与朱砂痣'
url = 'music.liuzhijin/'
headers = {
"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36",
# 判断请求是异步还是同步
"x-requested-with":"XMLHttpRequest",
}
param = {
"input":name,
"filter":"name",
"type":platfrom,
"page": 1,
}
res = requests.post(url=url,data=param,headers=headers)
json_text = res.json()
title = jsonpath.jsonpath(json_text,'$..title')
author = jsonpath.jsonpath(json_text,'$..author')
url = jsonpath.jsonpath(json_text, '$..url')
print(title,author,url)
song_download(url[0],title[0],author[0])
# 1.⽤户界⾯
# 创建画板
root = Tk()
# 设置窗⼝标题
root.title('全⽹⾳乐下载器')
# 设置窗⼝⼤⼩以及出现的位置
# 标签组件
label = Label(root,text="请输⼊下载的歌曲:",font=('楷体',20))
# 定位与布局
# 输⼊框组件
entry = Entry(root,font=('宋体',20))
# 单选按钮
var = StringVar()
r1 = Radiobutton(root,text='⽹易云',variable=var,value='netease')
r2 = Radiobutton(root,text='QQ',variable=var,value='qq')
# 列表框
text = Listbox(root,font=('楷体',16),width=50,height=15)
# 下载按钮
button1 = Button(root,text='开始下载',font=('楷体',15),command=get_music_name)
button2 = Button(root,text='退出程序',font=('楷体',15),command=root.quit)
# 显⽰界⾯
root.mainloop()
我们再来看看效果吧
这样加上了UI界⾯和部分代码优化之后,就可以通过.py代码打包成.exe⽂件发布给⽤户使⽤了。
以上就是Python基于爬⾍实现全⽹搜索并下载⾳乐的详细内容,更多关于python 爬⾍下载⾳乐的资料请关注其它相关⽂章!
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论