Python基于爬虫实现全网搜索并下载音乐--688IT编程网

Python基于爬⾍实现全⽹搜索并下载⾳乐

现在写⼀篇博客总是喜欢先谈需求或者本内容的应⽤场景，是的，如果写出来的东西没有任何应⽤价值，确实也没有实际意义。今天的最早的需求是来⾃于如何免费[⽩嫖]下载全⽹优质⾳乐，我去b站上⾯搜索到了⼀个⼤⽜做过的⼀个歌曲搜素神器，界⾯是这样的：

确实很好⽤的，⽽且涵盖了互联⽹上⾯⼤多数主流的⾳乐⽹站，涉及到的版本也很多，可谓⼤⽽全，但是⼀个技术⼈的追求远远不会如此，于是我就想去了解其中背后的原理，因为做过⽹络爬⾍的⼈都知道，爬⾍只能爬取某⼀页或者某些页的⽹站资源，所以我很好奇它背后是怎么实现的？

笔者⼀直以来都是做的基于Python3.7版本的⽹络爬⾍，所以本⽂也是基于此来学习记录的。⾸先爬取的⽹站不是对应的⾳乐⽹站，⽽是⼀个，那⾥汇聚了⼤多数⾳频⾳乐的解析功能，界⾯如下：

所以⾃制⼀个搜索引擎的思想也很直观了，那就是利⽤第三⽅的接⼝，直接对该服务器发起请求即可，然后将获取的数据进⾏解析保存。这⾥以最近⽐较⽕的歌曲“⽩⽉光与朱砂痣”下载为例：

解析的结果如上，获取的数据格式是json类型，并且除了要有歌名以外，还要有⾳乐平台。

源代码实现如下：

import requests

import jsonpath

import os

"""

1.url

2.模拟浏览器请求0 100的随机数

3.解析⽹页源代码

4.保存数据python教材下载

"""

def song_download(url,title,author):

# 创建⽂件夹

os.makedirs("music",exist_ok=True)

path = 'music\{}.mp3'.format(title)

print('歌曲:{0}-{1}，正在下载...'.format(title,author))

# 下载（这种读写⽂件的下载⽅式适合少量⽂件的下载）

content = (url).content

with open(file = title + author + '.mp3',mode='wb') as f:

f.write(content)

print('下载完毕,{0}-{1}，请试听'.format(title,author))

def get_music_name():

"""

搜索歌曲名称

:return:

"""

name = input("请输⼊歌曲名称:")

print("1.⽹易云:netease\n2.QQ:qq\n3.酷狗:kugou\n4.酷我:kuwo\n5.百度:baidu\n6.喜马拉雅:ximalaya")

platfrom = input("输⼊⾳乐平台类型:")

print("-------------------------------------------------------")

url = 'music.liuzhijin/'

headers = {

"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36",

# 判断请求是异步还是同步

"x-requested-with":"XMLHttpRequest",

}

param = {

"input":name,

"filter":"name",

"type":platfrom,

"page": 1,

}

为什么打不开svg文件res = requests.post(url=url,data=param,headers=headers)

json_text = res.json()

title = jsonpath.jsonpath(json_text,'$..title')

author = jsonpath.jsonpath(json_text,'$..author')

webrtc语音通话

url = jsonpath.jsonpath(json_text, '$..url')

if title:

songs = list(zip(title,author,url))

for s in songs:

print(s[0],s[1],s[2])

print("-------------------------------------------------------")

index = int(input("请输⼊您想下载的歌曲版本:"))

song_download(url[index],title[index],author[index])

else:

print("对不起，暂⽆搜索结果!")

if __name__ == "__main__":

get_music_name()

演⽰⼀下运⾏效果：

然后⽂件下就会出现对应的歌曲.mp3⽂件

并且每次的歌曲检索都是在PyCharm专业版的控制台中进⾏的，这样的⽤户体验就⾮常糟糕，所以针对以上两个问题，我对源代码进⾏了改进。

# 导⼊模块

from tkinter import *

import requests

import jsonpath

import os

quest import urlretrieve

# 2.功能实现

"""

1.url

htmlcaption属性2.模拟浏览器请求

3.解析⽹页源代码

4.保存数据

"""

def song_download(url,title,author):

# 创建⽂件夹

os.makedirs("music",exist_ok=True)

path = 'music\{}.mp3'.format(title)

text.insert(END,'歌曲:{0}-{1}，正在下载...'.format(title,author))

# ⽂本框滑动

text.see(END)

# 更新

text.update()

# 下载

urlretrieve(url,path)

text.insert(END,'下载完毕,{0}-{1}，请试听'.format(title,author))

# ⽂本框滑动

insert order游戏text.see(END)

# 更新

text.update()

def get_music_name():

"""

搜索歌曲名称

:return:

"""

name = ()

platfrom = ()

# name = '⽩⽉光与朱砂痣'

url = 'music.liuzhijin/'

headers = {

"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36",

# 判断请求是异步还是同步

"x-requested-with":"XMLHttpRequest",

}

param = {

"input":name,

"filter":"name",

"type":platfrom,

"page": 1,

}

res = requests.post(url=url,data=param,headers=headers)

json_text = res.json()

title = jsonpath.jsonpath(json_text,'$..title')

author = jsonpath.jsonpath(json_text,'$..author')

url = jsonpath.jsonpath(json_text, '$..url')

print(title,author,url)

song_download(url[0],title[0],author[0])

# 1.⽤户界⾯

# 创建画板

root = Tk()

# 设置窗⼝标题

root.title('全⽹⾳乐下载器')

# 设置窗⼝⼤⼩以及出现的位置

# 标签组件

label = Label(root,text="请输⼊下载的歌曲:",font=('楷体',20))

# 定位与布局

# 输⼊框组件

entry = Entry(root,font=('宋体',20))

# 单选按钮

var = StringVar()

r1 = Radiobutton(root,text='⽹易云',variable=var,value='netease')

r2 = Radiobutton(root,text='QQ',variable=var,value='qq')

# 列表框

text = Listbox(root,font=('楷体',16),width=50,height=15)

# 下载按钮

button1 = Button(root,text='开始下载',font=('楷体',15),command=get_music_name)

button2 = Button(root,text='退出程序',font=('楷体',15),command=root.quit)

# 显⽰界⾯

root.mainloop()

我们再来看看效果吧

这样加上了UI界⾯和部分代码优化之后，就可以通过.py代码打包成.exe⽂件发布给⽤户使⽤了。

以上就是Python基于爬⾍实现全⽹搜索并下载⾳乐的详细内容，更多关于python 爬⾍下载⾳乐的资料请关注其它相关⽂章！

688IT编程网

Python基于爬虫实现全网搜索并下载音乐

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

Python基于爬虫实现全网搜索并下载音乐

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式