python垃圾分类源代码_使⽤Python做垃圾分类的原理及实例
代码
0 引⾔
纸⼱再湿也是⼲垃圾?⽠⼦⽪再⼲也是湿垃圾??最近⼤家都被垃圾分类折磨的不⾏,傻傻的你是否拎得清? ⾃2019.07.01开始,上海已率先实施垃圾分类制度,违反规定的还会⾯临。
为了避免巨额损失,我决定来b站学习下垃圾分类的技巧。为什么要来b站,听说这可是当下年轻⼈最流⾏的学习途径之⼀。
打开b站,搜索了下垃圾分类,上来就被这个标题吓(吸)到(引)了:在上海丢⼈的正确姿势。
当然,这⾥的丢⼈⾮彼丢⼈,指的是丢垃圾的丢。
点开发现,原来是⼀段对⼝相声啊,还是两个萌妹⼦(AI)的对⼝相声,瞬间就来了兴趣,阐述的是关于如何进⾏垃圾分类的。
看完⼀遍⼜⼀遍,简直停不下来了,已经开启了洗脑模式,毕竟视频很好玩,视频中的弹幕更是好玩!
独乐乐不如众乐乐,且不如⽤Python把弹幕保存下来,做个词云图?就这么愉快地决定了!
1 环境
操作系统:Windows
Python版本:3.7.3
2 需求分析
我们先需要通过开发调试⼯具,查询这条视频的弹幕的 cid 数据。
python新手代码及作用拿到 cid 之后,再填⼊下⾯的链接中。
打开之后,就可以看到该视频的弹幕列表。
有了弹幕数据后,我们需要先将解析好,并保存在本地,⽅便进⼀步的加⼯处理,如制成词云图进⾏展⽰。
3 代码实现
在这⾥,我们获取⽹页的请求使⽤ requests 模块;解析⽹址借助 beautifulsoup4 模块;保存为CSV数据,这⾥借⽤ pandas 模块。因为都是第三⽅模块,如环境中没有可以使⽤ pip 进⾏安装。
pip install requests
pip install beautifulsoup4
pip install lxml
pip install pandas
模块安装好之后,进⾏导⼊
import requests
from bs4 import BeautifulSoup
import pandas as pd
请求、解析、保存弹幕数据
# 请求弹幕数据
url = 'comment.l'
html = (url).content
# 解析弹幕数据
html_data = str(html, 'utf-8')
bs4 = BeautifulSoup(html_data, 'lxml')
results = bs4.find_all('d')
comments = [ for comment in results]
comments_dict = {'comments': comments}
# 将弹幕数据保存在本地
br = pd.DataFrame(comments_dict)
<_csv('barrage.csv', encoding='utf-8')
接下来,我们就对保存好的弹幕数据进⾏深加⼯。
制作词云,我们需要⽤到 wordcloud 模块、matplotlib 模块、jieba 模块,同样都是第三⽅模块,直接⽤ pip 进⾏安装。pip install wordcloud
pip install matplotlib
pip install jieba
模块安装好之后,进⾏导⼊,因为我们读取⽂件⽤到了 panda 模块,所以⼀并导⼊即可
from wordcloud import WordCloud, ImageColorGenerator
import matplotlib.pyplot as plt
import pandas as pd
import jieba
我们可以⾃⾏选择⼀张图⽚,并基于此图⽚来⽣成⼀张定制的词云图。我们可以⾃定义⼀些词云样式,代码如下:
# 解析背景图⽚
mask_img = plt.imread('Bulb.jpg')
'''设置词云样式'''
wc = WordCloud(
# 设置字体
font_path='SIMYOU.TTF',
# 允许最⼤词汇量
max_words = 2000,
# 设置最⼤号字体⼤⼩
max_font_size = 80,
# 设置使⽤的背景图⽚
mask = mask_img,
# 设置输出的图⽚背景⾊
background_color=None, mode="RGBA",
# 设置有多少种随机⽣成状态,即有多少种配⾊⽅案
random_state=30)
接下来,我们要读取⽂本信息(弹幕数据),进⾏分词并连接起来:
# 读取⽂件内容
br = pd.read_csv('barrage.csv', header=None)
# 进⾏分词,并⽤空格连起来
text = ''
for line in br[1]:
text += ' '.join(jieba.cut(line, cut_all=False))
最后来看看我们效果图
有没有感受到⼤家对垃圾分类这个话题的热情,莫名喜感涌上⼼头。
4 后记
这两个AI萌妹⼦说的相声很不错,就不知道郭德纲看到这个作品会作何感想。回到垃圾分类的话题,⽬前《上海市⽣活垃圾管理条例》已正式施⾏,不在上海的朋友们也不要太开⼼,住建部表⽰,全国其它46个重点城市也即将体验到……
以上所述是⼩编给⼤家介绍的使⽤Python做垃圾分类的原理及实例代码,希望对⼤家有所帮助,如果⼤家有任何疑问请给我留⾔,⼩编会及时回复⼤家的。在此也⾮常感谢⼤家对脚本之家⽹站的⽀持!
如果你觉得本⽂对你有帮助,欢迎转载,烦请注明出处,谢谢!
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论