python爬⾍结果为什么为null,求⼤神解答
贴上源代码,为什么爬⾍结果为null
通过定义函数的⽅式,抓取⾖瓣top250电影信息,使得总体结构更加清晰
import requests # 导⼊⽹页请求库
from bs4 import BeautifulSoup # 导⼊⽹页解析库
import json
⽤于发送请求,获得⽹页源代码以供解析
def start_requests(url, headers):
r = (url, headers)
t
接收⽹页源代码解析出需要的信息
keygenexe使用教程def parse(text):
web接口和api接口特斯拉召回原文soup = BeautifulSoup(text, ‘html.parser’)2000的并发量需要几台服务器
movie_list = soup.find_all(‘div’, class_=‘item’)
result_list = []overpower是什么意思
for movie in movie_list:
mydict = {}  # 创建⼀个列表存储所有结果
mydict['title'] = movie.find('span', class_='title').text
mydict['score'] = movie.find('span', class_='rating_num').text
mydict['quote'] = movie.find('span', class_='inq').text
star = movie.find('div', class_='star')
mydict['comment_num'] = star.find_all('span')[-1].text[:-3]  # 选择倒数第⼀个span, 从倒数第三个⽂本开始抓取
result_list.append(mydict)  # 每抓取⼀条都加到result_list中
return result_list
将数据写⼊json⽂件
def write_json(result):
s = json.dumps(result, indent=4, ensure_ascii=False) # 将result_list这个json格式的python对象转化为字符串# indent代表缩进字符个数,ensure_ascii=False确保能输出中⽂
with open(‘movie_2.json’, ‘w’, encoding=‘utf-8’) as f: # encoding='utf-8’确保输出时乱码
f.write(s)
主运⾏函数,调⽤其他函数
python解析json文件⼀般做法
if name == ‘main’:
main()

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。