python爬虫系列(三)json格式提取——小黑盒为例--688IT编程网

python爬⾍系列（三）json格式提取——⼩⿊盒为例

这⼀章，我们以⼩⿊盒官⽹⽹页版改版前的⼀个JSON链接为例，详细讲解，如何提取json⽂件，并且保存到excel中（保存到数据库的⽅

式类似只是格式不太相同⽽已）。

⾸先，还是⽼样⼦，获取header和url

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36'}

url = 'api.xiaoheihe/bbs/web/link/list?limit=20&offset=0&topic_id=55058&heybox_id=17864741&sort_filter=reply&type_filter=all&os_type=web&version=9然后，我们寻url的链接规律，发现控制页⾯的参数是offset于是有了

for j in range(0, 141):

url = 'api.xiaoheihe/bbs/web/link/list?limit=20&offset={0}&topic_id=55058&heybox_id=17864741&sort_filter=reply&type_filter=all&os_type=web&ve 通过这种⽅式，我们可以⾃⾏控制页⾯的跳转，然后我们，根据json的规律，把⽂件保存到excel中：

dataes = []

analyse = ['标题', '点击量', '点赞量', '评论量', '内容']

dataes.append(analyse)

for i in range(0,18):

sentences.append(json_page['result']['links'][i]['title'])

sentences.append(json_page['result']['links'][i]['click'])python解析json文件

sentences.append(json_page['result']['links'][i]['up'])

sentences.append(json_page['result']['links'][i]['comment_num'])

sentences.append(json_page['result']['links'][i]['description'])

drupal数据库配置文件dataes.append(sentences)

print(sentences)

sentences = []

print('第{}页'.format(j))

python视频讲解workbook = xlsxwriter.Workbook('loldata2.xlsx')

worksheet = workbook.add_worksheet()

for j in range(0, 2450):

worksheet.write_row('A' + str(j + 1), dataes[j])

workbook.close()

接下来是完整的代码

#-*- coding: utf-8 -*-

import requests

import time

编程搜题app

import re

import json

import xlsxwriter

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36'}

h = 'api.xiaoheihe'

#对句⼦列表⽹页进⾏获取，得到⼀个list包含句⼦链接巨加偏旁组词

def get_selist():

dataes = []

analyse = ['标题', '点击量', '点赞量', '评论量', '内容']

dataes.append(analyse)

for j in range(0, 141):

url = 'api.xiaoheihe/bbs/web/link/list?limit=20&offset={0}&topic_id=55058&heybox_id=17864741&sort_filter=reply&type_filter=all&os_type=web&ve sentences = []

response = (url, headers=headers) #访问所有句⼦列表

json_page = json.)

print()

for i in range(0,18):

sentences.append(json_page['result']['links'][i]['title'])

sentences.append(json_page['result']['links'][i]['click'])

sentences.append(json_page['result']['links'][i]['up'])

sentences.append(json_page['result']['links'][i]['comment_num'])

sentences.append(json_page['result']['links'][i]['description'])

dataes.append(sentences)

print(sentences)

sentences = []

print('第{}页'.format(j))

workbook = xlsxwriter.Workbook('loldata2.xlsx')

worksheet = workbook.add_worksheet()

for j in range(0, 2450):

worksheet.write_row('A' + str(j + 1), dataes[j])

workbook.close()

if __name__ == '__main__':

get_selist()

interceptor和filter的区别

这样就把⼩⿊盒中的数据链接完整爬取出来，保存下来了

688IT编程网

python爬虫系列(三)json格式提取——小黑盒为例

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林算法的改进方法

基于随机森林算法的风险预警模型研究

Python中的随机森林算法详解

随机森林发展历史

如何使用随机森林进行时间序列数据模式识别(八)

随机森林回归模型原理

如何使用随机森林进行时间序列数据模式识别(六)

如何使用随机森林进行时间序列数据预测(四)

如何使用随机森林进行异常检测(六)

随机森林算法和grandientboosting算法 -回复

随机森林方法总结全面

随机森林算法原理和步骤

随机森林的原理

随机森林重要性

随机森林算法

机器学习中随机森林的原理

随机森林算法原理

使用计算机视觉技术进行动物识别的技巧

基于crf命名实体识别实验总结

transformer预测模型训练方法

最新文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

随机森林结合直接正交信号校正的模型传递方法

标签列表

688IT编程网

python爬虫系列(三)json格式提取——小黑盒为例

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林算法的改进方法

基于随机森林算法的风险预警模型研究

Python中的随机森林算法详解

随机森林发展历史

如何使用随机森林进行时间序列数据模式识别(八)

随机森林回归模型原理

如何使用随机森林进行时间序列数据模式识别(六)

如何使用随机森林进行时间序列数据预测(四)

如何使用随机森林进行异常检测(六)

随机森林算法和grandientboosting算法 -回复

随机森林方法总结全面

随机森林算法原理和步骤

随机森林的原理

随机森林 重要性

随机森林算法

机器学习中随机森林的原理

随机森林算法原理

使用计算机视觉技术进行动物识别的技巧

基于crf命名实体识别实验总结

transformer预测模型训练方法

最新文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

随机森林结合直接正交信号校正的模型传递方法

标签列表

随机森林重要性