python爬⽹站数据实例-python通过token登录,并爬取数据实
from bs4 import BeautifulSoup
import requests
class Zabbix(object):
def __init__(self, headers):
self.session = requests.Session()
self.headers = headers
def func(self):
headers={
'Host':'172.28.14.165',
'Upgrade-Insecure-Requests':'',
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)
Chrome/57.0.2987.133 Safari/537.36',
'cookie':'zbx_sessionid='+token
python网络爬虫书籍推荐
}
response=(url='172.28.14.165/zabbix/zabbix.php?
action=report.status&ddreset=1',headers=headers,allow_redirects=False)
sourse = , 'html.parser')
text=sourse.find('span', {'class': 'green'})
if not text :
text=sourse.find('span', {'class': 'red'})
tq=text.string
print(tq)
if __name__ == '__main__':
headers = {
'Host': '172.28.14.165',
'Origin': '172.28.14.165',
'Referer':'172.28.14.165/zabbix/index.php',
'Upgrade-Insecure-Requests':'',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.87 Safari/537.36',
}
status = Zabbix(headers=headers)
token=input("please input token:")
status.func()
python脚本⽂件传参并通过token登录后爬取数据实例
from bs4 import BeautifulSoup import requests import sys class Zabbix(object): def __init__(self, he ...
Python使⽤Scrapy框架爬取数据存⼊CSV⽂件(Python爬⾍实战4)
1. Scrapy框架 Scrapy是python下实现爬⾍功能的框架,能够将数据解析.数据处理.数据存储合为⼀体功能的爬⾍框架.
2. Scrapy安装 1.安装依赖包 yum install g ...
python模拟浏览器爬取数据
爬⾍新⼿⼤坑:爬取数据的时候⼀定要设置header伪装成浏览器 在爬取某财经⽹站数据时由于没有设置Header信息,直接被封掉了ip 后来设置了Accept.Connection.User-A ...
Python分页爬取数据的分析
前⾔ ⽂的⽂字及图⽚来源于⽹络,仅供学习.交流使⽤,不具有任何商业⽤途,版权归原作者所有,如有问题请及时以作处理. 作者: 向右奔跑 PS:如有需要Python学习资料的⼩伙伴可以加点击下⽅链 ...
通过scrapy,从模拟登录开始爬取知乎的问答数据
这篇⽂章将讲解如何爬取知乎上⾯的问答数据. ⾸先,我们需要知道,想要爬取知乎上⾯的数据,第⼀步肯定是登录,所以我们先介绍⼀下模拟登录: 先说⼀下我的思路: 1.⾸先我们需要控制登录的⼊⼝,重写star ...
Python爬⾍实战练习:爬取美团旅游景点评论数据
前⾔ 本⽂的⽂字及图⽚来源于⽹络,仅供学习.交流使⽤,不具有任何商业⽤途,如有问题请及时以作处理. 今年的国庆节还有半个⽉就要来了,相信很多的⼩伙伴还是⾮常期待这个⼩长假的.国庆节是⼀年中的⼩ ...
Python⽹络爬⾍与如何爬取段⼦的项⽬实例
⼀.⽹络爬⾍ Python爬⾍开发⼯程师,从⽹站某⼀个页⾯(通常是⾸页)开始,读取⽹页的内容,到在⽹页中的其它链接地址,然后通过这些链接地址寻下⼀个⽹页,这样⼀直循环下去,直到把这个⽹站所
有的⽹页 ...
Python爬⾍使⽤lxml模块爬取⾖瓣读书排⾏榜并分析
上次使⽤了BeautifulSoup库爬取电影排⾏榜,爬取相对来说有点⿇烦,爬取的速度也较慢.本次使⽤的lxml库,我个⼈是最喜欢的,爬取的语法很简单,爬取速度也快. 本次爬取的⾖瓣书籍排⾏榜的⾸页地 ...
随机推荐
Android Weekly Notes Issue #230
Android Weekly Notes Issue #230 November 6th, 2016 Android Weekly Issue #230. Android Weekly笔记, 本期内容 ...
如何清除PL/SQL中的缓存
每次查询前清空缓存10g以上:alter system flush buffer_cache;9i:ALTER SESSION SET EVENTS 'immediate trace name flu ...
vs 2010 中类⽂⽂件模板的修改
类模板 ⽂件的修改,以前也修改过,这次有个同事问我,搞了有⼀会才搞定,这⾥还是记录分享下. 如果想在每次创建⽂件时,⾃动⽣成⽂档注释(注意是⾃动⽣成⽂档注释⽽不是帮助⽂档),如下⾯的代码,需要设置VS ...
【转载】COM的多线程模型
原⽂:COM的多线程模型 COM的多线程模型是COM技术⾥头最难以理解的部分之⼀,很多书都有涉及但是都没有很好的讲清楚.很多新⼈都会在这⾥觉得很迷惑,google⼤神能搜到⼀篇vckbase上的⽂章, ...
如何备份MySql的数据库
如何备份MySql的数据库 应该说⼀般的数据库都有BackUp的需求, MySql备份数据库的⽅式很简单, 但是在⽹上说得云⾥雾⾥, 也应该是我对MySql数据库不熟悉. ? ⽬标(Target) : ...
[Angular 2] Passing data to components with @Input
@Input allows you to pass data into your controller and templates through html and defining custom p ...
Mybatis解决jdbc编程的问题
1.1.1? Mybatis解决jdbc编程的问题 1.? 数据库链接创建.释放频繁造成系统资源浪费从⽽影响系统性能,如果使⽤数据库链接池可解决此问题. 解决:在l中配置 ...
Debian、Ubuntu恢复误删除(或者说重装)的/var/lib/dpkg
在使⽤ubuntu的使⽤,有可能会碰到dpkg挂掉,⽹上的通⽤解决⽅法,如果不管⽤: 1, dpkg 被中断,您必须⼿⼯运⾏ sudo dpkg --configure -a解决此问题 2, sudo ...
Google Protobuf结合Netty实践
java学习笔记1--基础知识
1.java数据类型
2.类之间的⼏种关系

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。