使⽤MitmProxy玩爬⾍的,这篇⽂章别错过了
玩爬⾍的⼩伙伴都知道,抓包⼯具除了MitmProxy外,还有Fiddler、Charles以及浏览器netwrok等
既然都有这么多抓包⼯具了,为什么还要会⽤MitmProxy呢??今天教⼤家使⽤ MitmProxy 抓包⼯具的原因,主要有以下⼏点:
1.不需要安装软件,直接在线(浏览器)进⾏抓包(包括⼿机端和PC端)
2.配合Python脚本抓包改包(下⾯会有案例)
3.抓包过程的所有数据包都可以⾃动保留到txt⾥⾯,⽅便过滤分析
4.使⽤相对简单,易上⼿。
1. 配置MitmProxy
MitmProxy可以说是客户端,也可以说是⼀共python库
⽅式⼀:客户端https: // /downloads/
在这个地址下可以下载对应的客户端安装即可
⽅式⼆:Python库pipinstall mitmproxy
通过这个pip命令可以下载好MitmProxy,下⾯将会以Python库的使⽤⽅式给⼤家讲解如何使⽤(推荐⽅式⼆)
2. 启动MitmProxy
MitmProxy启动有三个命令(三种模式)
1.mitmproxy,提供命令⾏界⾯
2.mitmdump,提供⼀个简单的终端输出(还可以配合Python抓包改包)
3.mitmweb,提供在线浏览器抓包界⾯
mitmdump启动 mitmdump-w d://
这样就启动mitmdump,接着在本地设置代理Ip是本机IP,端⼝8080
安装证书
访问下⾯这个链接
http: //mitm.it/
可以选择⾃⼰的设备(window,或者Android、Apple设备去)安装证书。
然后随便打开⼀个⽹页,⽐如百度
这⾥是因为证书问题,提⽰访问百度提⽰https证书不安全,那么下⾯开始解决这个问题,因此就引出了下⾯的这种启动⽅式
⽅式
浏览器代理式启动
哪⼀个浏览器都可以,下⾯以Chrome浏览器为例(其他浏览器操作⼀样)
先到chrome浏览器位置,我的chrome浏览器位置如下图
通过下⾯命令启动
matlab横纵坐标比例"C:\Users\Administrator\AppData\Local\Google\Chrome\"--proxy-server=127.0.0.1:8080 --ignore-certificate-errors
•--proxy-server 是设置代理和端⼝
•--ignore-certificate-errors 是忽略证书
然后会弹出来Chrome浏览器,接着我们搜索知乎
数字游戏大全高智商
在cmd中就可以看到数据包
这些⽂本数据可以在编程中进⾏相应的操作,⽐如可以放到python中进⾏过来监听处理。补码乘法计算器
3. 启动Mitmweb
horsthemke中文新开⼀个cmd(终端)窗⼝,输⼊下来命令启动mitmweb
mitmweb
bat批处理命令结束程序
现在页⾯中什么也没有,那下⾯我们在刷新⼀个知乎页⾯
重点:关闭mitmproxy终端!关闭mitmproxy终端!关闭mitmproxy终端!
如果不改变在mitmweb中获取不到数据,数据只在mitmproxy中,因此需要关闭mitmproxy这个命令终
爬虫软件 app
如果不改变在mitmweb中获取不到数据,数据只在mitmproxy中,因此需要关闭mitmproxy这个命令终端
刷新知乎页⾯之后如下:
在刚刚的⽹页版抓包页⾯就可以看到数据包了
并且还包括https类型,⽐如查看其中⼀个数据包,到数据是对应的,说明抓包成功。
4. 配合Python脚本
mitmproxy代理(抓包)⼯具最强⼤之处在于对python脚步的⽀持(可以在python代码中直接处理数据包)下⾯开始演⽰,先新建⼀个py⽂件(lyc.py)
frommitmproxy importctx

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。