分布式爬⾍管理框架Gerapy安装及部署流程spider软件
Gerapy 是⼀款国⼈开发的爬⾍管理软件(有中⽂界⾯)
是⼀个管理爬⾍项⽬的可视化⼯具,把项⽬部署到管理的操作全部变为交互式,实现批量部署,更⽅便控制、管理、实时查看结果。
gerapy和scrapyd的关系就是,我们可以通过gerapy中配置scrapyd后,不使⽤命令,直接通过图形化界⾯开启爬⾍。
》》安装
pip install gerapy
》》配置环境变量
C:\Users\wangjialu\AppData\Local\Programs\Python\Python37\Scripts\
》》cmd 初始化⼯作⽬录
>gerapy init
》》进⼊该⽬录初始数据库,会⽣成⼀个SQLite数据库,数据库保存主机的配置信息和部署版本。
>cd gerapy
>gerapy migrate
》》启动服务 127.0.0.1:8000 访问界⾯
>gerapy runserver
》》部署项⽬
我们将Scrapy项⽬放在gerapy/project⽬录下。
添加Scrapy远程服务,我们的scrapy项⽬发布到Scrapyd上⾯。
或者
打开你的爬⾍项⽬根⽬录配置scrapy.cfg
[deploy:abckg]
url = localhost:6800/
project = Abckg
#url 把#去掉
输⼊命令:scrapyd-deploy <target> -p <projectname>(target:spider.cfg中[deploy:NAME])(projectname:spider.cfg中project = XXX)这样就部署成功了
如要转载⿇烦备注原⽂出处!!
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论