易语⾔爬取⽹页内容⽅法
写个辅助⼯具的时候需要提取⽹页⾥⾯的某些内容,我这⾥便把⽅法告诉⼤家,希望对⼤家有所帮助,记得投票给我哦!
1、在新建的windos窗⼝程序中画:
怎么编辑网页源代码两个编辑框、⼀个按钮。
再添加模块如图中三步!
我们来实现,在⼀个编辑框中输⼊⽹址后,点击按钮,然后取到指定内容到编辑框2中。
2、⽐如我们来取百度某贴吧⼀个帖⼦内的内容!如下图中的“跑遍数码城,XXXXX”。
我们在该页⾯上右键---->查看⽹页源码(或查看源⽂件)。
3、在打开的源⽂件内容中按CTRL+F组合键查“跑遍数码城”,我们只要⼀个开⽂中⼀部分就⾏了!到对应的⽂字后,我们到和⽹页中完全对应的那部分代码。
PS:可能会出现⼏个被到的内容,但是只要到你需要取的那段全部对应部分就⾏。
4、复制正⽂中的前⾯的部分代码,不要复制太多的内容,待会我们⽤正⽂前的内容到中间的内容。然后在易语⾔中新建⼀个⽂本常量,把复制到的内容粘贴到“常量值”⾥⾯去。
5、然后我们去复制正⽂后⾯的⼀⼩段代码,同样新建⼀个⽂本常量,然后粘贴到常量值⾥⾯去。
6、此时我们回到编程程序中,点击按钮,在⽣成的“_按钮1_被单击”⼦程序下⾯新建⼀个⽂本型变量“得到的内容”,然后输⼊以下代码:
得到的内容=⽹页_访问s (编辑框1.内容)编辑框2.内容=⽂本_取出中间⽂本 (得到的内容, #常量1, #常量2)
PS:第⼀⾏是把把编辑框中的⽹址打开后得到的⽹页源码赋值给“得到的内容”这个⽂本变量。
第⼆⾏则是对“得到的⽂本”进⾏取中间⽂本操作,⽂本_取出中间⽂本()是⼀个程序!它能取出中间内容的程序!
7、最后我们把程序调试运⾏⼀下,点击按钮“取内容”,是不是成功了呢?打开其他帖⼦取也是有效的,只要你取前后代码是正确的!
如果你是需要⽹页的源码,只要使⽤程序“ ⽹页_访问s()”,就然后把它赋值输出就OK了。当然!括号⾥⾯要有⽹页地址!
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论