为何⽤Python做爬⾍时抓取下来的页⾯跟源代码不⼀
样?
代码如下:
-*- coding:utf-8 -*-
我⽤上⾯的代码爬取⼀个百度知道的答案,把抓取到的信息打印出来为什么有的地⽅跟⽹页审查元素所显⽰的代码不⼀样?
⽹页原来的段落为:
这段话对应的源代码为:
爬虫可以干什么抓取⽹页信息后的对应的代码为:
我尝试了⼀个,在提取页⾯时,加载⼀个headers头部,但是结果还是不⾏,求各路⼤神指点,直接把解决办法附在评论区⾥,谢谢各路⼤神了。。。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论