南开大学2021年2月《网络爬虫与信息提取》作业考核试题及答案(参考)
1. 爬虫中间件的作用对象是请求request和返回response。(  )
爬虫中间件的作用对象是请求request和返回response。(  )
A.正确
B.错误
参考答案:B
2. 常用的会话跟踪技术是(  )
A.session
D.localstorage
参考答案:AB
3. MongoDB支持对查询到的结果进行排序。排序的方法为sort(  )。它的格式为:handler.find(  ).sort(&39;列名&39;, 1或-1或0)。(  )
MongoDB支持对查询到的结果进行排序。排序的方法为sort(  )。它的格式为:handler.find(  ).sort('列名', 1或-1或0)。(  )
A.正确
B.错误
参考答案:B
4. Redis中往集合中读数据,使用关键字(  )
A.pop
B.spop
C.lpop
D.range
参考答案:B
5. BS4可以用来从(  )中提取数据。
BS4可以用来从(  )中提取数据。
A.HTML
B.XML
D.JSON
参考答案:AB
6. RoboMongo是MongoDB的管理软件。(  )
T.对
F.错
参考答案:T
7. 使用python定制mitmproxy,下面的语句请求的是(  )。
{req.headers["User-Agent"]}
A.headers
B.文本内容
C.目标网站
spider软件D.user-agent
参考答案:D
8. 在Linux的终端使用apt-get命令安装一系列依赖库时,其中如果存在有已经安装的库,会覆盖掉之前的库重新安装。(  )
在Linux的终端使用apt-get命令安装一系列依赖库时,其中如果存在有已经安装的库,会覆盖掉之前的库重新安装。(  )
A.正确
B.错误
参考答案:B
9. HTTP状态码302表示资源永久重定向。(  )
T.对
F.错
参考答案:F
10. Python中函数返回值的个数可以是多个。(  )
A.正确
参考答案:A
11. 下列关于mitmproxy的安装说法错误的是(  )
下列关于mitmproxy的安装说法错误的是(  )
A.对于Mac OS系统,使用Homebrew安装mitmproxy,命令为:brew install mitmproxy
B.在Ubuntu中,要安装mitmproxy,首先需要保证系统的Python为Python3.5或者更高版本
C.在windows系统中无法使用linux的命令,只能通过下载安装包来安装
D.UBUNTU中执行命令 sudo pip3 install mitmproxy 进行安装
参考答案:C
12. 在Windows中下若要运行Redis可以运行redis-
server/usr/local/f。(  )
A.正确
B.错误
参考答案:B
13. 通用搜索引擎的目标是尽可能大的网络覆盖率,搜索引擎服务器资源与网络数据资源互相匹配。(  )
A.正确
B.错误
参考答案:B
14. 在Linux中哪个命令是添加权限的(  )
A.chmod
B.sudo
C.cp
D.mkdir
参考答案:A
15. 为了在安卓手机上安装证书,需要先发送证书到手机里面。在Charles中选择“Help”-“SSL Proxying”-“Save Charles Root Certificate”命令,可以将Charles的证书保存到计算机桌面。(  )
T.对
F.错
参考答案:T
16. process_spider_output(response, result, output)是在下载器中间件处理完成后,马上要进入某个回调函数parse_xxx(  )前调用。(  )
process_spider_output(response, result, output)是在下载器中间件处理完成后,马上要进入某个回调函数parse_xxx(  )前调用。(  )
A.正确
B.错误
参考答案:B
17. 设置了这个中间件以后,仍然需要输入账号密码可以成功得到登录以后才能看到的HTML。(  )
A.正确
B.错误
参考答案:B
18. process_spider_input(response,spider)是在爬虫运行yield item或者yield scrapy.Request(  )的时候调用。(  )
A.正确
B.错误
参考答案:B
19. 一般来说在页面都通过GET将用户登录信息传递到服务器端。(  )
A.正确
B.错误
参考答案:B
20. 需要登录的网站一般通过GET请求就可以实现登录。(  )
A.正确
B.错误
参考答案:B
21. requests中post请求方法的使用为requests.post(‘网址’, data=data)中的data为(  )。
A.列表
B.元组
C.字典
D.集合
参考答案:C
22. Python中Object={&39;obj_1&39;:&39;1&39;,&39;obj_2&39;:&39;2&39;},则(&39;boj_3&39;,&39;3&39;)是(  )
A.1
B.2
C.3
D.无输出
参考答案:C
23. 采用以下(  )技术可以实现异步加载
A.HTML
B.AJAX
C.CSS
D.HTTP
参考答案:B
24. PyMongo更新操作有(  )。
A.update
B.update_all
C.update_one
D.update_many

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。