南开大学22春“计算机科学与技术”《网络爬虫与信息提取》期末考试高频考点版(带答案)
一.综合考核(共50题)
1.
已经创建好的Scrapy爬虫*.py文件可以直接通过Python来运行。()
A.正确
B.错误
参考答案:B
2.
Python中若定义object=(1,2,3,4,5),则print(object[::3])输出()。
A.345
B.34
C.45
D.123
参考答案:C
3.
如果很多爬虫同时对一个网站全速爬取,那么其实就是对网站进行了()攻击。
A.XSS
B.DOS
C.DDOS
openstack虚拟网络D.跨域
参考答案:C
4.
Python中列表生成以后还可以往里面继续添加数据,也可以从里面删除数据。()
T.对
F.错
参考答案:T
5.
当需要把Python里面的数据发送给网页时,应先将其转换成()。
A.Json字符串
B.GET
C.POST
D.Request
参考答案:Atoday函数计算天数
6.
Python中列表可以用()方法在末尾添加元素。
A.add
B.append
C.plus
D.+
参考答案:B
7.
网络爬虫的用途有()。
A.收集数据
B.尽职调查
C.提高流量
D.攻击服务器
参考答案:ABC
8.prototype2游戏里的塞缪尔 比林斯利博士的任务怎么做
以下哪个命令是复制文件或者文件夹命令?()
A.curl
B.tar-zxvf
C.mkdir
D.cp
参考答案:D
9.
BS4可以用来从()中提取数据
A.HTML
B.XML
C.数据库
D.JSON
参考答案:AB
10.
下列关于在IOS上配置charles的说法正确的是()。
A.不同ios设备之间会有比较大的差别,所以配置的时候需要到对应的安装证书的入口
B.手机和电脑需要在同一个局域网下
C.HTTP代理可以使用“自动”选项
D.安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动
参考答案:BD
11.
MongoDB是一个关系数据库产品。()
A.正确
B.错误
参考答案:B
12.
使用了RedisSpider作为爬虫的父类以后,爬虫会直接监控()中的数据,并不读取start_urls中的数据。
A.Redis
B.RedisSpider
C.Spider
D.MongoDB
参考答案:A
13.
下面关于Charles使用说法错误的是()
A.在数据包非常多的情况下,使用Charles的过滤功能来对数据包进行过滤从而减少干扰
B.通过单击图中方框框住的各个选项卡,可以非常直观地观察到请求和返回的各种信息
C.如果浏览器是Chrome,在没有安装第三方代理插件的情况下,Chrome的HTTP流量都会经过Charles
D.Charles无法支持计算机上除了浏览器之外的其他软件
参考答案:D
14.
Python中哪种容器生成后可以修改内容?()
A.列表
B.元组
C.字典
D.集合
参考答案:ACD
15.
Redis的列表是一个单向队列。()
T.对
F.错
参考答案:F
16.
爬虫中间件的作用对象是请求request和返回response。()
A.正确python网络爬虫基础教程
B.错误
参考答案:B
17.
以下HTTP状态码表示服务器本身发生错误的是()
A.400
B.503
C.302
D.500
参考答案:BD
18.
“curl 爬虫服务器IP地址:6800/cancel.json-d project=工程名-d job=爬虫JOBID”该命令的作用是启动爬虫。()
A.正确
B.错误
参考答案:B
19.
Python中有哪些实现多线程方法()
A.multiprocess.dummy
B.threading.Thread
C.process
D.PyMongoDB
参考答案:AB
20.
Python中线程池map()方法第二个参数是()
A.列表
B.元组
C.字典
D.集合
参考答案:A
21.
自己能查看的数据,允许擅自拿给第三方查看。()
T.对html模板语法怎么用
F.错
参考答案:F
22.
查看网站请求一般在Chrome开发者模式下的()选项卡中查看
A.Console
B.Sources
C.Network
爬虫软件 app
D.Perance
参考答案:C
23.
Redis中的值可以支持()
A.列表
B.哈希

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。