项目一测试
1.下列不属于常见爬虫类型的是( )。
A:增量式网络爬虫
B:浅层网络爬虫
C:通用网络爬虫
D:聚焦网络爬虫
答案:B
2.下列不属于聚焦网络爬虫的常用策略的是( )。
A:基于内容评价的爬取策略
B:基于深度优先的爬取策略
C:基于语境图的爬取策略
D:基于链接结构评价的爬取策略
答案:B
3.下列不属于常用反爬手段的是( )。
A:反爬频度
B:验证码校验
C:账号权限
D:人工筛选html导航源码
答案:D
4.下列属于反爬虫目的的是( )。
A:防止网站信息被竞争对手随意获取
B:限制用户访问权限
C:限制访问人数
D:变换网页结构
答案:A
5.下列属关于Python爬虫库的功能描述不正确的是( )。
A:HTML/XML解析器pycurl`
B:通用爬虫库urllib3
C:通用爬虫库 Requests
D:爬虫框架 Scrapy
答案:A
6.搜索引擎使用了网络爬虫不停地从互联网抓取网站数据,并将网站镜像保存在本地。( )
A:对
B:错
答案:A
文件中,User-agent后面跟的是爬虫的名称,Disallow后面跟着的是可以爬虫的网页。( )
A:错
B:对
答案:A
8.爬虫是手动请求万维网网站且提取网页数据的程序。( )
A:错
B:对
答案:A
9.每个网站都有文件。( )
A:对
B:错
答案:B
10.爬虫爬取的是网站后台的数据。( )
A:对
B:错
答案:B
项目二测试
11.吉多设计Python的灵感来源于( )。
A:C语言
B:ABC语言
C:Unix shell
D:Java语言
答案:B
12.下列关于Python语言的特点说法中,错误的是( )。
A:ANSI C
B:Go
C:Python语言是非开源语言
D:Python语言是跨平台语言
答案:C
13.Python源代码文件的后缀名是( )
A:png
B:doc
C:pdf
D:py
答案:D
14.列表list=[1,2,3,4,5],下列选项中为空的是( )
A:ist[1:1]
B:list[1:-1]
C:list[1:]
D:list[:-2]
答案:A
15.Python语言中用来定义函数的关键字是( )
A:class
B:def
C:return
D:function
答案:B
16.在安装Python时,需要根据已有的系统来选择相应的安装程序。安装后,也需要配置环境变量。( )
A:错
B:对
答案:B
17.elif语句可以单独使用。( )
A:对
B:错
答案:B
18.元组的元素不能修改。( )
A:错
B:对
答案:B
19.下列选项中,不能创建元组的语句是( )。
A:tup=(2)
B:tup = (1,2,98)
C:tup=tuple([1,2,3])
D:tup=[1,2,3]
答案:AD
项目三测试
20.如果站点服务器支持安全套接层(SSL),那么连接到安全站点上的所有URL开头是( )。
A:SHTTP
B:SSL
C:HTTPS
D:HTTP
答案:C
21.body元素用于背景颜的属性是( )。
A:alink
B:color
C:vlink
D:background-color
答案:D
22.为了标识一个HTML文件开始应该使用的HTML标记是 ( )。
A:<table>
B:<a>
C:<body>
D:<html>
答案:D
23.在HTML中,单元格的标记是( )。
A:<td>
B:<body>
C:<span>
D:<tr>
答案:A
24.CSS 中的选择器不包括包括( )
A:超文本标记选择器
B:元素选择器
C:ID选择器
D:类选择器
答案:A
25.( )是网页与网页之间联系的纽带,也是网页的重要特。
A:框架
B:表格
C:超链接
D:导航条
答案:C
26.在HTML中,下面是段落标签的是:( ) 。
A:<head></head>
B:<p></p>
C:<html></html>
D:<body></body>
答案:B
27.( )标签可以应用于〈head〉中。
A:<image>
B:<body>
C:<html>
D:<title>
答案:D
28.下列哪一项是css添加背景图片的正确语法构成?( )
A:background-color
B:background-size
C:background-position
D:background-image
答案:D
29.在HTML开发中,制作网站时首先需要考虑内容是( )
A:图片彩
B:文字字体第四章
C:页面内容
D:页面布局
答案:D
项目四测试
30.HTTPError 是 URLError 的子类,专门用来处理 HTTP 请求错误,比如认证请求失败等。它有 3 个属性,下列选项哪一个不是它的属性( )。
A:Response
B:headers
C:reason
D:code
答案:A
31.下列属于HTTP必须实现的请求方法的是( )。
A:OPTIONS和CONNECT
B:GET与HEAD
C:POST与DELE
D:TRACE和OPTIONS
答案:B
32.下列关于HTTP状态码类型描述错误的是( )。
A:3XX表示客户端的请求需采取进一步操作
B:1XX表示请求已被服务器接受,无须后续处理
C:4XX表示客户端可能发生错误
D:5XX表示服务器可能发生错误
答案:B
33.通过加入特定的____,可以将爬虫发出的请求伪装成浏览器。( )
A:Headers
B:opener
C:Request
D:User_Agent
答案:D
34.urlopen方法中的data 参数可以不是 bytes 类型。( )
A:错
B:对
答案:A
35.requests库中的(url)方法是请求目标网站,类型是一个HTTPresponse类型。( )
A:错
B:对
答案:B
36.如果访问某网站的频率太高,则这个网站可能会禁止访问。( )
A:错
B:对
答案:B
37.requests库中的(url)方法中包括两个(对象)请求,其中一个为Request请求,即向服务器请求资源的request对象,第二个是Response请求,即包含从服务器返回的所有资源。( )
A:错
B:对
答案:B
38.Response类用于动态地响应客户端的请求,控制发送给用户的信息,并且将动态地生
成响应,包括状态码、网页的内容等。( )
A:对
B:错
答案:A
项目五测试
39.下列不属于HTTP请求过程的是( )。
A:生成请求
B:超时设置
C:搜索文档
D:请求重定向
答案:C

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。