数据采集1+x初级试题库含参考答案
一、单选题(共41题,每题1分,共41分)
1.修改数据库表结构用以下哪一项
A、UPDATE
B、CREATE
C、UPDATED
D、ALTER
正确答案:D
2.TCP/IP协议将整个通信功能划分为四个层次,处于最底层的是( )
A、数据链路层
B、网络接口层
C、物理层
D、网络层
正确答案:B
3.下面哪个不是Python合法的标识符( )
A、self
B、40XL
C、__name__
D、int32
正确答案:B
4.关于lambda函数,以下选项中描述错误的是()
A、lambda不是Python的保留字
B、定义了一种特殊的函数
C、lambda函数将函数名作为函数结果返回
D、lambda函数也称为匿名函数
正确答案:A
5.Scrapy中,用于运行项目中的爬虫的命令是()。
A、runspider
B、genspider
C、crawl
D、以上全是
正确答案:C
6.通过在路径表达式中使用()运算符,您可以选取若干个路径?
A、空白
B、/
C、|
D、.
正确答案:B
7.关于数据类型,说法不正确的是()
A、结构化数据是指具有固定格式的数据
B、非结构化数据的结构不规则或不完整,没有预定义的数据模型
C、半结构化数据介于结构化数据和非结构化数据之间
D、以上说法都不正确
正确答案:D
8.什么是正则表达式?
A、用来匹配文本字符串(如特定字符、单词或字符模式)的一种工具
B、任何在Python中可能的正确表达式
C、从Python字典中快速获取数据的一种算法
D、程序员经常使用的编程语言表达式的集合
正确答案:A
9.Python不支持的数据类型有()
A、float
B、int
C、char
D、list
正确答案:C
10.这些软件对计算机系统的资源进行控制、管理,并为用户使用和其他程序的运行提供服务。以上描述符合()的定义?
A、支撑软件
B、应用软件
C、操作系统
D、系统软件
正确答案:C
11.()法律中说明“国家支持网络运营者之间在网络安全信息收集、分析、通报和应急处置等方面进行合作,提高网络运营者的安全保障能力。”
A、《电信和互联网用户个人信息保护规定》
B、《民法总则》
C、《中华人民共和国安全法》
D、《中华人民共和国网络安全法》
正确答案:D
12.数据库结构的描述和定义是DBMS运行的基本依据,它们存储于( )
A、封锁表
B、数据字典
C、索引
D、日志
正确答案:B
13.()又称全网爬虫,爬行对象由一批种子URL扩充至整个Web,主要为门户站点、搜索引擎和大型Web服务提供商采集数据。
A、深层页面爬虫
B、聚焦网络爬虫
C、通用网络爬虫
D、增量式网络爬虫
正确答案:C
14.运行scrapy框架生成的spider程序,使用以下哪个命令
A、crawl
B、run
C、runspider
D、startspider
正确答案:A
15.半结构数据,是介于结构化数据与非结构化之间的数据,下面不属于半结构化数据的是()
A、XML
B、HTML
C、MPEG-1
D、JSON
正确答案:C
16.属于应用层协议的是()
A、IP
B、UDP
C、TCP
D、FTP
正确答案:D
17.()的主要功能是对日志进行收集、过滤并将其存储,方便以后搜索,自带一个Web界面,可以搜索和展示所有日志。
A、Kibana
B、Logstash
C、Elasticsearch
D、IIS
正确答案:B
18.使用urllib库的方法获取到Response类型的对象后,想改变其编码格式时需要修改此对象的哪个属性( )
A、coding
B、encoding
C、utf-8
D、text
正确答案:B
19.以下不属于日志数据采集步骤的是()
A、清洗数据
B、分析数据
C、采集数据
D、存储数据
正确答案:B
20.下列不是手机操作系统的是?( )
A、Android
B、Window?Mobile
C、IOS
D、WindowsVista
正确答案:D
21.检查网络联通性的命令是 ()
正则匹配快代理A、telnet
B、ping
C、route
D、ipconfig
正确答案:B
22.以下xpath代码中,能够获取页面中title标签的内容的是()。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。