人工智能机器学习技术练习(习题卷23)
说明:答案和解析在试卷最后
第1部分:单项选择题,共58题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]在回归模型中,下列哪一项在权衡欠拟合(under-fitting)和过拟合(over-fitting)中影响最大?
A)多项式阶数
B)更新权重 w 时,使用的是矩阵求逆还是梯度下降
C)使用常数项
2.[单选题]如果SVM模型欠拟合, 以下方法哪些可以改进模型 :
A)增大惩罚参数C的值
B)减小惩罚参数C的值
C)减小核系数(gamma参数)
3.[单选题]在创建ndarray对象时,可以使用( )参数来指定元素类型。
A)dtype
B)dtypes
C)type
D)types
4.[单选题]一般,K-NN最近邻方法在什么情况下效果好( )
A)样本较多但典型性不好
B)样本较少但典型性较好
C)样本呈团状分布
D)样本呈链状分布
注: 最近邻属于分类算法,样本多而且典型性不好容易造成分类错误 (尤其是 在分类边界上的样本点)。 样本分布对聚类算法的影响较大。
5.[单选题]SVM的原理的简单描述,可概括为( )
A)最小均方误差分类
B)最小距离分类
C)最大间隔分类
D)最近邻分类
6.[单选题]以下属于生成式模型的是:()
A)SVM
B)随机森林
C)隐马尔可夫模型HMM
D)逻辑回归
7.[单选题]以下哪个度量属于数据散度的描述? ( )
A)均值
B)中位数
C)标准差
D)众数
8.[单选题]假设你有5个大小为7x7、边界值为0的卷积核,同时卷积神经网络第一层的深度为1。此时如果你向这一层传入一个维度为224x224x3的数据,那么神经网络下一层所接收到的数据维度是多少?
A)218x218x5
B)217x217x8
C)217x217x3
D)220x220x5
9.[单选题]从一个初始策略出发,不断迭代进行策略评估和改进,直到策略收敛、不再改变为止,这样的作法称为
A)策略迭代
B)值迭代
C)策略改进
D)最优值函数
10.[单选题]避免直接的复杂非线性变换,采用线性手段实现非线性学习的方法是( )
A)核函数方法
B)集成学习
C)线性鉴别分析
D)Logistic回归
11.[单选题]下面不属于数据科学主要研究内容的有(__)。
A)基础理论
B)数据管理
C)数据分析
D)数据商务
12.[单选题]长短时记忆神经网络通过什么来缓解梯度消失问题?()
A)增加网络深度
B)减少网络神经元
C)使用双向的网络结构
D)增加一个用来保存长期状态的单元
13.[单选题]下列关于HSV彩空间中描述不正确的是()。
A)H表示的是调,指的是光的颜
B)S表示的是饱和度,指的彩的深浅
C)V表示的是亮度,指的是光的明暗
D)HSV彩空间称为五角锥体模型
14.[单选题]TF-IDF模型中IDF是指(__)。
A)词频数
B)逆文档频率
C)词频率
D)逆文档频数
15.[单选题]点击率预测是一个正负样本不平衡问题(例如 99% 的没有点击,只有 1% 点击)。假如在这个非平衡的数据集上建立一个模型,得到训练样本的正确率是 99%,则下列说法正确的是?
A)模型正确率很高,不需要优化模型了
B)模型正确率并不高,应该建立更好的模型
C)无法对模型做出好坏评价
D)以上说法都不对
16.[单选题]OpenCV安装需要在()中安装。
A)网页窗口
B)Python命令环境正则化是最小化策略的实现
C)命令提示符窗口
D)任意可执行安装包
17.[单选题]下面不属于NoSQL的有(__)。
A)ORACLE
B)Redislabs
C)couchbase
D)paradigm4
18.[单选题]如右图所示有向图,节点G的马尔可夫毯为( )
A){D,E}
B){I,J}
C){D,E,I,J}
D){D,E,F,H,I,J}
19.[单选题]下面关于决策树学习相关描述不正确的有(__)。
A)决策树学习的本质是一种逼近离散值目标函数的过程
B)决策树的根节点表示分类的开始
C)中间节点表示某一个属性的属性值
D)从根节点到叶节点的路径表示一个具体的实例
20.[单选题]在有限支撑集上,下面分布的熵最大( )
A)几何分布
B)指数分布
C)高斯分布
D)均匀分布
21.[单选题]为了解决如何模拟人类的感性思维,例如视觉理解、直觉思维、悟 性等,研究者到一个重要的信息处理的机制是()
A)专家系统
B)人工神经网络
C)模式识别
D)智能代理
22.[单选题]下面的代码中,不是用来用来评价所训练模型的预测准确性的是:
A)ics import mean_absolute_error
B)ics import mean_squared_error
C)del_selection import train_test_split
D)ics import accuracy_score
23.[单选题]以下说法正确的是()
A)增加模型复杂度,模型在测试集上的准确率就能更好
B)L2正则化的解通常是稀疏的,L1正则化可以使得参数趋向于更平滑
C)对于PCA,我们应该选择是的模型具有最小variance的主成分
D)每次使用K-means算法得到的聚类结果可能会不一样
24.[单选题]Spark可以处理的数据任务包括()
A)数据批处理任务
B)准实时处理任务
C)图数据处理任务
D)A, B和C
25.[单选题]列表 a=[1, 2, [3, 4]] ,以下的运算结果为 True 的是()。
A)length(a)==3
B)len(a) == 4
C)len(a)==3
D)length(a)==4
26.[单选题]以下哪些不属于数据产品的特点
A)具有概率的准确性
B)自适应性
C)严格性
D)闭环性
27.[单选题]当学习器将训练样本自身的特点作为所有潜在样本都具有的一般性质,这样会导致泛化性能下降,这种现象称为( )。
A)欠拟合
B)过拟合
C)拟合
D)以上答案都不正确
28.[单选题]关于CNN,以下结论正确的是( )
A)在同样层数、每层神经元数量一样的情况下,CNN比全连接网络拥有更多的
参数
B)CNN可以用于非监督学习,但是普通神经网络不行
C)Pooling层用于减少图片的空间分辨率
D)接近输出层的filter主要用于提取图像的边缘信息
29.[单选题]判断并求一个数的绝对值,用_____结构实现最简单。
A)多分支结构
B)双分支结构
C)单分支结构
D)循环结构
30.[单选题]以下哪种不是Hive支持的数据类型?
A)Struct
B)Int
C)Map
D)Long
31.[单选题]下列函数中,用于沿着轴方向堆叠Pandas对象的是()。
A)concat()
B)join()
C)merge()
D)combine_first()
32.[单选题]OpenCV中的CV指的是()
A)开
B)开源
C)计算机
D)计算机视觉
33.[单选题]下面哪种不属于池化操作()。
A)连接池化
B)一般池化
C)重叠池化
D)金字塔池化
34.[单选题]如果我使用数据集的全部特征并且能够达到100%的准确率,但在新数据集上仅能达到70%左右,这说明( )
A)欠拟合
B)正常情况
C)过拟合
D)模型选择错误
35.[单选题]在概率图模型中,(__)模型是结构最简单的动态贝叶斯网,主要用于时序数据建模。
A)马尔可夫随机场
B)隐马尔可夫模型
C)条件随机场
D)逆误差传播
36.[单选题]下面符合数据产品链的有(__):1.数据,2.元数据,3.数据对象,4.辅助服务,5.集成应用,6.软件系统,7.增值服务,8.基础设施,9.硬件系统
A)23657
B)234
C)135
D)238497

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。