人工智能机器学习技术练习(试卷编号2121)
1.[单选题]关于回归问题,说法正确的是()
A)可以不需要label
B)label列是连续型
C)属于无监督学习
答案:B
解析:
2.[单选题]关于线性回归算法,说法正确的是()
A)在高维空间中求解一个线性方程的系数组合
B)对异常值不敏感
C)无需对数据做标准化处理
答案:A
解析:
3.[单选题]回归问题的评价指标中MAE是指()
A)均方根误差
B)均方误差
C)平均绝对误差
答案:C
解析:
4.[单选题]假设有n组数据集,每组数据集中,x的平均值都是9,x的方差都是11,y的平均值都是
7.50,x与y的相关系数都是0.816,拟合的线性回归方程都是y=3.00+0.500x。那么这n组数据集()。
A)一样
B)不一样
C)无法确定是否一样
答案:C
解析:只比较平均值、方差、相关系数和回归方程,无法确定数据集是否相同,还需比较 Anscombe's quartet。
5.[单选题]OLAP技术的核心是:( )
A)在线性
B)对用户的快速响应
C)互操作性
D)多维分析
答案:D
解析:
6.[单选题]以下哪个度量属于数据散度的描述? ( )
A)均值
B)中位数
C)标准差
D)众数
答案:C
解析:
7.[单选题]相关关系是指(  )。
A)变量间的非独立关系
B)变量间的因果关系
C)变量间的函数关系
D)变量间不确定性的依存关系
答案:D
正则化是最小化策略的实现解析:
8.[单选题]若用φ(n)表示欧拉函数,请问:φ(56)的欧拉函数之积为?
A)24
B)10
C)15
D)11
答案:A
解析:
9.[单选题]以下不属于数据科学的研究目的的是( )。
A)大数据及其运动规律的揭示
B)从数据到智慧的转化
C)数据解释
D)数据驱动型决策支持
答案:C
解析:
10.[单选题]出其中的异类
A)nltk
B)scikit learn
C)SpaCy
D)BERT
答案:D
解析:
11.[单选题]在相同样本量下,重复抽样与不重复抽样的抽样平均误差大小关系是()
A)重复抽样误差大
B)不重复抽样误差大
C)二者相同
D)不确定
答案:A
解析:
12.[单选题]交叉验证的目的是(__)。
A)提高分类准确率
B)得到更稳定的模型
C)验证结果的准确性
D)增大分类的误差
答案:B
解析:
13.[单选题]支持向量机的优化问题是最小化的平方,这实现了(__)。
A)几何间隔为1/的最大间隔超平面
B)几何间隔为的最大间隔超平面
C)几何间隔为1/的最小间隔超平面
D)几何间隔为的最小间隔超平面
答案:A
解析:
14.[单选题]多层感知机方法中,可用作神经元的非线性激活函数( )
A)logistic 函数
B)范数
C)线性内积
D)加权求和
答案:A
解析:
15.[单选题]在一个神经网络中,知道每一个神经元的权重和偏差是最重要的一步。如果知道了神经元准确的权重和偏差,便可以近似任何函数,但怎么获知每个神经的权重和偏移呢?
A)搜索每个可能的权重和偏差组合,直到得到最佳值
B)赋予一个初始值,然后检查跟最佳值的差值,不断迭代调整权重
C)随机赋值,听天由命
D)以上都不正确的
答案:B
解析:
16.[单选题]以下描述中,属于集合特点的是
A)集合中的数据是无序的
B)集合中的数据是可以重复的
C)集合中的数据是严格有序的
D)集合中必须嵌套一个子集合
答案:A
解析:
17.[单选题]以下集合是凸集的是
A){(x,y) |y=x+1}
B){(x,y) | x的平方 + y的平方 = 1}
C){(x,y) | x的平方 + y的平方 > 1 }
D){(x,y) |x=1 | y=1 }
答案:A
解析:凸集,实数R上(或复数C上)的向量空间中,如果集合S中任两点的连线上的点都在S内,则称集合S为凸集。
所以直线是凸集,A正确。
{(x, y)| x^2 + y^2 <= 1}是凸集。
C选项恰好是圆形外面的区域,而任意两点连线上的点在圆形。
D选项是两条直线。
18.[单选题]建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?
A)根据内容检索
B)建模描述
C)预测建模
D)寻模式和规则
答案:C
解析:
19.[单选题]PCA在做降维处理时,优先选取哪些特征( )
A)中心化样本的协方差矩阵的最大特征值对应特征向量
B)最大间隔投影方向
C)最小类内聚类
D)最速梯度方向
答案:A
解析:
20.[单选题]以下关于机器学习的发展历程描述错误的是(___)。
A)要使机器具有智能,就必须设法使机器拥有知识
B)从二十世纪七十年代中期开始,人工智能研究进入了“知识期”
C)二十世纪五十年代中后期,基于神经网络的“符号主义”学习开始出现
D)二十世纪八十年代是机器学习称为一个独立的学科领域、各种机器学习技术百花初绽的时期
答案:C
解析:
21.[单选题]假如我们使用非线性可分的SVM目标函数作为最优化对象, 我们怎么保证模型线性可分:
A)设C=1
B)设C=0
C)设C=无穷大
D)以上都不对
答案:C
解析:C无穷大保证了所有的线性不可分都是可以忍受的.常数C决定了松弛变量之和的影响程度,如果越大,影响越严重,那么在优化的时候会更多的注重所有点到分界面的距离,
22.[单选题]对于任意值“x”,考虑到
Logistic(x):是任意值“x”的逻辑(Logistic)函数
Logit(x):是任意值“x”的logit函数
Logit_inv(x):是任意值“x”的逆逻辑函数
以下哪一项是正确的?
A)Logistic(x)= Logit(x)
B)Logistic(x)= Logit_inv(x)
C)Logit_inv(x)= Logit(x)
D)都不是
答案:B
解析:
23.[单选题]在马尔科夫随机场中,(__)个变量之间的联合概率分布能基于团分解为多个因子的乘积。
A)2
B)3
C)4
D)多
答案:D
解析:
24.[单选题]真负率是指(__)。
A)正样本预测结果数 / 正样本实际数
B)被预测为负的正样本结果数 / 正样本实际数
C)被预测为正的负样本结果数 /负样本实际数
D)负样本预测结果数 / 负样本实际数
答案:D
解析:
25.[单选题]一个包里有5个黑球,10个红球和17个白球。每次可以从中取两个球出来,放置在外面。那么至少取________次以后,一定出现过取出一对颜一样的球。
A)16

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。