数据挖掘_国防科技大学中国大学mooc课后章节答案期末考试题库2023年
1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()
答案:
关联规则发现
答案:
关联规则发现
2.下列有关SVM说法不正确的是( )
答案:
SVM因为使用了核函数,因此它没有过拟合的风险
答案:
SVM因为使用了核函数,因此它没有过拟合的风险
3.影响聚类算法效果的主要原因有:()
答案:
特征选取_聚类准则_模式相似性测度
4.7、朴素贝叶斯分类器不存在数据平滑问题。( )
答案:
错误
答案:
错误
5.决策树中包含一下哪些结点
答案:
内部结点(internal node)_叶结点(leaf node)_根结点(root node)
答案:
内部结点(internal node)_叶结点(leaf node)_根结点(root node)
6.标称类型数据的可以利用的数学计算为:
答案:
众数
答案:
众数
7.一般,k-NN最近邻方法在( )的情况下效果较好
答案:
样本较少但典型性好
答案:
样本较少但典型性好
8.考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出、P(Y=0)=0.65。剩余的比赛队1胜出、P(Y=1)=0.35。队0获胜的比赛中只有30%在队1的主场、P(X=1|Y=0)=0.3,而
队1获胜的比赛中75%是主场获胜、P(X=1|Y=1)=0.75。则队1在主场获胜的概率即P(Y=1|X=1)为:()
答案:
0.57
答案:
0.57
9.一组数据的最小值为12,000,最大值为98,000,利用最小最大规范化将数据规范到[0,1],则73,000规范化的值为:()
答案:
0.716
答案:
0.716
10.以下哪个分类方法可以较好地避免样本的不平衡问题:()
答案:
KNN
11.简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,下列哪些不属于这种聚类类型
答案:
层次聚类_模糊聚类_非互斥聚类
答案:
层次聚类_模糊聚类_非互斥聚类
12.数据点密度分布不均会影响K-means聚类的效果。
答案:
正确
答案:
正确
13.数据集成需要解决模式集成、实体识别、数据冲突检测等问题
答案:
正确
答案:
正确
14.决策树模型中应处理连续型属性数据的方法之一为:根据信息增益选择阈值进行离散化。
答案:
正确
答案:
正确
15.数据库中某属性缺失值比较多时,数据清理可以采用忽略元组的方法。
答案:
错误
错误
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论