数据挖掘_国防科技大学中国大学mooc课后章节答案期末考试题库2023年
1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()

答案:
关联规则发现

2.下列有关SVM说法不正确的是( )

答案:
SVM因为使用了核函数,因此它没有过拟合的风险

3.影响聚类算法效果的主要原因有:()


答案:
特征选取_聚类准则_模式相似性测度

4.7、朴素贝叶斯分类器不存在数据平滑问题。( )

答案:
错误

5.决策树中包含一下哪些结点

答案:
内部结点(internal node)_叶结点(leaf node)_根结点(root node)


6.标称类型数据的可以利用的数学计算为:

答案:
众数

7.一般,k-NN最近邻方法在( )的情况下效果较好

答案:
样本较少但典型性好

8.考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出、P(Y=0)=0.65。剩余的比赛队1胜出、P(Y=1)=0.35。队0获胜的比赛中只有30%在队1的主场、P(X=1|Y=0)=0.3,而
队1获胜的比赛中75%是主场获胜、P(X=1|Y=1)=0.75。则队1在主场获胜的概率即P(Y=1|X=1)为:()

答案:
0.57

9.一组数据的最小值为12,000,最大值为98,000,利用最小最大规范化将数据规范到[0,1],则73,000规范化的值为:()

答案:
0.716

10.以下哪个分类方法可以较好地避免样本的不平衡问题:()


答案:
KNN
正则化解决什么问题

11.简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,下列哪些不属于这种聚类类型

答案:
层次聚类_模糊聚类_非互斥聚类

12.数据点密度分布不均会影响K-means聚类的效果。

答案:
正确

13.数据集成需要解决模式集成、实体识别、数据冲突检测等问题

答案:
正确

14.决策树模型中应处理连续型属性数据的方法之一为:根据信息增益选择阈值进行离散化。

答案:
正确

15.数据库中某属性缺失值比较多时,数据清理可以采用忽略元组的方法。

答案:
错误

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。