Python数据科学导引知到章节测试答案智慧树2023年最新内蒙古农业大学
第一章测试
1.大数据的起源是( )。

参考答案:
互联网

2.机器学习的实质是( )。

参考答案:
根据现有数据,寻输入数据和输出数据的映射关系/函数

3.Spark支持的分布式部署方式中哪个是错误的( )。

参考答案:
Spark on local

4.以下表述正确的是:( )


参考答案:
深度学习是机器学习的一种。
;人工智能是人们长远以来的目标,期待机器像人一样有智慧。
;机器学习指机器有学习的能力,是人类达成人工智能目标的手段。
;人或机器表现的很有智慧取决于先天本能/创造者事先设定的规则和后天学习。

5.有效抑制机器学习过拟合的方法是( )


参考答案:
大学python知识点汇总平滑损失函数。
;重新设计损失函数,引入平滑函数。
;加大数据量。

6.下面表述正确的( )

参考答案:
迁移学习指训练集中包括没有输出数据与之对应的输入数据,但这些输入数据与其他输入数据不相干。
;强化学习指只有评价性输出结果的机器学习。
;
监督学习指训练集所有输入数据都有相应输出数据与之对应。
;监督学习指训练集中包括没有输出数据与之对应的输入数据,且所有输入数据属于同类别数据。

7.关于Spark中的RDD描述正确的( )

参考答案:
Destributed:分布式,可以并行在集计算。
;RDD(Resilient Distributed Datset)叫做弹性分布式数据集,是Spark中最基本的数据抽象。
;Resilient:表示弹性的,弹性表示。
;Datset:就是一个集合,用于存放数据的。

8.大数据的定义是不唯一的,从不同的角度对大数据都会有不同的理解。( )

参考答案:

9.关系抽取一般在实体抽取任务之后,用于抽取两个实体之间的句间关系。( )

参考答案:

10.Spark的四大组件为Spark Streaming、Mlib、Graphx、Spark R。( )

参考答案:
第二章测试
11.关于Python语言的变量,以下选项中说法正确的是( )。

参考答案:
随时命名、随时赋值、随时使用

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。