19秋学期(1709、1803、1809、1903、1909)《数据分析》在线作业
Apriori算法的加速过程依赖于以下哪个策略()
A.抽样
B.剪枝
C.缓冲
D.并行
正确答案:B
非频繁模式()
A.其置信度小于阈值
B.令人不感兴趣
C.包含负模式和负相关模式
D.对异常数据项敏感
正确答案:D
并行算法包括()
A.MapRedce
B.关联分析
C.KNN
D.Kmeans
正确答案:A
话题向量空间模型中,用()的一个向量表示该文本。
A.特征词
B.话题空间
C.语义空间
D.词向量空间
正确答案:B
潜在语义分析中,以()表示文本的语义内容
A.话题
B.话题向量
C.语义向量
D.距离向量
正确答案:B
在链接作弊的垃圾农场中,作弊者拥有并完全控制的网页称为()
A.不可达网页
B.可达网页
C.自有网页
正确答案:C
评价分类器效果时,表示将正类样本预测为正类数与总正类数之比的指标是()。
A.准确率
B.精确率
C.召回率
D.F1值
正确答案:C
大数据分析中,面向有用户参与分析决策的分析任务,不要求实时响应,但是也存在响应时间约束,称为()
A.实时分析
B.弱实时分析
C.非实时分析
正确答案:B
皮尔森相关系数的变化分为是()
A.[0,1]
B.[-1,1]
C.[-1,0]
D.[0.5,1]
正确答案:B
()反映了学习方法对未知的测试数据集的预测能力,是学习中的重要概念
A.训练误差
B.测试误差
C.统计误差
D.平均误差
正确答案:B
针对输入数据、时间与其他资源的要求,给出各种性能的输出结果,得到具有一定预计性的算法模型,被称为()
A.随机算法
B.外存算法
C.并行算法
D.Anytime算法
正确答案:D
算法中用到了外存的算法是()
A.随机算法
B.外存算法
C.并行算法
D.Anytime算法
正确答案:B
pageRank中,将网页链接转化为()“投票”。
A.搜索量
B.评价
C.访问量
D.重要度
正确答案:D
HITS算法中,网页的重要性应该依赖于()
A.每个网页上的超链接个数
B.用户提出的查询请求
C.网页上超链接重要性
正确答案:B
以下属于关联分析的是()
A.CPU性能预测
B.购物篮分析
C.自动判断鸢尾花类别
D.股票趋势建模
正确答案:B
用多台处理机联合求解问题的算法被称为()
A.随机算法
B.外存算法
C.并行算法
D.Anytime算法
正确答案:C
任何故意提高网页在搜索引擎结果中的位置,使其与网页的()不相符的行为,称为Web作弊
A.访问量
B.实际价值
C.搜索量
D.用户数量
正确答案:B
在估计PLSA生成模型的参数时,使用()
A.极大似然估计
B.对数似然函数
C.特征独立假设
D.贝叶斯定理
正确答案:A
逻辑斯谛分布的分布函数范
围在()
A.(-∞,+∞)
B.(0,1)
C.(-1/2,1/2)
D.(-1,1)
正确答案:B
使用了随机函数的算法是哪个算法()
A.随机算法
B.外存算法
C.并行算法
D.Anytime算法
正确答案:A
基于分类对象的分类有()
A.Q型聚类
B.凝聚方式
C.R型聚类
D.分解方式
正确答案:BD
聚类方法中的划分方法包括()
A.K-均值算法
B.凝聚法
C.分裂法
D.K-中心点算法
正确答案:AD
下列哪些任务适合构建分类模型()
A.银行业务中,客户申请贷款,根据客户的相关数据分析他是属于“诚信”类还是“失信”类
B.邮件系统可以根据email标题和内容区分出垃圾邮件
C.医学研究人员根据病理数据,合理辨识病情状况,采取合理手段
D.房价预测
正确答案:ABC
关联规则用于查项目集合或对象集合之间的()
A.频繁模式
B.关联
C.相关性
D.因果结构
正确答案:ABCD
借助于大数据提供的()和(),政府可为农业生产进行合理引导,依据需求进行生产,避免产能过剩造成不必要的资源和社会财富浪费。
A.消费能力
B.趋势报告
C.购物结果
正确答案:AB
决策树中的信息增益等价于()中类与特征的()
A.训练数据
B.测试数据
C.交叉熵
D.互信息
正确答案:AD
逻辑斯谛回归的主要用途包括()
A.寻危险因素
B.搜索
C.预测
D.判别
正确答案:ACD
概率潜在语义分析中,模型生成的是(),但观测到的是()。
A.单词-话题-文本三元组
B.话题-文本二元组
C.单词-话题二元组
D.单词-文本二元组
正确答案:AD
两个个体之间的距离需满足什么条件()
A.自反性
B.非负性
C.对称性
D.三角形法则
正确答案:ABCD
层次方法中,自底向上的方法是哪种()
A.凝聚法
B.分裂法
C.K-均值算法
D.K-中心点算法
正确答案:AB
聚类分析中,一个类是样本的一个子集。
T.对
F.错
正确答案:A
中位数的优势是计算简便,不受极端值的影响
T.对
F.错
正确答案:A
大数据规则性分析用于预测未来时间发生的概率和演化趋势
T.对
F.错
正确答案:B
话题可以从数据中直接观察到。()
T.对
F.错在常用的正则化计算方法中 属于
正确答案:B
用损失函数或代价函数度量预测错误的程度
T.对
F.错
正确答案:A
大数据虽然拥有大量的价值信息,但是价值密度较低
T.对
F.错
正确答案:A
互联网可以抽象成有向图结构,网页是结点,超链接是有向边。
T.对
F.错
正确答案:A
边的中介度定义为任意节点对的数目。()
T.对
F.错
正确答案:B
DAG中的父节点是唯一的。
T.对
F.错
正确答案:B
AGNES算法中,簇中相似度由单链接法确定。()
T.对
F.错
正确答
案:A
城市公共交通规划、教育资源配置、医疗资源配置、商业中心建设、房地产规划、产业规划、城市建设等都可以借助于大数据技术进行良好的规划和动态调整。
T.对
F.错
正确答案:A
大数据分析模型的建立步骤通常为准备数据、浏览数据、变量选择和定义模型的模式
T.对
F.错
正确答案:B
越来越多的企业通过架设海量数据采集系统,多用于系统日志采集,这些工具均采用分布式架构,能满足每秒数百兆的日志数据采集和传输需求。
T.对
F.错
正确答案:A
监督学习是从标注数据中学习预测模型的机器学习问题
T.对
F.错
正确答案:A
FP-growth算法可以避免冗余的IO读写
T.对
F.错
正确答案:A
强化学习是指智能系统在与环境的连续互动中学习最优行为策略的机器学习问题
T.对
F.错
正确答案:A
K-均值算法中每个簇都用该簇中对象的均值表示()
T.对
F.错
正确答案:A
k均值聚类中,每个样本只能属于一个类。()
T.对
F.错
正确答案:A
Apriori算法的优点是速度快。()
T.对
F.错
正确答案:B
支持向量机仅能对线性数据进行分类。()
T.对
F.错
正确答案:B

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。