Python编程与新媒体文本挖掘_西南交通大学中国大学mooc课后章节答案期末考试题库2023年
1.文本聚类是一种无监督学习。
答案:
正确
答案:
正确
2.文本分类是一种无监督学习。
答案:
错误
答案:
错误
3.分词是中文文本挖掘的重要步骤。
答案:
正确
4.变量s = {},表示空集合。
答案:
错误
字符串是什么字符的集合答案:
错误
5.如果需要连接大量字符串成为一个字符串,那么使用字符串对象的join()方法比运算符+具有更高的效率。
答案:
正确
答案:
正确
6.对于已有非空字符串s,那么表达式 ‘’.join(s.split()) == s 的值一定为True.
答案:
错误
答案:
错误
7.布尔值True和False本质上是值为1和0的整形数字。
答案:
正确
答案:
正确
8.文本挖掘是属于数据挖掘的一个分支。
答案:
正确
正确
9.关于获取字典的值,下列哪种方法是错误的:
答案:
可以通过下标进行索引。
答案:
可以通过下标进行索引。
10.文本情感分析常用的两种方法是词典法和:
答案:
机器学习法。
答案:
机器学习法。
11.文本主题建模时,常常根据主题个数、困惑度来确定,同时还要考虑:
答案:
可解释性。
答案:
可解释性。
12.表达式:'张三发表于14:20:15'.split('发表于')的值为:
答案:
['张三', '14:20:15']
答案:
['张三', '14:20:15']
13.表达式'+'.join(['年','月', '日'])的值为:
答案:
'年+月+日'
答案:
'年+月+日'
14.以下关于分支结构的描述中,错误的是:
答案:
二分支结构有一种紧凑形式,使用保留字if和elif实现。
答案:
二分支结构有一种紧凑形式,使用保留字if和elif实现。
15.下面关于TF-IDF说法错误的是:
答案:
TF-IDF跟语料库中文章总数无关。
答案:
TF-IDF跟语料库中文章总数无关。
16.进行文本分类训练时,训练集与测试集的规模:
答案:
一般训练集大于测试集
一般训练集大于测试集
17.主要用于短文本分类的python包是:
答案:
TextGrocery
答案:
TextGrocery
18.pandas中用于数据框的合并常用的操作方法是merge()和下面哪一个?
答案:
concat()
答案:
concat()
19.对于pandas数据框(DataFrame)df下列操作返回的是:df.shape[1]
答案:
数据框的列数。
答案:
数据框的列数。
20.与下面正则表达式:\d等价的正则表达式是:
答案:
[0-9]
答案:
[0-9]
21.集合的pop方法,默认弹出的元素是:
答案:
随机元素。
答案:
随机元素。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论