Python编程与新媒体文本挖掘_西南交通大学中国大学mooc课后章节答案期末考试题库2023年
1.文本聚类是一种无监督学习。

答案:
正确

2.文本分类是一种无监督学习。

答案:
错误

3.分词是中文文本挖掘的重要步骤。


答案:
正确

4.变量s = {},表示空集合。

答案:
错误
字符串是什么字符的集合

5.如果需要连接大量字符串成为一个字符串,那么使用字符串对象的join()方法比运算符+具有更高的效率。

答案:
正确

6.对于已有非空字符串s,那么表达式 ‘’.join(s.split()) == s 的值一定为True.

答案:
错误

7.布尔值True和False本质上是值为1和0的整形数字。

答案:
正确

8.文本挖掘是属于数据挖掘的一个分支。

答案:
正确

9.关于获取字典的值,下列哪种方法是错误的:

答案:
可以通过下标进行索引。

10.文本情感分析常用的两种方法是词典法和:

答案:
机器学习法。

11.文本主题建模时,常常根据主题个数、困惑度来确定,同时还要考虑:

答案:
可解释性。

12.表达式:'张三发表于14:20:15'.split('发表于')的值为:

答案:
['张三', '14:20:15']

13.表达式'+'.join(['年','月', '日'])的值为:

答案:
'年+月+日'

14.以下关于分支结构的描述中,错误的是:

答案:
二分支结构有一种紧凑形式,使用保留字if和elif实现。

15.下面关于TF-IDF说法错误的是:

答案:
TF-IDF跟语料库中文章总数无关。

16.进行文本分类训练时,训练集与测试集的规模:

答案:
一般训练集大于测试集

17.主要用于短文本分类的python包是:

答案:
TextGrocery

18.pandas中用于数据框的合并常用的操作方法是merge()和下面哪一个?

答案:
concat()

19.对于pandas数据框(DataFrame)df下列操作返回的是:df.shape[1]

答案:
数据框的列数。

20.与下面正则表达式:\d等价的正则表达式是:

答案:
[0-9]

21.集合的pop方法,默认弹出的元素是:

答案:
随机元素。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。