Python数据分析与应用题库
下列nltk模块中,可以对句子实现分词操作的是()。 [单选题] *
A、pus |
B、kenize(正确答案) |
C、nltk.stem |
D、nltk.tag |
答案解析:暂无解析
下列函数中,用于打开NLTK下载器的是()。 [单选题] *
A、download()(正确答案) |
B、load() |
C、open() |
D、install() |
答案解析:暂无解析
下列选项中,NLTK用来标记形容词的是()。 [单选题] *
A、JJ(正确答案) |
B、RB |
C、CC |
D、DT |
答案解析:pvc是什么管暂无解析
关于词性归一化的说法中,下列描述正确的是()。 [单选题] *
A、词干提取和词形还原最终都会得到词根 |
B、词干提取能够捕捉基于词根的规范单词形式 |
C、词形还原需要删除不影响词性的词缀得到词干 |
D、词形还原能够捕捉基于词根的规范单词形式(正确答案) |
答案解析:暂无解析
下列选项中,用于控制jieba.cut()分词模式的是()。 [单选题] *
A、data |
B、HMM |
C、is_all |
D、cut_all(正确答案) |
答案解析:jieba.cut()函数共接收三个参数,其中第一个为需要分词的字符串,cut_all参数用来控制是否采用全模式,HMM 参数用来控制是否使用 HMM 模型。
下列方法中,用于返回出现相对较频繁的单词的是()。 [单选题] *
A、word_tokenize() |
B、pos_tag() |
java工程和web工程的区别 C、most_common()(正确答案) |
D、cosine_distance() |
答案解析:word_tokenize()函数基于空格或标点对文本进行分词;pos_tag()函数用于给单词标注词性;cosine_distance()函数用于求两个向量的夹角余弦值。
下列选项中,用于标注词语词性的模块是()。 [单选题] *
A、pus |
B、kenize |
C、nltk.stem |
D、nltk.tag(正确答案) |
ssm三个框架分别用来干什么答案解析:暂无解析
下列分词模式中,可以将句子中所有成词词语都扫描出来的是()。 [单选题] *
A、精确模式 |
B、全模式(正确答案) |
C、搜索引擎模式 |
D、模糊搜索模式 |
答案解析:暂无解析
如果希望还原单词的基本形式,则需要使用import语句导入哪个模块?() [单选题] *
A、pus |
B、kenize |
C、nltk.stem(正确答案) |
D、nltk.tag |
答案解析:暂无解析
关于文本预处理的过程,下列描述错误的是()。 [单选题] *
A、文本分词是预处理过程中必不可少的一个操作 |
B、词干提取是一个很粗略的去除单词两端词缀的过程 |
C、词形还原是一个去除曲折的词缀且返回词典中包含的词的过程 |
structures plus open source D、文本中的每个单词都能够表明文本的特征(正确答案) |
答案解析:文本中包含一些停用词,这些词是无法表明文本特征的。
通过date_range()函数创建DatetimeIndex对象时,如果只是传入了开始日期,则还需要用()参数指定产生多少个时间戳。 [单选题] *
A、freq |
B、end |
C、periods(正确答案) |
D、start |
答案解析:暂无解析
请阅读下面一段程序: [单选题] *
运行上述程序,它最终输出的结果为(A)。(正确答案) |
A、2015 |
B、2014 |
C、2013 |
D、2012 |
答案解析:暂无解析
下列方法中,能够转换时期频率的是()。 [单选题] *
A、shift() |
B、rolling() |
C、asfreq()(正确答案) |
D、resample() |
答案解析:shift()方法用于沿着时间轴方向将数据进行前移或后移;rolling()方法用于滑动
窗口;resample()是一个对常规时间序列数据重新采样和频率转换的便捷的方法。
下列方法中,用来创建一个滑动窗口的是()。 [单选题] *
A、shift() |
B、rolling()python数据分析基础教程答案(正确答案) |
C、asfreq() |
D、resample() |
答案解析:暂无解析
请阅读下面一段程序: 运行程序,它最终执行的结果为()。 [单选题] *
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论