pythonnltk语义分析_使⽤Python引⼊NLTK进⾏情感分析本⽂是使⽤Python和开源⾃然语⾔⼯具包NLTK进⾏情感分析系列的第⼀篇。本⽂介绍了⼀些关键的NLP概念,并开始使⽤⾃然语⾔⼯具包(NLTK)Python库。
我们将简要概述⾃然语⾔处理(NLP),介绍⽤于Python的NLTK,并解释如何使⽤它解决复杂的NLP问题。
随着社区的发展,会有⼤量的对话,理解该体的整体情绪是很难的,但也许更重要的是要理解和识别有⽤的客户反馈。
python入门教程非常详细word我将演⽰如何开始使⽤Python和⾃然语⾔处理(NLP)(机器学习的⼀个分⽀)构建⾃⼰的⼯具,以便根据他们在⼀个公共论坛上的评论来分析他们的情绪。
我们将从⼀些关键的NLP概念⼊门,并开始使⽤⾃然语⾔⼯具包(NLTK)Python库。
什么是⾃然语⾔处理(NLP)?前端必学的框架
⾃然语⾔处理是⼈⼯智能和机器学习的跨学科研究,它涉及到⽤⼈类语⾔对⽂本做有⽤的事情。NLP可⽤于多种应⽤,如语⾔之间的翻译、汇总信息、会话机器⼈和搜索。
语⾔分析和对话处理需要理解复杂的主题,如形态学、语法和语法结构、语义以及从上下⽂派⽣的意义。
基于这⼀领域的研究,Edward Loper, Steven Bird和Ewan Klein创造了⾃然语⾔⼯具包(NLTK),⼀个⽤Python构建NLP应⽤程序的平台。像NLTK这样的库的要点是,为了构建使⽤NLP的应⽤程序,您不需要成为形态学、语法和语义⽅⾯的专家,也不必是机器学习⽅⾯的专家。
⽆论是了解⼈⼝的政治倾向、特定营销活动的受欢迎程度、投资者信⼼,还是基于社交媒体的客户情绪,你都可以专注于你最熟悉的领域,让NLTK这样的⼯具来承担重担。
在本教程中,我将不讨论Python编程基础知识、安装、虚拟环境等等。这⾥的⽰例使⽤Python3.7.5。
arch linux命令大全开始使⽤NLTK
NLTK被描述为⼀个平台,⽽不仅仅是另⼀个Python库,因为除了⼀个模块集合之外,它还包含了许多数据集。这些数据集称为语料库,因为它是关于如何使⽤语⾔的知识的集合或主体。
如果尚未安装,则可以通过运⾏以下命令,使⽤Python的pip包管理器安装NLTK:
pip install -U nltk
工程师开源代码使⽤NLTK的项⽬的第⼀步是导⼊库。⽆论您是在代码⽂件中编写Python,或者正在使⽤其他的⼯具,您可以运⾏如下内容:
assoc命令import nltk
接下来,使⽤download()⽅法扩展可供您使⽤的语料库。当不提供任何参数时,这将打开⼀个⽤户界⾯,您可以在其中选择⼀个单独的扩展或下载整个集合。
在这个例⼦中,我们需要下载Punkt,Punkt是⼀种经过预先训练的英语标记器,它将⽂本分成句⼦和单词列表。它是由⼀种算法建⽴起来的,⽤来模拟缩写、搭配和开始句⼦的单词。
nltk.download('punkt')
⼀旦下载完毕,您就可以使⽤它了。下⾯是⼀个使⽤Punkt记号器提取句⼦成分的⽰例。
import nltk
sentence = "A long time ago in a galaxy far, far away…"
tokens = nltk.word_tokenize(sentence)
print(tokens)
此代码的输出如下所⽰:
['A', 'long', 'time', 'ago', 'in', 'a', 'galaxy', 'far', ',', 'far', 'away', '...']app福导引入welcome
您可以使⽤基本的Python来做类似的事情。split()⽅法,但是要考虑到所有的变体,您最终编写的代码要⽐这⼀次完成的代码多得多。nltk.word_tokenize(sentence)打电话。
下⼀章
在本⽂中,我们向您介绍了⾃然语⾔处理中的⼀些基本概念和⽤于NLP、NLTK的Python库。
为了构建⽐读和写字符串更重要的应⽤程序,下⼀章是探索如何分析⽂本。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论