哈姆雷特词云文本python
以下是使用python绘制《哈姆雷特》词云的代码:
```python
def getText():
#赋予txt哈姆雷特小说-全英文小写-全符号变空格-返回txt
txt = open('','r').read()
txt = txt.lower()
for ch in'!"#$%&()*+,-./:;<=>?@(\\)^_`{|}~':
txt = place(ch," ")
return txt
hamletTxt = getText()
words = hamletTxt.split()
counts = {}
for word in words:
counts[word] = (word,0) + 1
items = list(counts.items())
items.sort(key=lambda x:x[1],reverse=True)
for i in range(10):
word,count = items[i]
print('{0:<10},{1:>5}'.format(word,count))
```
其中,`getText()`函数用于获取文本内容,将所有字母转换为小写,并将特殊字符替换为空格。然后,使用`split()`函数将文本内容拆分成单词列表,并创建一个空字典`counts`来存储单词及其出现的次数。最后,使用`items()`函数将字典转换为列表,并按照单词出现的次数进行排序,输出前10个单词及其出现的次数。
你可以根据自己的需求修改代码中的文件路径和其他参数,以生成更符合你要求的词云。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论