python统计西游记人物名字出现次数_Python文本统计功能之西游记用字统...--688IT编程网

python统计西游记⼈物名字出现次数_Python⽂本统计功能之

西游记⽤字统计操作⽰例...

本⽂实例讲述了Python⽂本统计功能之西游记⽤字统计操作。分享给⼤家供⼤家参考，具体如下：

⼀、数据

<，《西游记》的⽂本，2.2MB

致敬吴承恩⼤师，4020⾏(段)

⼆、⽬标

统计《西游记》中：

1. 共出现了多少个不同的汉字；

2. 每个汉字出现了多少次；

3. 出现得最频繁的汉字有哪些。

三、涉及内容：

1. 读⽂件；

2. 字典的使⽤；

3. 字典的排序；

4. 写⽂件

四、效果

五、源代码

# coding:utf8

import sys

reload(sys)

sys.setdefaultencoding("utf8")

fr = open('', 'r')activities指什么

characters = []

stat = {}

for line in fr:

# 去掉每⼀⾏两边的空⽩

line = line.strip()

# 如果为空⾏则跳过该轮循环

碳氢氧是人体的常量元素吗if len(line) == 0:

continue

# 将⽂本转为unicode，便于处理汉字

line = unicode(line)

# 遍历该⾏的每⼀个字

for x in xrange(0, len(line)):

# 去掉标点符号和空⽩符

thinkphp与laravel的区别

if line[x] in [' ','', '\t', '\n', '。', '，', '(', ')', '(', ')', '：', '□', '？', '！', '《', '》', '、', '；', '“', '”', '……']:

continue

# 尚未记录在characters中

if not line[x] in characters:

characters.append(line[x])

# 尚未记录在stat中

if not stat.has_key(line[x]):

stat[line[x]] = 0

python入门教程2# 汉字出现次数加1

stat[line[x]] += 1

print len(characters)

print len(stat)

# lambda⽣成⼀个临时函数

# d表⽰字典的每⼀对键值对，d[0]为key，d[1]为value

# reverse为True表⽰降序排序

stat = sorted(stat.items(), key=lambda d:d[1], reverse=True)

fw = open('result.csv', 'w')

for item in stat:

# 进⾏字符串拼接之前，需要将int转为str

idea怎么替换掉所选的文本fw.write(item[0] + ',' + str(item[1]) + '\n')

fr.close()

fw.close()java程序设计教程西安电子科技大学出版社

PS：这⾥再为⼤家推荐2款⾮常⽅便的统计⼯具供⼤家参考：

更多关于Python相关内容感兴趣的读者可查看本站专题：《Python⽂件与⽬录操作技巧汇总》、《Python⽂本⽂件操作技巧汇总》、《Python数据结构与算法教程》、《Python函数使⽤技巧总结》、《Python字符串操作技巧汇总》及《Python⼊门与进阶经典教程》

希望本⽂所述对⼤家Python程序设计有所帮助。

本⽂标题: Python⽂本统计功能之西游记⽤字统计操作⽰例

688IT编程网

python统计西游记人物名字出现次数_Python文本统计功能之西游记用字统...

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

python统计西游记人物名字出现次数_Python文本统计功能之西游记用字统...

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式