python统计文件中的字符串数目示例--688IT编程网

python统计⽂件中的字符串数⽬⽰例

题⽬：

⼀个txt⽂件中已知数据格式为：

C4D

C4D/maya

C4D

C4D/su

C4D/max/AE

统计每个字段出现的次数，⽐如C4D、maya

先读取⽂件，将⽂件中的数据抽取出来：

def getWords(filepath):

file = open(filepath)

wordOne=[]

while(file):

line = adline()

word = line.split('/')

if(not line): #若读取结束了

break

wordtwo=[]

for i in wordOne:

return wordtwo

说明：这个有⼀个要注意的地⽅是⽂件是被”\n”,”/”两种格式分割⽽来的，因此需要split两次。

然后定义⼀个dict，遍历数据，代码如下所⽰：

def getWordNum(words):

dictWord={}

for i in words:

if(i not in dictWord):

dictWord[i]=0

字符串长度头文件dictWord[i]+=1

return dictWord

主函数的调⽤：

filepath=''

words = getWords(filepath)

dictword = getWordNum(words)

print(dictword)

结果：

{'C4D': 9, 'max': 1, 'su': 1, 'maya': 1, 'AE': 3}

说明：

1，

print(type(word))

print(type(splitData[0]))

输出为：

就是当d()执⾏之后就将原本是list类型的数据转换成str类型的存储起来。只有对str类型的数据才能⽤split函数2，

import os

wd())

这个可以输出当前所在位置，对于读取⽂件很有⽤。

在读⼊⽂件并对⽂件进⾏切分的时候，若是含有的切分词太多，那么使⽤re.split()⽅法是最⽅便的，如下所⽰：

filepath=''

file = open(filepath) #读取⽂件

wordOne=[]

symbol = '\n/' #定义分隔符

symbol = "["+symbol+"]" #拼接正则表达式

while(file):

line = adline()

word = re.split(symbol,line)

if(not line):

break

#通过上式得到的list中会含有很多的空字符串，所以要去空

wordOne = [x for x in wordOne if x]

以上这篇python 统计⽂件中的字符串数⽬⽰例就是⼩编分享给⼤家的全部内容了，希望能给⼤家⼀个参考，也希望⼤家多多⽀持。

发表评论

688IT编程网

python统计文件中的字符串数目示例

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

688IT编程网

python统计文件中的字符串数目示例

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法 正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式 最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

nginx map用法正则

shell 正则表达式最后一行