Python逐行读取txt文本,按符合分割词并逐行写入txt--688IT编程网

Python逐⾏读取txt⽂本，按符合分割词并逐⾏写⼊txt

背景Background:

我的txt⽂件⾥⾯存放的是搜索词，由于原始的query（搜索词）都是⽤/或者、来分割词，⽽我要达到的是每个词语是单独的⼀⾏，并且写⼊txt

第⼀步：按⾏读取txt⽂件

s = []

f = open('','r') #由于我使⽤的pycharm已经设置完了路径，因此我直接写了⽂件名

for lines in f:

# query_list.place('/','').replace('、','').replace(' ','').strip('\n'))

ls = lines.strip('\n').replace(' ','').replace('、','/').replace('?','').split('/')

for i in ls:

s.append(i)

f.close()

print(s)

第⼆步：逐⾏写⼊txt

把我们列表中s的每⼀个元素写⼊tet，⼀个元素为⼀⾏，⽅法有很多，我这⾥只列举⼀种

（提前在你的⽂件路径中建⽴好⼀个空的txt:query_result）

f1 = open('','w')

for j in s:

f1.write(j+'\n')

f1.close()

⼤功告成，最后我输出的结果是：

其他：分类汇总的反向操作

完整版：为每⼀个资源号ID下的query配置对应资源号

我现在有两个变量：资源ID 和对应的检索词，每个ID对应多个检索词，每个ID和对应的检索词成为⼀⾏，具体结构如下：

我希望能够实现：1）把每⾏的多个检索词分开成⼀个个的单词，每个单词占⼀⾏

2）每个检索词前⾯对应各⾃的ID

为了做这个，我做了⼀个实验：

# # d = {'37186':'⾼能少年团,⾼能王俊凯','37192':'世界杯'}

# cc = [['⾼能少年团','⾼能王俊凯'],['shijiebei','世界杯c罗']]

# nn = ['37186','37192']

# for i in range(0,2):

# for j in cc[i]:

# print(j+nn[i])

#step1：读取资源号ID

q_id = []

f2 = open('id.txt','r')

for lines in f2:

q_id.append(lines.strip('\n'))

f2.close()

# print(q_id)

# print(len(q_id))

#step2：读取检索词（参照上两步）

s = []

python怎么读取txt

f = open('','r') #由于我使⽤的pycharm已经设置完了路径，因此我直接写了⽂件名

for lines in f:

# query_list.place('/','').replace('、','').replace(' ','').strip('\n'))

ls = lines.strip('\n').replace(' ','').replace('、','/').replace('?','').split('/')

for q in ls:

if q == '':

s.append(ls) #这⼀步和上⼀步不同，是为了每⼀⾏的检索词单独成为⼀个列表中的⼩列表，后⾯才能实现对应到⾃⼰的资源号f.close()

# print(s)

# print(len(s)) #要保证两个列表的长度相等，这⾥都是51个

if len(s) == len(q_id):

print('长度相等')

#step3：对应ID和检索词，把这个结果写⼊空的txt：

dy = open('','w')

for i in range(0,52):

for j in s[i]:

print(q_id[i]+j)

dy.write(q_id[i]+j+'\n')

dy.close()

　⼤功告成：结果如图所⽰：

之后copy到excel⾥，使⽤分割功能分割⼀下就好啦~~~~~~开熏

688IT编程网

Python逐行读取txt文本,按符合分割词并逐行写入txt

发表评论

推荐文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

热门文章

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

beautifulsoupfind_all怎样把带有某种属性的标签选出而不含该属性的标 ...

最新文章

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

0.5的倍数的正则表达式

标签列表

688IT编程网

Python逐行读取txt文本,按符合分割词并逐行写入txt

发表评论

推荐文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

热门文章

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

beautifulsoupfind_all怎样把带有某种属性的标签选出而不含该属性的标 ...

最新文章

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

0.5的倍数的正则表达式

标签列表

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

非零金额正则表达式