python⽂本筛选_使⽤python对多个txt⽂件中的数据进⾏筛选
的⽅法
使⽤python对多个txt⽂件中的数据进⾏筛选的⽅法
⼀、问题描述
筛选出多个txt⽂件中需要的数据
⼆、数据准备
这是我⾃⼰建⽴的要处理的⽂件,⾥⾯是随意写的⼀些数字和字母
三、程序编写
import os
def eachFile(filepath):
pathDir =os.listdir(filepath) #遍历⽂件夹中的text
return pathDir
def readfile(name):
fopen=open(name,'r')
for lines adlines(): #按⾏读取text中的内容
lines = place("\n", "").split(",")
if 'aaa' in str(lines) and '2' not in str(lines):
#筛选出含有'aaa'并且不含数字2的每⼀⾏
print(lines)
fopen.close()
filePath = "C:\\Users\\Administrator\\Desktop\\123"
pathDir=eachFile(filePath)
for allDir in pathDir:
# child = os.path.join('%s%s' % (filepath, allDir))
child = "C:\\Users\\Administrator\\Desktop\\123" + '\\' + allDir
readfile(child)
以上只是利⽤if条件句对数据进⾏简单的筛选,可以⽤正则表达式做更复杂的数据筛选。
这篇使⽤python对多个txt⽂件中的数据进⾏筛选的⽅法就是⼩编分享给⼤家的全部内容了,希望能给⼤家⼀个参考,也希望⼤家多多⽀持我们。
时间: 2019-07-08
本⽂实例讲述了Python实现多条件筛选⽬标数据功能.分享给⼤家供⼤家参考,具体如下: python中提供了⼀些数据过滤功能,可以使⽤内建函数,也可以使⽤循环语句来判断,或者使⽤pandas库,当然在有些情况下使⽤pandas是为了提⾼⼯作效率.举例如下: a = [('chic', 'JJ'),
('although', 'IN'), ('menu', 'JJ'), ('items', 'NNS'), ('doesnt', 'JJ'), ('scream', 'NN'), ('french',
本⽂主要介绍如何对多个⽂本进⾏读取,并采⽤正则表达式对其中的信息进⾏筛选,将筛选出来的信息存写到⼀个新⽂本. ⽂本基础操作 打开⽂件:open('⽂件名','打开⽅式')>>>file=open(r'C:\Users\yuanlei\','w+').为避免报错,在⽂件名的引号前加个r. ⽂件打开⽅式:只读--r或rt,rb为⼆进制⽂件:打开⽂件前清空⽂件内容--w或wt:在⽂末写⼊--a+: 清空内容然后在⽂末写⼊--w+:写到⽂件任意位置--r+; 关
python判断两个⽂件是否相同 import hashlib def getHash(f): adline() hash=hashlib.md5() while(line): hash.update(line) adline() return hash.hexdigest() def IsHashEqual(f1,f2): str1=getHash(f1) str2=getHash(f2) return str1==str2 if
__name__ == '
在做项⽬时遇到需要标记数据集⾥⾯的若⼲图⽚数据,作为程序员,为避免⼿动⼀张⼀张的筛选,所以写了这个Python脚本实现. Python脚本如下: # from PIL import Image import csv import os import shutil filename = '' def readImageName(): with
open(filename) as f: lines = f.readlines() imgnames = [] for line in li
http协议本⾝的原始⽅法不⽀持multipart/form-data请求,这个请求由原始⽅法演变⽽来的. multipart/fo
rm-data的基础⽅法是post,也就是说是由post⽅法来组合实现的,与post⽅法的不同之处:请求头,请求体. multipart/form-data的请求头必须包含⼀个特殊的头信
息:Content-Type,且其值也必须规定为multipart/form-data,同时还需要规定⼀个内容分割符⽤于分割请求体中的多个post的内容,如⽂件内容和⽂本内容⾃然需要
今天被同步盘搞得焦头烂额. ⾟苦码的代码(除了重要的.备份过的)都被删掉了-- 当时我就⽯化了... 随后发现同步盘⽬录有个delete⽬录,⾥⾯还有l,和⼀堆改了名的⽂件, 看到l的内容时,瞬间觉得有救了,⽴马开搞python 废话不多说,直接上代码: #-*-coding:utf-8 -*- import ElementTree import os import sys reload(sys) sys.setdefa
本⽂实例讲述了Python实现修改⽂件内容的⽅法.分享给⼤家供⼤家参考,具体如下: 1 替换⽂件中的⼀⾏ 1.1 修改原⽂件 ① 要把⽂件中的⼀⾏Server=192.168.22.22中的IP地址替换掉,因此把整⾏替换. data = '' with open('f', 'r+') as f: for line adlines():
if(line.find('Server') == 0): line = 'Server=%s' % ('192.168.1.1',
最近项⽬需要,针对主项⽬提取⼀个⼩的基础版本,供于在新建项⽬时使⽤,所以就有这个python模板⽣成脚本,其作⽤如下: 1.通过配置⽂件来控制模板中的数据.格式化的过滤条件 2.执⾏后会把⽬录
下所有的⽂件都会执⾏⼀篇 #!/usr/bin/python #encoding: utf-8 import json import codecs import os def get_files(root_path): for dir in os.walk(root_path): if dir[2]: fo
python怎么读取json文件做⼯程时遇到需要监听json⽂件,根据json⽂件中的key-value值作出相应处理的情形.为此写了修改json⽂件的python脚本供⼯程后续调⽤.代码如下: # coding=utf-8 //设置⽂本格式 import os,sys import json def get_new_json(filepath,key,value): key_ = key.split(".") key_length = len(key_) with open(filepath, 'rb') as
本⽂实例讲述了python获取mp3⽂件信息的⽅法.分享给⼤家供⼤家参考.具体如下: 将代码⽣成.py⽂件放在⽬录下运⾏,可以获取该⽬录的所有mp3⽂件的信息,需要使⽤ID3库 import os, sys from ID3 import * files = os.wd()) for f in files: x =
os.path.splitext(f) if x[1] == '.mp3': n = x[0].split(' - ') author = n[0] t
本⽂实例讲述了Python实现⼤⽂件排序的⽅法.分享给⼤家供⼤家参考.具体实现⽅法如下: import gzip import os from multiprocessing import Process, Queue, Pipe, current_process, freeze_support from datetime import datetime def sort_worker(input,output): while True: lines = ().splitlin
Windows下的分隔符默认的是逗号,⽽MAC的分隔符是分号.拿到⼀份⽤分号分割的CSV⽂件,在Win下
是⽆法正确读取的,因为CSV模块默认调⽤的是Excel的规则. 所以我们在读取⽂件的时候需要添加分割符变量. import csv import os cwd = os.getcwd() print ("Current folder is %s" % (cwd) ) csvfile = open( cwd + '\data\eclipse\change-metrics.csv','r
gzip⽂件读写的时候需要⽤到Python的gzip模块. 具体使⽤如下: # -*- coding: utf-8 -*- import gzip # 写⽂件 f_out =
gzip.open("", "wb") # 读⽂件 # f_in = gzip.open("", "rb") for line in open("", "rb"): f_out
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论