Python将txt数据写入excel【分列】--688IT编程网

Python将txt数据写⼊excel【分列】⽬录

⽬的

txt数据显⽰中，第⼀⾏是属性，之后的每⼀⾏对应的是数据。

但是要导⼊数据库时，⽆法按属性列识别，所以必须格式化为Excel或csv的格式。

格式化后的Excel⽂件仍⽤⽤txt⽂件名命名，⽅便区分

单⽂件格式转换

#原始数据

pathDir = 'D:\workspace\A⼯作\BitErrorRate\data\data.TXT'

filename=pathDir.split('\\')[-1].split('.')[0]

#要写⼊的⽂件

out_filename='误码率'+RandomName.RandomName()+'.xlsx'

outfile_path=SETUP_DIR+r'/xlsx/'+ out_filename

def dataFormat_single():

source_dir = pathDir

target_dir = outfile_path

print(filename)

new_colums = "look\r\n"

start_time = w().strftime('%Y-%m-%d %H:%M:%S')

print("开始时间：",start_time)

# ⽂件开头增加新的⼀列内容作为列名（原列名太长/不可⽤）

f = open(source_dir, 'r')

# 读取⽂件内容

content = f.read()

f_new = open('b.txt', 'w')

# 开头写⼊内容并换⾏

f_new.write(new_colums)

# 写⼊原⽂件内容

f_new.write(content)

f_list=list(adlines())) #先把内容readlines()为列表，然后⽤set集合去重后再转化为列表，赋值于变量f_list

for i in f_list: #for循环列表f_list，判断是否有“\n”字符，如果有，将元素‘\n’移除

if i=='\n':

ve(i)

f_list=' '.join(f_list.split())

f_new.writelines(f_list) #将列表f_list的内容(此时列表已去除换⾏空⽩⾏)，通过writelines的⽅式写⼊新⽂件,

f.close()

f_new.close()

data = pd.read_csv(source_dir,"rb",engine='python') #读⼊数据出现乱码可添加engine='python'

# 字符串切分后结果分列展⽰

#需要分列的列名

df = pd.DataFrame(data, columns=["look"])

# 分列的字符，split默认输出list，设置expand=True结果会分列展⽰

#df=df["look"].str.split(',', expand=True)

#print(df)

# 截取字符串

#dataframe数据截取字符串

df["Eth"]=df.apply(lambda row:row.str[:20],axis=1)

print(df["Eth"])

#df["Eth"]=df.apply(lambda row:row['look'].split(' ')[0],axis=1) #print(df["Eth"])

#str数据截取字符串

df["Errors"]=df.apply(lambda row:row['look'][-19:],axis=1)

print(df["Errors"])

df["inErrors"]=df.apply(lambda row:row['Errors'][0:8],axis=1) print(df["inErrors"])

df["outErrors"]=df.apply(lambda row:row['Errors'][-9:],axis=1) print(df["outErrors"])

# 处理时间

end_time = w().strftime('%Y-%m-%d')

df["时间"]=end_time

df["设备"]=filename

print(df)

#列表df存储⾄excel

df[['设备','Eth','inErrors','outErrors','时间']].to_excel(target_dir)

if __name__ == "__main__":

dataFormat_single()

批量⽂件格式转换

import os

import pandas as pd

from datetime import datetime

#相对路径

import frozen_dir

#时间后缀

import RandomName

#提⽰弹窗

from MessageInfo import message_showinfo

SETUP_DIR = os.path.dirname(frozen_dir.app_path())

'''批量⽂件格式装换'''

def readAllFiles(filePath):

fileList = os.listdir(filePath)

for file in fileList:

path = os.path.join(filePath, file)

if os.path.isfile(path):

file = open(path, 'r', encoding='gbk')

print(path)

# 流程记录信息

if path.find("M") != -1:

#<class '_io.TextIOWrapper'>类型⽤.来引⽤其中的参数 print(file.name)

pathDir=str(file.name)

filename=pathDir.split('\\')[-1].split('（')[0]

file.close()

dataFormat(pathDir,filename)

else:

readAllFiles(path)

def dataFormat(pathDir,filename):

source_dir = pathDir

print(source_dir)

outfile_path=SETUP_DIR+r'/xlsx/'+filename+'.xlsx'

target_dir = outfile_path

python怎么读取excel文件数据

print(filename)

new_colums = "look\r\n"

start_time = w().strftime('%Y-%m-%d %H:%M:%S')

print("开始时间：",start_time)

#⽂件开头增加新的⼀列内容作为列名（原列名太长/不可⽤）

f = open(source_dir, 'r')

# 读取⽂件内容

content = f.read()

f_new = open(SETUP_DIR+'\\b.txt', 'w')

# 开头写⼊内容并换⾏

f_new.write(new_colums)

# 写⼊原⽂件内容

f_new.write(content)

f_list=list(adlines())) #先把内容readlines()为列表，然后⽤set集合去重后再转化为列表，赋值于变量f_list for i in f_list: #for循环列表f_list，判断是否有“\n”字符，如果有，将元素‘\n’移除

if i=='\n':

ve(i)

f_list=' '.join(f_list.split())

f_new.writelines(f_list) #将列表f_list的内容(此时列表已去除换⾏空⽩⾏)，通过writelines的⽅式写⼊新⽂件, f.close()

f_new.close()

data = pd.read_csv(source_dir,"rb",engine='python') #读⼊数据出现乱码可添加engine='python'

#字符串切分后结果分列展⽰

#需要分列的列名

df = pd.DataFrame(data, columns=["look"])

# 分列的字符，split默认输出list，设置expand=True结果会分列展⽰

#df=df["look"].str.split(',', expand=True)

#print(df)

#截取字符串

#dataframe数据截取字符串

df["Eth"]=df.apply(lambda row:row.str[:20],axis=1)

print(df["Eth"])

#df["Eth"]=df.apply(lambda row:row['look'].split(' ')[0],axis=1)

#print(df["Eth"])

#str数据截取字符串

df["Errors"]=df.apply(lambda row:row['look'][-19:],axis=1)

print(df["Errors"])

df["inErrors"]=df.apply(lambda row:row['Errors'][0:8],axis=1)

print(df["inErrors"])

df["outErrors"]=df.apply(lambda row:row['Errors'][-9:],axis=1)

print(df["outErrors"])

#处理时间

end_time = w().strftime('%Y-%m-%d')

df["时间"]=end_time

df["设备"]=filename

print(df)

#列表df存储⾄excel

print(df[['设备','Eth','inErrors','outErrors','时间']])

print(target_dir)

df[['设备','Eth','inErrors','outErrors','时间']].to_excel(target_dir)

message_showinfo()

if __name__ == "__main__":

file_path=SETUP_DIR+r'\data' readAllFiles(file_path)

688IT编程网

Python将txt数据写入excel【分列】

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

Python将txt数据写入excel【分列】

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式