python⾃动化办公实例展⽰_python⾃动化办公?学这些就够
⽤了
知乎上有⼈提问:⽤python进⾏办公⾃动化都需要学习什么知识呢?
这可能是很多⾮IT职场⼈⼠⾯临的困惑,想把python⽤到⼯作中,却不知如何下⼿?
python在⾃动化办公领域越来越受欢迎,批量处理简直是加班族的福⾳。
⾃动化办公⽆⾮是excel、ppt、word、邮件、⽂件处理、数据分析处理、爬⾍这些,这次我就来理⼀理python⾃动化办公的那些知识点。
python基础
excel⾃动化
ppt⾃动化
word⾃动化
邮件处理
⽂件批量处理
数据处理与分析
⾃动化爬⾍
下⾯⼀⼀详解。
python基础
能做这些的前提是会使⽤Python,最起码要熟悉基本语法,可以编写⼩脚本。
对于python语法的要求,你可以对照python基础教程的部分查看需要学那些,个免费视频教程跟着学,然后多敲代码练习。如果习惯看书的话,可以买本python⼊门书备查。
语法
主要内容
基本数据类型
不可变数据(3 个):Number(数字)、String(字符串)、Tuple(元组)
可变数据(3 个):List(列表)、Dictionary(字典)、Set(集合)
运算符
算术运算符、逻辑运算符、赋值运算符、⽐较运算符、位运算符...
切片软件哪个好用数值类型
整型(Int)、浮点型(float)、复数(complex)
条件控制语句
循环语句
while语句、for语句
函数
def定义函数、函数调⽤、参数传递、匿名函数...
迭代
迭代过程、迭代器、⽣成器、⽣成器表达式
⽂件操作
open()函数、read、readline、readlines、⽅法
os模块
处理系统⽂件和⽬录
模块
模块导⼊、常⽤标准模块、常⽤第三⽅库
错误和异常
try/except语句
⾯向对象
简单掌握⾯向对象概念即可
语法是关键,⼀定要理解python编程的基本概念,再去学其他的⼯具库。
不然会很痛苦的。
excel⾃动化
office家族其实都可以⽤VBA解决⾃动化的问题,但可能很多⼈不会⽤。
python针对excel有很多的第三⽅库可以⽤,⽐如xlwings、xlsxwriter、xlrd、xlwt、pandas、xlsxwriter、win32com、xlutils等等。
这些库可以很⽅便地实现对excel⽂件的增删改写、格式修改等,当然并不推荐你全部都去尝试⼀下,这样时间成本太⼤了。使⽤xlwings和pandas这两个就够了,基本能解决excel⾃动化的所有问题。
xlwing不光可以读写excel,还能进⾏格式调整、VBA操作,⾮常强⼤且易于使⽤。
之前写过⼀个xlwings的⼊门教程:
xlwings,让excel飞起来!
pandas是⼤家都熟悉的数据处理利器,它也⽀持excel的读写,接⼝友好。这个后⾯会讲到。
如果你对python⾃动化处理excel很有兴趣,也可以买⼀本专门的教材来看。
ppt⾃动化
python当然是⽀持ppt的⾃动化处理,主要的库有pywin32com、pptx,可以创建、修改ppt⽂件。
推荐使⽤pptx库,⽬前主流的ppt处理库。
word⾃动化
python操作Word的库:
python-docx、import docx:只对windows平台有效
pypiwin32、import win32com:跨平台,但⽆法处理doc格式的word⽂本,doc格式不是基于xml的textract、import textract:它同时兼顾“doc”和“docx”,但安装过程需要⼀些依赖。
你可以批量的⽤python⽣成word⽂件,推荐使⽤docx,不需要会太多。
slidetoggle菜单
邮件处理
python处理邮件也是极其便利的,smtplib、imaplib、email三个库配合使⽤,实现邮件编写、发送、接收、读取等⼀系列⾃动化操作,省时省⼒。
看了其他很多教程都有各种各样的问题,需要不断改bug,所以这个⼤家先可以跑跑上⾯的代码。
亚字组词⽂件批量处理
⽂件处理包括批量修改或创建⽂件名、批量⽣成⽂档、批量修改路径等等重复性操作。如果⼀个个⼿⼯操作,那真的⼼累。
python在处理批量操作有得天独厚的优势,成千上万的⽂件修改可能只需⼏秒的时间。
os是python⽂件操作的库,可以实现对电脑上⽂件的增删改查。
⽅法
importantand作⽤
os.chdir(path)
改变当前⼯作⽬录
返回当前⼯作⽬录
os.listdir()
返回path指定的⽂件夹包含的⽂件或⽂件夹的名字的列表
os.makedirs(path[, mode])
创建⼀个名为path的⽂件夹
删除路径为path的⽂件
python入门教程非常详细
...
数据处理和分析
我就是做数据分析⼯作的,基本也是python作为主要⼯具,所以这⼀块⽏庸置疑是python⾃动化办公最有价值的部分。
数据处理的库主要有:pandas、numpy、matplotlib、
pandas是⼀款不断进步的python数据科学库,它的数据结构⼗分适合做数据处理,并且pandas纳⼊了⼤量分析函数⽅法,以及常⽤统计学模型、可视化处理。
如果你使⽤python做数据分析,在数据预处理的过程,⼏乎九成的⼯作需要使⽤pandas完成。
在⼀些企业招分析师的笔试题中,pandas已经作为必考的⼯具,所以如果你想要⼊⾏数据分析师,请努⼒学习使⽤pandas。
numpy是python的数值计算库,包括pandas之类的很多分析库都建⽴在numpy基础上。
numpy的核⼼功能包括:
ndarray,⼀个具有⽮量算术运算和复杂⼴播能⼒的快速且节省空间的多维数组
⽤于对整组数据进⾏快速运算的标准数学函数(⽆需编写循环)
⽤于读写磁盘数据的⼯具以及⽤于操作内存映射⽂件的⼯具
线性代数、随机数⽣成以及傅⾥叶变换功能
⽤于集成由C、C++、Fortran等语⾔编写的代码的A C API
numpy之于数值计算特别重要是因为它可以⾼效处理⼤数组的数据。这是因为:
⽐起Python的内置序列,numpy数组使⽤的内存更少
numpy可以在整个数组上执⾏复杂的计算,⽽不需要Python的for循环
matplotlib和seaborn是python主要的可视化⼯具,建议⼤家都去学学,数据的展现和数据分析同样重要。
sklearn和keras,sklearn是python机器学库,涵盖了⼤部分机器学习模型。keras是深度学习库,它包含⾼效的数值库Theano和TensorFlow。
这些是⼤家⽿熟能详的神库,⾮常推荐去学习。fileseek函数
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论