python读取pdf的标题_使用Python提取PDF文件里的内容--688IT编程网

python读取pdf的标题_使⽤Python提取PDF⽂件⾥的内容PDF⽂件，是我们⼯作和学习中经常见到的⽂件。阅读体验⾮常好。

常⽤的Python操作PDF⽂件的第三⽅库，包含pyPdf、pyPdf2、pyPdf3、pyPdf4、pdfrw。

这次主要⽤pyPdf2来提取PDF⽂件属性信息，如：⽂件名、标题、作者、PDF创建者、页数。

⼀、安装

下⾯是如何⽤pip安装PyPDF2:$ pip install pypdf2

安装⾮常快，因为PyPDF2没有任何依赖关系。现在让我们继续学习如何从PDF中提取⼀些信息。

⼆、提取内容

你可以使⽤PyPDF2从PDF中提取元数据和⼀些⽂本。当你对现有PDF⽂件执⾏某些类型的⾃动化时，这将⾮常有⽤。

让我们⽤PDF编写⼀些代码，学习如何访问这些属性:from PyPDF2 import PdfFileReader

def extract_info(pdf_path):

with open(pdf_path,'rb') as f:

pdf = PdfFileReader(f)

information = DocumentInfo()

number_of_pages = NumPages()

txt = f"""

Information about {pdf_path}:

Author: {information.author}

python怎么读取py文件

Creator: {ator}

Producer: {information.producer}

Subject: {information.subject}

Title: {information.title}

Number of pages: {number_of_pages}

"""

print(txt)

return information

如果觉得内容还不错，分享给更多朋友，⼀起提升编程技能。

发表评论

688IT编程网

python读取pdf的标题_使用Python提取PDF文件里的内容

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

python读取pdf的标题_使用Python提取PDF文件里的内容

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式