python生成文章标题_「懒惰的美德」我用python写了个自动生成给文档生成...--688IT编程网

python⽣成⽂章标题_「懒惰的美德」我⽤python写了个⾃动

⽣成给⽂档⽣成索引的脚本...

我⽤ python 写了⼀个⾃动⽣成索引的脚本简介：为了刷算法题，建了⼀个 GitHub仓库：PiperLiu / ACMOI_Journey，记录⾃⼰的刷题轨迹，并总结⼀下⽅法、⼼得。想到⼀个需求：能不能在我每新增⼀条题⽬的笔记后，利⽤程序⾃动地将其归类、创建索引？⽤ Python 实现⼀个⼊门级的⼩脚本，涉及到⽂件读写、命令⾏参数、数组操作应⽤等知识点，在此分享给朋友们。

需求实现

我有⼀个 Markdown ⽂档，长成下⾯这个样⼦：# ACM/OI Journey

在此留下刷题痕迹与刷题⼼得。

不定期的⽅法论总结在这⾥[./notes/README.md](./notes/README.md)。

学习资料：

- OI Wiki: /

⼒扣中国: leetcode-cn/

## 归档

## ⽇期归档

注意到，两个⼆级标题## 归档与## ⽇期归档下空空如也。

我的需求是，我刷完⼀道题，就将其记录在## ⽇期归档下，格式为： - uu ⽇期题⽬名称与概括类别A 类别B 类别C... [程序⽂件1] [程序⽂件2] [程序⽂件3]...

假设我今天刷了 2 道题，那么我就将其记录在我的## ⽇期归档下⾯，如下所⽰。## ⽇期归档

- uu 2020.11.26 盛最多⽔的容器『因为两个边共同决定了上限，因此将较短边向内移动，抛弃搜索次优解』双指针法搜索 [py]

(./vsc_leetcode/11.盛最多⽔的容器.py) [cpp](./vsc_leetcode/11.盛最多⽔的容器.cpp)

- uu 2020.11.27 整数转罗马数字『⽣活中从⼤的位数开始描述数字，因此从⼤的数与字符开始匹配』匹配字符串 [cpp]

(./vsc_leetcode/12.整数转罗马数字.cpp)

⽽我的## 归档下⾯还什么都没有，我希望我的脚本可以⾃动帮我在## 归档下创建三级⽬录：双指针法、搜索、匹配、字符串，并且将对应的题⽬放到下⾯去。

最终的效果是：## 归档

- [匹配](#匹配)

- [字符串](#字符串)

- [双指针法](#双指针法)

- [搜索](#搜索)

### 匹配

- 整数转罗马数字『⽣活中从⼤的位数开始描述数字，因此从⼤的数与字符开始匹配』 [cpp](./vsc_leetcode/12.整数转罗马数字.cpp) 2020.11.27

### 字符串

- 整数转罗马数字『⽣活中从⼤的位数开始描述数字，因此从⼤的数与字符开始匹配』 [cpp](./vsc_leetcode/12.整数转罗马数字.cpp) 2020.11.27

### 双指针法

- 盛最多⽔的容器『因为两个边共同决定了上限，因此将较短边向内移动，抛弃搜索次优解』 [py](./vsc_leetcode/11.盛最多⽔的容

器.py) [cpp](./vsc_leetcode/11.盛最多⽔的容器.cpp) 2020.11.26

### 搜索

- 盛最多⽔的容器『因为两个边共同决定了上限，因此将较短边向内移动，抛弃搜索次优解』 [py](./vsc_leetcode/11.盛最多⽔的容

器.py) [cpp](./vsc_leetcode/11.盛最多⽔的容器.cpp) 2020.11.26

## ⽇期归档

- 2020.11.26 盛最多⽔的容器『因为两个边共同决定了上限，因此将较短边向内移动，抛弃搜索次优解』双指针法搜索 [py]

(./vsc_leetcode/11.盛最多⽔的容器.py) [cpp](./vsc_leetcode/11.盛最多⽔的容器.cpp)

- 2020.11.27 整数转罗马数字『⽣活中从⼤的位数开始描述数字，因此从⼤的数与字符开始匹配』匹配字符串 [cpp]

(./vsc_leetcode/12.整数转罗马数字.cpp)

经过 Markdown 引擎渲染后的效果如下图。

如上，我不但新增了三级标题### 匹配、### 字符串等，还为三级标题创建了⽬录索引链接。

最终程序实现如下图。

Python 与脚本⽂件

这样就要派上我们的 Python 出场了。我觉得这才是 Python 的⽼本⾏：脚本⽂件。记得Python猫曾经有篇⽂章，讲过为什么 Python 中的注释符号是 # ⽽不是 // 。

原因很可能是：Python的⽼本⾏，就是写这⼀个个易⽤的脚本⽂件的，与shell类似。

想想 Python 的特点：解释型语⾔、动态型语⾔、在命令⾏⾥可以⼀条⼀条地输⼊、os.system()可以

直接调⽤命令...所以，拿 Python 来执⾏⼀个个⼩任务(脚本⽂件)再合适不过了。

整体逻辑

逻辑是：先把⽂件读到内存中，以列表list的形式保存

列表list内，每⼀元素对应⼀句话

遍历列表，遇到元素## 归档则其之后的元素按照不同条件取出、分析

直到遇到元素## ⽇期归档，则把其之后的元素按条件取出、分析

细节在代码⾥(代码⽂件refresh.py)，我使⽤汉语标明了。""" """

import os.path as osp

import re

def refreah():

"""

我要处理的⽂件是 README.md

那么我获取其绝对路径

注意这⾥处理的⽂件和代码⽂件处于同⼀⽬录下

"""

dirname = osp.dirname(__file__)

filepath = osp.join(dirname, "README.md")

"""

打开这个⽂件，其变量名是 f

"""

with open(filepath, 'r+', encoding='utf-8') as f: """

将⽂件的内容读到内存 f.read()

"""

content = f.read()

"""

以“换⾏符”/“回车”进⾏字符串分割

这样，row_list 每个元素就是⼀⾏⽂字了

"""

row_list = content.split('\n')

"""

下⾯开始把不同的⽬录对应的条⽬取出

"""

# found the un-packed row

un_packed_rows = []

dict_cata = {}

dict_row_flag = False

date_row_flag = False

dict_row_num = 0

date_row_num = 0

cur_cata = None

for idx, row in enumerate(row_list):

"""

如果到了 ## 归档下⾯

"""

if dict_row_flag:

if "### " in row[:4]:

cur_cata = row[4:]

"""

data_cata 是我们的类别字典，最终效果为

data_cata = {

"匹配": [匹配的第1题, 匹配的第2题, ...],

"字符串": [字符串的第1题, 字符串的第2题, ...],

...

}

"""

dict_cata.setdefault(cur_cata, [])

elif "- " in row[:2] and not re.match('\[.*\]\(.*\)', row[2:]): """

这⾥⽤了⼀个正则

因为索引格式为

- [索引名称](#索引名称)

⽽题⽬格式为

- 题⽬程序⽇期

因此如果仅凭是否以「- 」开头，则难以区分⼆者

因此加了⼀个是否正则匹配 [*](*) 的判断

"""

dict_cata[cur_cata] = [row] + dict_cata[cur_cata]

else:

"""

判断是否到了 ## 归档下⾯

"""

if row == "## 归档":

dict_row_flag = True

dict_row_num = idx + 1

"""

如果到了 ## ⽇期归档下⾯

"""

if date_row_flag:

"""

- uu 是我⾃⼰设的格式

如果题⽬有 uu ，那么这条就是我要⽤脚本加到归档⾥的题⽬"""

if '- uu ' in row[:5]:

un_packed_rows = [row] + un_packed_rows

row_list[idx] = "- " + row[5:]

else:

"""

判断是否到了 ## ⽇期归档下⾯

"""

if row == "## ⽇期归档":

date_row_flag = True

dict_row_flag = False

python中文文档

date_row_num = idx + 1

# pack those rows to "## ⽇期归档"

"""

下⾯是把新题⽬(uu)加到 data_cata 字典中"""

for row in un_packed_rows:

row = row.split(' ')

file_num = 0

file_name = ""

for ele in row:

if re.match('\[.*\]\(.*\)', ele):

file_num += 1

file_name += (ele + ' ')

catas = row[4:-file_num]

for c in catas:

dict_cata.setdefault(c, [])

row_ = '- ' + row[3] + ' ' + file_name + row[2] dict_cata[c].append(row_)

# del file "## 归档"

"""

下⾯是清空 ## 归档的内容

根据 dict_cata 书写新的全部内容

"""

row_list_a = row_list[:dict_row_num]

row_list_c = row_list[date_row_num-2:]

## row_list_b

688IT编程网

python生成文章标题_「懒惰的美德」我用python写了个自动生成给文档生成...

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

python生成文章标题_「懒惰的美德」我用python写了个自动生成给文档生成...

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式