提取特殊字符前面的字段函数--688IT编程网

提取特殊字符前面的字段函数

函数介绍：

本函数旨在提取字符串中特定字符前面的字段，支持提取多个字符前面的字段，并可自定义输出格式。

函数参数：

1. string: 待处理的字符串，类型为str。

2. sep_list: 特定字符列表，类型为list。默认值为[' ', '\t', '\n']，即空格、制表符和换行符。

3. output_format: 输出格式，类型为str。默认值为"{0}"，即只输出提取到的字段。

4. max_length: 输出字段最大长度限制，类型为int。默认值为0，即不做限制。

5. ignore_empty: 是否忽略空字段，类型为bool。默认值为True，即忽略空字段。

函数返回：

返回一个列表，包含所有提取到的字段。

函数实现：

首先我们需要定义一个名为extract_field的函数，并将待处理字符串string、特定字符列表sep_list、输出格式output_format、输出字段最大长度限制max_length和是否忽略空字段ignore_empty作为参数传入该函数中。

def extract_field(string, sep_list=[' ', '\t', '\n'], output_format="{0}", max_length=0, ignore_empty=True):

接下来我们需要定义一个名为fields的列表，并将其初始化为空列表。该列表用于存储所有提取到的字段。

fields = []

接着我们需要使用Python内置模块re中的re.split()方法对待处理字符串string进行分割操作。由于re.split()方法只能接收一个分隔符作为参数，并不能同时处理多个分隔符，因此我们需

要将sep_list中的所有分隔符拼接成一个正则表达式，并将其作为re.split()方法的参数传入其中。

import re

pattern = '|'.join(map(re.escape, sep_list))

split_string = re.split(pattern, string)

接下来我们需要遍历split_string中的每一个元素，并对每个元素进行处理，以提取其中特定字符前面的字段。在遍历过程中，我们需要使用Python内置模块re中的re.search()方法对每个元素进行匹配操作。由于re.search()方法只能匹配第一个符合条件的字符串，并不能同时匹配多个字符串，因此我们需要将sep_list中的所有特定字符拼接成一个正则表达式，并将其作为re.search()方法的参数传入其中。

for s in split_string:

pattern = '|'.join(map(re.escape, sep_list))

字符串函数的length属性

match = re.search(pattern, s)

如果match返回None，则说明该元素中不存在任何特定字符，因此我们可以直接将该元素添加到fields列表中。

if match is None:

fields.append(s)

否则，如果match返回了一个非空值，则说明该元素中存在特定字符。此时我们需要使用Python内置函数slice对该元素进行切片操作，以提取出特定字符前面的字段。切片操作时，我们需要根据特定字符在字符串中出现的位置来确定切片范围。如果该特定字符是字符串开头或结尾处出现，则对应的切片范围需要特殊处理。

else:

index = match.start()

if index == 0:

field = ''

else:

field = s[:index]

if max_length > 0 and len(field) > max_length:

688IT编程网

提取特殊字符前面的字段函数

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

一种任意人头与任意人体的3D结合方法

正则匹配c语言中8进制

fortran数据格式

python中文本转数字用的公式

gh 文本变数值

js判断输入是否为正整数、浮点数等数字的函数代码

qt浮点数正则表达式

QT正则表达式限制输入值

手机号码和电话号码的正则表达式

str转浮点-概述说明以及解释

英豪结尾的诗句

Java正则表达式:符合以特定字符串开头,以特定字符串结尾的所有结果

machinebuilder使用手册

ASP.NET网站建设基本常用代码

LCD显示实时时钟

经纬度正则表达式解析

前端科学计数法转数字

python正则表达式re之compile函数解析

pythonunittest之断言及示例

[lua]lua中匹配字符串小数

最新文章

nginx map用法正则

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

python中re.findall函数实例用法

nginx url表达式

nginx 正则匹配参数

标签列表

688IT编程网

提取特殊字符前面的字段函数

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法 正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

一种任意人头与任意人体的3D结合方法

正则匹配c语言中8进制

fortran数据格式

python中文本转数字用的公式

gh 文本变数值

js判断输入是否为正整数、浮点数等数字的函数代码

qt浮点数正则表达式

QT正则表达式限制输入值

手机号码和电话号码的正则表达式

str转浮点-概述说明以及解释

英豪结尾的诗句

Java正则表达式:符合以特定字符串开头,以特定字符串结尾的所有结果

machinebuilder使用手册

ASP.NET网站建设基本常用代码

LCD显示实时时钟

经纬度正则表达式解析

前端科学计数法转数字

python正则表达式re之compile函数解析

pythonunittest之断言及示例

[lua]lua中匹配字符串小数

最新文章

nginx map用法 正则

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

python中re.findall函数实例用法

nginx url表达式

nginx 正则匹配参数

标签列表

nginx map用法正则

nginx map用法正则