...从pandasdatafram中的列中提取字符串中的数字--688IT编程网

python提取数列数字_从pandasdatafram中的列中提取字符串

中的数字

只要字符串Incorrect_Price保持您在⽰例中呈现的结构(数字不是⽤⽂字表⽰的)，任务就可以相对容易地解决。在

使⽤正则表达式，您可以使⽤similar SO question中的⽅法提取数字部分和可选的“cent”/“cents”或“dollar”/“dollars”。两个主要的区别是，你要的是数值和“美分”或“美元”对，⽽且它们可能不⽌⼀次出现。在import re

def extract_number_currency(value):

prices = re.findall('(?P[\d]*[.]?[\d]{1,2})\s*(?Pcent|dollar)s?', value)

result = 0.0

for value, currency in prices:

partial = float(value)

if currency == 'cent':

result += partial / 100

else:

result += partial

return result

print(extract_number_currency('3 dollars and 49 cent'))3.49

现在，您需要将此函数应⽤于列中所有不正确的值，其中的价格为⽂字。为了简单起见，我在这⾥将其应⽤于所有值(但我相信您将能够处理⼦集)：

^{pr2}$

喂！在

正则表达式的分解'(?P[\d]*[.]?[\d]{1,2})\s*(?Pcent|dollar)s?'

有两个捕获命名为组(?P .... )

正则表达式提取中文字符

第⼀个捕获组(?P[\d]*[.]?[\d]{1,2})捕获：

[\d]-数字

[\d]*-重复0次或更多次

[.]?-后跟可选(?)点

[\d]{1,2}-后跟⼀个重复1到2次的数字

\s*-表⽰0个或更多空⽩

现在第⼆个捕捉组要简单得多：(?Pcent|dollar)

cent|dollar-它归结为要捕获的cent和dollar字符串之间的选择

s?是“cents”或“dollars”的可选复数形式

发表评论

688IT编程网

...从pandasdatafram中的列中提取字符串中的数字

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

...从pandasdatafram中的列中提取字符串中的数字

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式