postgresql中position函数的性能详解--688IT编程网

postgresql中position函数的性能详解

起因：

postgresql中position函数提供从头查返回第⼀个匹配到字符串的下标。

⽽我需要返回从后向前查第⼀个匹配到的坐标，但是postgressql并未提供相关函数，所以⾃⼰写了如下代码提供相关功能：

CREATE OR REPLACE FUNCTION lastindexof(text, character)

RETURNS integer AS

$BODY$

begin

if $1 is null then return NULL;

end if;

for i in reverse length($1) .. 1

loop

if substr($1,i,1) = $2

then

return i;

end if;

end loop;

return NULL;

end

$BODY$

LANGUAGE plpgsql IMMUTABLE STRICT

本来以为事情完美解决，但是性能的差距却让⼈感觉很失望，如下图

数据库原⽣的“position”和⾃⼰提供“lastindexof”，居然产⽣了30倍以上的性能差距，那么探究缘由就变成⼀个有意思的事情。也算第⼀次尝试翻阅数据库源码，中间总是有点⼩⿇烦，不过当我到如下代码的时候，那种恍然⼤悟的欣喜也算满⾜了⾃⼰求知欲。

注意看1054⾏，运⽤了指针~ 可见数据库底层运算，⽤了引⽤传递，⽽我⾃⼰写的函数是⼀个拷贝传递。

原因到了，解决问题也就⼿到擒来，拿C写⼀个扩展？或者？

本可以拿C写⼀些底层代码练练⼿，不过那⼜需要重新编译等等，时间有限，留给以后去做吧，先想个简单的办法去解决它。解决⽅法如下

select length(dir) -position('/' in reverse(dir)) +1 from log_hup_ftp_30

测试性能截图字符串函数详解

好吧，虽然由于函数的复杂性增加，性能还是慢了⼀倍多，但是⽐起之前5s之久还是快了不少。

tips:

最近得到德哥的回答，引⽤传递可以使⽤游标类型！再次谢谢德哥~

补充： SQL之查询函数LOCATE、POSITION、INSTR、FIND_IN_SET、IN、LIKE

LOCATE()

返回要查询的字符串在被查询字符串⾥第⼀次出现的位置

注：当在 MySQL 4.0 中时，如有任⼀参数是⼀个⼆进制字符串，它才是字母⼤⼩写敏感的

LOCATE(substr,str)

返回substr字符串在str⾥第⼀次出现的位置，没有返回0

SELECT LOCATE('.',t.str)FROM `table` t;

LOCATE(substr,str,pos)

返回substr字符串在str⾥pos（起始位置）出现的位置，没有返回0

注：pos必须⼤于第⼀次出现的位置，才能显⽰第⼆次出现的位置

SELECT LOCATE('.',t.str,6)FROM `table` t;

>9//当⼩于等于第⼀次出现的位置（5）时，返回的还是第⼀次出现的位置

POSITION()

返回要查询的字符串在被查询字符串⾥第⼀次出现的位置（和locate⽤法⼀样，查了很多资料position是locate的别名）POSITION(substr IN str)

返回substr字符串在str出现的位置，没有返回0

SELECT POSITION('cn' IN t.str)FROM `table` t;

>10

INSTR()

返回要查询的字符串在被查询字符串⾥第⼀次出现的位置。这和LOCATE()的双参数形式相同，只是参数的顺序被颠倒。INSTR(str,substr)

返回substr字符串在str出现的位置，没有返回0

SELECT INSTR(t.str,'com')FROM `table` t;

FIND_IN_SET()

返回在集合中的索引位置（竖向发展）

FIND_IN_SET(str,strlist)

返回str1在strlist集合中的索引位置

SELECT FIND_IN_SET('demo',t.str) FROM `table` t;

>1//返回索引

IN()

返回在集合中的索引位置（同FIND_IN_SET）

str IN (strlist)

返回str1在strlist集合中的索引位置

SELECT 'demo' IN(t.str) FROM `table` t;

>1//返回索引

返回类似(模糊)字符的集合

LIKE %str%

返回以str类似的集合

以上为个⼈经验，希望能给⼤家⼀个参考，也希望⼤家多多⽀持。如有错误或未考虑完全的地⽅，望不吝赐教。

688IT编程网

postgresql中position函数的性能详解

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

postgresql中position函数的性能详解

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式