SQL语句——18、正则表达式函数--688IT编程网

元字

符

字符含义举例说明^

匹配字符串的开始位置(在[]中使⽤，此时它表⽰不接受该字符集合。^a ：匹配以a 开始的字符串

[^a]：匹配不含a 的字符串-当使⽤在a-m 表⽰范围；当使⽤在第⼀个字符时表⽰连字符串，如[-abc]

匹配字符结束位置

‘a$'：匹配以a 结束的字符串.匹配除换⾏符 n 之外的任何单字符。

匹配前⾯的⼦表达式零次或⼀次tr(y(ing)?)：可以表⽰try 或者trying *匹配前⾯的⼦表达式零次或多次 +匹配前⾯的⼦表达式⼀次或多次

()

标记⼀个⼦表达式的开始和结束位置

a(b)*可以匹配

ab,abb,abbb,youabb (c|d)匹配c 或d

[]标记⼀个中括号表达式

[cd]匹配选择c 或d 等同于

(c|d)。匹配的是单字符，[^cd]是匹配c,d 之外的

单字符。

[a-z]表⽰所有⼩写字母

{m,n}m= <；出现次数 <=n ，'{m}'表⽰出现m 次，'{m,}'表⽰⾄少出现m 次。

|表⽰或者的关系。指明两项之间的⼀个选择

字符簇字符含义[[:alpha:]]任何字母[[:digit:]]任何数字

[[:alnum:]]任何字母和数[[:space:]]任何空⽩字符[[:upper:]]任何⼤写字母[[:lower:]]任何⼩写字母[[:punct:]]任何标点符号

[[:xdigit:]]

任何16进制的数字，相当于[0-9a-fA-F]

SQL 语句——18、正则表达式函数

Oracle 正则表达式(regularexpression)

regexp_like('S','RE','O')

S 被搜索的字符串或者列表达式RE 正则内容O 参数(可选)

idle>select ename from emp where regexp_like(ename,'S');

ENAME

----------

SMITH

JONES

SCOTT

ADAMS

JAMES

idle>select ename from emp where regexp_like(ename,'^S.*T');

ENAME

----------

SMITH

SCOTT

idle>

idle> idle>select ename from emp where regexp_like(ename,'^s.*T$','i')；忽略⼤⼩写

ENAME

---------

SCOTT

regexp_replace(S,'RE','NEW')

idle>select ename,regexp_replace(ename,'S..T','=') aaa from emp where regexp_like (ename,'S..T');

ENAME AAA

---------- ----------

SMITH =H

SCOTT =T

复杂⽤法

SELECT REGEXP_REPLACE(

'Ellen Hildi Smith',

'(.*) (.*) (.*)', '\3, \1 \2')

FROM dual

REGEXP_REPLACE('EL

------------------

Smith, Ellen Hildi

该SQL 语句显⽰了⽤圆括号括住的三个单独的⼦表达式。每⼀个单独的⼦表达式包含⼀个匹配元字符(.)，并紧跟着* 元字符，表⽰任何字符（除换⾏符之外）都必须匹配零次或更多次。空格将各个⼦表达式分开，空格也必须匹配。圆括号创建获取值的⼦表达式，并且可以⽤\digit 来引⽤。第⼀个⼦表达式被赋值为\1 ，第⼆个\2，以此类推。这些后向引⽤被⽤在这个函数的最后⼀个参数 (\3, \1 \2) 中，这个函数有效地返回了替换⼦字符串，并按期望的格式来排列它们（包括逗号和空格）。表 11 详细说明了该正则表达式的各个组成部分。

REGEXP_COUNT

在Oracle的11g版本中引⼊，使⽤该函数可以统计字符串出现的次数。

REGEXP_COUNT (source_char, pattern [, position [, match_param]])

source_char：需要进⾏正则处理的字符串

pattern：进⾏匹配的正则表达式

position：起始位置，从第⼏个字符开始正则表达式匹配（默认为1）

match_param：模式（‘i’ ⽤于不区分⼤⼩写的匹配

‘c’ ⽤于区分⼤⼩写的匹配

‘n’ 允许句点(.)作为通配符去匹配换⾏符。如果省略该参数，则句点将不匹配换⾏符

‘m’ 将源串视为多⾏。即Oracle 将^和$分别看作源串中任意位置任何⾏的开始和结束，⽽不是仅仅看作整个源串的开始或结束。如果省略该参数，则Oracle将源串看作⼀⾏。

‘x’ 忽略空格字符。默认情况下，空格字符与⾃⾝相匹配。

如果为match_param 指定了多个相互⽭盾的值，那么Oracle 使⽤最后⼀个值。

）

REGEXP_SUBSTR

function REGEXP_SUBSTR(String, pattern, position, occurrence, modifier)

String：需要进⾏正则处理的字符串

pattern：进⾏匹配的正则表达式

position：起始位置，从第⼏个字符开始正则表达式匹配（默认为1）

occurrence：标识第⼏个匹配组，默认为1modifier：模式（'i'不区分⼤⼩写进⾏检索，'c'区分⼤⼩写进⾏检索，默认为'c'）

例1：查询使⽤正则分割后的第⼀个值，也就是17

SELECT REGEXP_SUBSTR('17,20,23','[^,]+',1,1,'i') AS STR FROM DUAL;

STR

-----

例2：查询使⽤正则分割后的最后⼀个值，也就是23

SELECT REGEXP_SUBSTR('17,20,23','[^,]+',1,3,'i') AS STR FROM DUAL;

STR

----

例3：将字符串拆成⾏

select regexp_substr('17,20,23','[^,]+',1,level) AS STR

from dual

connect by level<=regexp_count('17,20,23',',')+1

STR

----

例4：当表（多⾏数据）作为数据源时，将表中的某字段转换为⾏，将会出现笛卡尔乘积。

SELECT lpad('~',(LEVEL-1)*5,'~')||CKJYM1 CKJYM1,LEVEL,regexp_substr(CKJYM1,'[^,]+',1,level) CKJYM

FROM (SELECT'B10,B04' CKJYM1

FROM dual

union all

SELECT'B11,B12' CKJYM1

FROM dual ) T

CONNECT BY LEVEL<= REGEXP_COUNT(CKJYM1,'B')

CKJYM1 LEVEL CKJYM

--------------------- ------------- ----------

B10,B04 1 B10

~~~~~B10,B04 2 B04

~~~~~B11,B12 2 B12

B11,B12 1 B11

sql语句替换表中内容~~~~~B10,B04 2 B04

~~~~~B11,B12 2 B12

CONNECT BY相当于是⼀个递归的⾃连接，不断地把每层的连接结果叠加到结果集中。两层之间的连接条件和递归出⼝写在CONNECT BY中。

在这⾥数据并⽆⽗⼦关系，只是要让同⼀⾏数据重复出现。因此我们的连接的条件只⽤到了表的主键CKJYM1=PRIOR CKJYM1, 此外再⽤LEVEL控制层数作为递归出⼝，就可以获得想要的数据。但OR

ACLE有个检查，如果你有前后连接条件(CKJYM1=PRIOR CKJYM1)，当同⼀⾏数据再次出现，它就会报⼀个错：ORA-01436: CONNECT BY loop in user data

为了欺骗它，这⾥⽤了⼀个PRIOR DBMS_RANDOM.VALUE(相当于获取随机数), 因为DBMS_RANDOM.VALUE每次调⽤都返回不同结果，所以它认为两⾏数据不⼀样，所以不报错了。

所以sql应改为：

SELECT lpad('~',(LEVEL-1)*5,'~')||CKJYM1 CKJYM1,LEVEL,regexp_substr(CKJYM1,'[^,]+',1,level) CKJYM FROM (SELECT'B10,B04' CKJYM1

FROM dual

union all

SELECT'B11,B12' CKJYM1

FROM dual ) T

CONNECT BY LEVEL<=

REGEXP_COUNT(CKJYM1,'B')

and CKJYM1=PRIOR CKJYM1

and prior dbms_random.value is not null

CKJYM1 LEVEL CKJYM

------------ -------- ----------

B10,B04 1 B10

~~~~~B10,B04 2 B04

B11,B12 1 B11

~~~~~B11,B12 2 B12

688IT编程网

SQL语句——18、正则表达式函数

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

688IT编程网

SQL语句——18、正则表达式函数

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林 的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

随机森林的算法