字符函数——返回字符值
这些函数全都接收的是字符族类型的参数(CHR除外)并且返回字符值.
除了特别说明的之外,这些函数大部分返回VARCHAR2类型的数值.
字符函数的返回类型所受的限制和基本数据库类型所受的限制是相同的。
字符型变量存储的最大值:
VARCHAR2数值被限制为2000字符(ORACLE 8中为4000字符)
CHAR数值被限制为255字符(在ORACLE8中是2000)
long类型为2GB
Clob类型为4GB
1、CHR
语法: chr(x)
功能:返回在数据库字符集中与X拥有等价数值的字符。CHR和ASCII是一对反函数。经过CHR转换后的字符再经过ASCII转换又得到了原来的字
符。
使用位置:过程性语句和SQL语句。
2、CONCAT
语法: CONCAT(string1,string2)
功能:返回string1,并且在后面连接string2。
使用位置:过程性语句和SQL语句。
3、INITCAP
语法:INITCAP(string)
功能:返回字符串的每个单词的第一个字母大写而单词中的其他字母小写的string。单词是用.空格或给字母数字字符进行分隔。不是字母的
字符不变动。
使用位置:过程性语句和SQL语句。
4、LTRIM
语法:LTRIM(string1,string2)
功能:返回删除从左边算起出现在string2中的字符的string1。String2被缺省设置为单个的空格。数据库将扫描string1,从最左边开始。当
遇到不在string2中的第一个字符,结果就被返回了。LTRIM的行为方式与RTRIM很相似。
使用位置:过程性语句和SQL语句。
5、NLS_INITCAP
语法:NLS_INITCAP(string[,nlsparams])
功能:返回字符串每个单词第一个字母大写而单词中的其他字母小写的string,nlsparams
指定了不同于该会话缺省值的不同排序序列。如果不指定参数,则功能和INITCAP相同。Nlsparams可以使用的形式是:
‘NLS_SORT=sort'
这里sort制订了一个语言排序序列。
使用位置:过程性语句和SQL语句。
例子:
select NLS_INITCAP('ABCD') from dual;
---
Abcd
*********
select NLS_INITCAP('abcd') from dual;
---
Abcd
6、NLS_LOWER
语法:NLS_LOWER(string[,nlsparams])
功能:返回字符串中的所有字母都是小写形式的string。不是字母的字符不变。
Nlsparams参数的形式与用途和NLS_INITCAP中的nlsparams参数是相同的。如果nlsparams没有被包含,那么NLS_LOWER所作的处理和
LOWER相同。
使用位置;过程性语句和SQL语句。
7、NLS_UPPER
语法:nls_upper(string[,nlsparams])
功能:返回字符串中的所有字母都是大写的形式的string。不是字母的字符不变。nlsparams参数的形式与用途和NLS_INITCAP中的相同。如果
没有设定参数,则NLS_UPPER功能和UPPER相同。
使用位置:过程性语句和SQL语句。
8、REPLACE
语法:REPLACE(string,search_str[,rep
lace_str])
功能:把string中的所有的子字符串search_str用可选的replace_str替换,如果没有指定replace_str,所有的string中的子字符串
search_str都将被删除。REPLACE是TRANSLATE所提供的功能的一个子集。
使用位置:过程性语句和SQL语句。
9、RPAD
语法:RPAD(string1,x[,string2])
功能:返回在X字符长度的位置上插入一个string2中的字符的string1。如果string2的长度要比X字符少,就按照需要进行复制。如果string2
多于X字符,则仅string1前面的X各字符被使用。如果没有指定string2,那么使用空格进行填充。X是使用显示长度可以比字符串的实际长度
要长。RPAD的行为方式与LPAD很相似,除了它是在右边而不是在左边进行填充。
使用位置:过程性语句和SQL语句。
例子:
select RPAD('123456789',18,'abc') from dual;
----
123456789abcabcabc
10、RTRIM
语法: RTRIM(string1,[,string2])
功能: 返回删除从右边算起出现在string1中出现的字符string2. string2被缺省设置为单个的空格.数据库将扫描string1,从右边开始.当遇
到不在string2中的第一个字符,结果就被返回了RTRIM的行为方式与LTRIM很相似.
使用位置:过程性语句和SQL语句。
例子:
select RTRIM('123456789','56789') from dual;
----
1234
11、SOUNDEX
语法: SOUNDEX(string)
功能: 返回string的声音表示形式.这对于比较两个拼写不同但是发音类似的单词而言很有帮助.
使用位置:过程性语句和SQL语句。
12、SUBSTR
语法: SUBSTR(string,a[,b])
功能: 返回从字母为值a开始b个字符长的string的一个子字符串.如果a是0,那么它就被认为从第一个字符开始.如果是正数,返回字符是从左
边向右边进行计算的.如果b是负数,那么返回的字符是从string的末尾开始从右向左进行计算的.如果b不存在,那么它将缺省的设置为整个字符
串.如果b小于1,那么将返回NULL.如果a或b使用了浮点数,那么该数值将在处理进行以前首先被却为一个整数.
使用位置:过程性语句和SQL语句。
13、TRANSLATE
语法: TRANSLATE(string,from_str,to_str)
功能: 返回将所出现的from_str中的每个字符替换为to_str中的相应字符以后的string. TRANSLATE是REPLACE所提供的功能的一个超集.
如果from_str比to_str长,那么在from_str中而不在to_str中而外的字符将从string中被删除,因为它们没有相应的替换字符. to_str不能为空
.Oracle把空字符串认为是NULL,并且如果TRANSLATE中的任何参数为NULL,那么结果也是NULL.
使用位置:过程性语句和SQL语句。
14、UPPER
语法: UPPER(string)
功能: 返回大写的string.不是字母的字符不变.如果string是CHAR数据类型的,那么结果也是CHAR类型的.如果string是VARCHAR2类型的,那么
结果也是V
ARCHAR2类型的.
使用位置: 过程性语句和SQL语句。
字符函数——返回数字
这些函数接受字符参数回数字结果.参数可以是CHAR或者是VARCHAR2类型的.尽管实际下许多结果都是整数值,但是返回结果都是简单的NUMBER
类型的,没有定义任何的精度或刻度范围.
16、ASCII
语法: ASCII(string)
功能: 数据库字符集返回string的第一个字节的十进制表示.请注意该函数仍然称作为ASCII.尽管许多字符集不是7位ASCII.CHR和ASCII是互为
相反的函数.CHR得到给定字符编码的响应字符. ASCII得到给定字符的字符编码.
使用位置: 过程性语句和SQL语句。
17、INSTR
语法: INSTR(string1, string2[a,b])
功能: 得到在string1中包含string2的位置. string1时从左边开始检查的,开始的位置为a,如果a是一个负
数,那么string1是从右边开始进行
扫描的.第b次出现的位置将被返回. a和b都缺省设置为1,这将会返回在string1中第一次出现string2的位置.如果string2在a和b的规定下没有
到,那么返回0.位置的计算是相对于string1的开始位置的,不管a和b的取值是多少.
使用位置: 过程性语句和SQL语句。
18、INSTRB
语法: INSTRB(string1, string2[a,[b]])
功能: 和INSTR相同,只是操作的对参数字符使用的位置的是字节.
使用位置: 过程性语句和SQL语句。
19、LENGTH
语法: LENGTH(string)
功能: 返回string的字节单位的长度.CHAR数值是填充空格类型的,如果string由数据类型CHAR,它的结尾的空格都被计算到字符串长度中间.
如果string是NULL,返回结果是NULL,而不是0.
使用位置: 过程性语句和SQL语句。
20、LENGTHB
语法: LENGTHB(string)
功能: 返回以字节为单位的string的长度.对于单字节字符集LENGTHB和LENGTH是一样的.
使用位置: 过程性语句和SQL语句。
21、NLSSORT
语法: NLSSORT(string[,nlsparams])
功能: 得到用于排序string的字符串字节.所有的数值都被转换为字节字符串,这样在不同数据库之间就保持了一致性. Nlsparams的作用和
NLS_INITCAP中的相同.如果忽略参数,会话使用缺省排序.
使用位置: 过程性语句和SQL语句。
oracle 几个特殊函数dump()、convert()、substrb()、lengthb()
2011年01月14日 星期五 下午 8:43
一、DUMP()函数
DUMP(w[,x[,y[,z]]])
【功能】返回数据类型、字节长度和在内部的存储位置.
【参数】
w为各种类型的字符串(如字符型、数值型、日期型……)
x为返回位置用什么方式表达,可为:8,10,16或17,分别表示:8/10/16进制和字符型,默认为10。
y和z决定了内部参数位置
【返回】类型 <[长度]>,符号/指数位 [数字1,数字2,数字3,......,数字20]
如:Typ=2 Len=7: 60,89,67,45,23,11,102
SELECT DUMP('ABC',1016) FROM dual;
返回结果为:Typ=96 Len=3 CharacterSet=ZHS16GBK: 41,42,43
代码 数据类型
0 对应 VARCHAR2
1 对应 NUMBER
8 对应 LONG
12 对应 DATE
23 对应 RAW
24 对应 LONG RAW
69 对应 ROWID
96 对应 CHAR
106 对应 MSSLABEL
各位的含义如下:
1.类型: Number型,Type=2 (类型代码可以从Oracle的文档上查到)unicode字符的种类有
2.长度:指存储的字节数
3.符号/指数位
在存储上,Oracle对正数和负数分别进行存储转换:
正数:加1存储(为了避免Null)
负数:被101减,如果总长度小于21个字节,最后加一个102(是为了排序的需要)
指数位换算:
正数:指数=符号/指数位 - 193 (最高位为1是代表正数)
负数:指数=62 - 第一字节
4.从<;数字1>开始是有效的数据位
从<;数字1>开始是最高有效位,所存储的数值计算方法为:
将下面计算的结果加起来:
每个<;数字位>乘以100^(指数-N) (N是有效位数的顺序位,第一个有效位的N=0)
5、举例说明
SQL> select dump(123456.789) from dual;
返回:Typ=2 Len=6: 195,13,35,57,79,91
<;指数>: 195 - 193 = 2
<;数字1> 13 - 1 = 12 *100^(2-0) 120000
<;数字2> 35 - 1 = 34 *100^(2-1) 3400
<;数字3> 57 - 1 = 56 *100^(2-2) 56
<;数字4> 79 - 1 = 78 *100^(2-3) .78
<;数字5> 91 - 1 = 90 *100^(2-4) .009
123456.789
SQL> select dump(-123456.789) from dual;
返回:Typ=2 Len=7: 60,89,67,45,23,11,102
算法:
<;指数> 62 - 60 = 2(最高位是0,代表为负数)
<;数字1> 101 - 89 = 12 *100^(2-0) 120000
<;数字2> 101 - 67 = 34 *100^(2-1) 3400
<;数字3> 101 - 45 = 56 *100^(2-2) 56
<;数字4> 101 - 23 = 78 *100^(2-3) .78
<;数字5> 101 - 11 = 90 *100^(2-4) .009
123456.789(-)
现在再考虑一下为什么在最后加102是为了排序的需要,-123456.789在数据库中实际存储为
60,89,67,45,23,11
而-123456.78901在数据库中实际存储为
60,89,67,45,23,11,91
可见,如果不在最后加上102,在排序时会出现-123456.789<-123456.78901的情况。
二、substrb函数
substr和substrb
以前知道有substrb,lengthb等函数,也知道它们是以byte来计算长度,可没用过,也不太明白什么地方需要用到它们。一直就是用substr,length,以字符来计算长度,在我看来varchar2和char里面存的都是字符,那么自然也就不可能以byte为单位来计算长度,也就用不到这些函数了,但事实证明我错了。最近有个procedure出错,往表里insert时总是报1401错误,看了一下程序,觉得问题很奇怪,目标表出错字段的长度是50,insert的对应这个字段的取法也是substr(**,1,50),怎么会出错呢?有些怀疑是汉字字符为双字节的原因,于是试着将substr(**,1,50)改为了substr(**,1,25),果然ok。上
网原因,在asktom上到了解答。
数据库里的varchar2和char字段长度定义是有两种方式,按字节或按字符,按字节定义长度的方式是varchar2(n byte)或者char(n byte),这也是缺省的长度定义方式,也就是说,平时我们用到的varchar2(n)或者char(n)都是按字节定义长度的,按字符定义长度的方式是varchar2(n char)或者char(n char),这样的定义方式可以确保字段有足够的空间储存需要的字符,无论这些字符的长度是多少字节。我们遇到的这个错误的原因在于,数据库的字符集是多字节字符集,也就是说中文字符占多个字节,而源字段的内容都是中文,这样substr(**,1,50)的字节长度可能达到100,自然超过了目标表字段中的50了。
总结一些经验和教训,觉得在建表之前,如果某个字段需要储存中文的话,最好明确一下字段需要的长
度是否是按字符来决定的。如果是按字符并且数据库字符集为多字节,那建表时就应该采取按字符定义长度的方式来定义该字段的长度。
一个汉字有几个字节?
依据编码形式:
GB-231280 编码为 2个字节(Byte) 包含了 20902 个汉字,其编码范围是 0x8140-0xfefe。
GB18030-2000(GBK2K) 在 GBK 的基础上进一步扩展了汉字,增加了藏、蒙等少数民族的字形。编码是变长的,其二字节部分与 GBK 兼容;四字节部分是扩充的字形、字位,其编码范围是首字节 0x81-0xfe、二字节0x30-0x39、三字节 0x81-0xfe、四字节0x30-0x39
Unicode 范围一般所用为\U0000-\UFFFF,对于CJK EXT B区汉字,范围大于\U20000
UTF, 按其基本长度所用位数分为UTF-8/16/32。其中:
UTF-8是变长编码,每个Unicode代码点按照不同范围,可以有1-3字节的不同长度。
UTF-16长度相对固定,只要不处理大于\U200000范围的字符,每个Unicode代码点使用16位即2字节表示,超出部分使用两个UTF-16即4字节表示。按照高低位字节顺序,又分为UTF-16BE/UTF-16LE。
UTF-32长度始终固定,每个Unicode代码点使用32位即4字节表示。按照高低位字节顺序,又分为UTF-32BE/UTF-32LE。
一般用GB-231280 ,所以大多数情况下是占2个字节。
substrb等函数因字符集不同所造成的差异技术经验随笔
以前一直都是认为英文字母,数字及其他特殊字符占一个字节,汉字占两个字节.但是最近在oracle数据库中编程时使用的substrb出现了错误.
substrb函数是按字节截取特定长度的字符串.而我使用后却得不到想要的结果,原因就出在了字符串中的汉字上了.
接着,我便进行了测试.结果如下:
substrb('大小abc',1,3) 结果为: '大'
substrb('大小abc',1,4) 结果为: '大 ' (包含一个空格)
substrb('大小abc',1,5) 结果为: '大 ' (包含两
个空格)
substrb('大小abc',1,6) 结果为: '大小'
通过以上结果可推断,数据库中把一个汉字当成三个字节了.而在论坛上其他网友的测试结果却是汉字占的两个字节.后来才知道,我的数据库选择的字符集是utf-8的形式,这个字符集汉字会表示为多于两个字节.由此可知,其他关于对字节操作的函数处理汉字时也应该会有以上的问题,例如lengthb函数.看来以后要多多注意了.
另外,不同字符集设置对于用同一个函数处理汉字字符串可能会得出不同结果.在网上搜了一会儿关于不同字符集其各自定义的汉字所占字节数的总结.结果没有满意的答案,都很零碎.以后有时间再吧.
三、convert() 函数
oracle sql如何把us7ascii的字符串编码转换为utf8或者gb2312编码
用CONVERT(char, dest_char_set [,source_char_set] )函数
windows 可以直接修改 HKEY_LOCAL_MACHINE\SOFTWARE\ORACLE\KEY_OraDb10g_home1 nls_lang值为
SIMPLIFIED CHINESE_CHINA.ZHS16GBK
或使用convert 函数
SQL code
SQL> select CONVERT(datatype, 'US7ASCII' ) from BSTH_SYS_FIELD_ALIAS;
CONVERT(DATATYPE,'US7ASCII')
--------------------------------------------------------------------------------
gfdfghdf
??
SQL> select CONVERT(datatype, 'ZHS16GBK' ) from BSTH_SYS_FIELD_ALIAS;
CONVERT(DATATYPE,'ZHS16GBK')
--------------------------------------------------------------------------------
gfdfghdf
中文
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论