(SqlServe)关于字符串长度被截断的问题
1. 问题描述
在同步数据时常常会发现⼀个错误:将截断字符串或⼆进制数据。
2. 问题原因
这个问题出现的原因是:要插⼊的数值字段的长度超出了数据库中字段的长度。⽐如:插⼊的字符串字节长度是40,数据库中字段长度设置为了varchar(36)就会报此错误。
3.问题扩展
a. 如何计算字符串长度和字节长度,既:datalength和len区别。
len:返回字符串的长度
datalength:返回字符串的字节长度
select len(convert(varchar(50),N'狮lion')) --5 N''表⽰Unicode格式字符串
select datalength(convert(varchar(50),N'狮lion')) --6
select len(N'狮lion') --5
select datalength(N'狮lion') --10
接下来我们分析⼀下为何会这样.
len返回字符串的字符长度,既:⼀个汉字'狮'+4个字母'lion'=5个字符。每个汉字和字母都占⼀个字符长度。
datalength返回字符串的字节长度。对于字节长度,需要理解:⼀般编码模式下,汉字和英⽂字母所占字节是不⼀样的。⼀般来说,汉字占2个字节,英⽂字符占⼀个字节。⽽对于Unicode编码,汉字和英⽂字母都占2个字节。
讲解⼀下varchar和nvarchar的区别,varchar是普通编码的字符串,nvarchar是Unicode编码的字符串,对应例⼦,就是对汉字'狮'来
说,varchar格式的字符串长度为1,nvarchar格式的字符串长度为2。
len(convert(varchar(50),N'狮lion')) --返回字符长度,'狮lion',⼀共5个字符,varchar格式字符
len(N'狮lion') --返回字符长度,'狮lion',⼀共5个字符,nvarchar格式字符
datalength(convert(varchar(50),N'狮lion')) --返回字节长度,varchar格式字符'狮lion','狮'占2个字节,
--'lion'中每个字母占⽤⼀个字节,共占⽤4个字节
datalength(N'狮lion') --返回字节长度,Unicode格式字符,汉字'狮'占2个字节,
--'lion'中每个字母占⽤2个字节,共占⽤8个字节
b. 如何查看数据库的编码格式。
--查看sqlserver数据库的编码格式
SELECT COLLATIONPROPERTY('Chinese_PRC_Stroke_CI_AI_KS_WS', 'CodePage');
查询结果:
936 简体中⽂GBK
950 繁体中⽂BIG5
437 美国/加拿⼤英语
932 ⽇⽂
949 韩⽂字符串长度和字节
866 俄⽂
65001 unicode UFT-8
c. varchar和char和nvarchar三者的区别
1. char是定长(固定长度),效率⾼于varchar;也就是当你输⼊的字符⼩于你指定的数⽬时,例如:char(8),你输⼊的字符⼩于8时,它会
再后⾯补空值。当你输⼊的字符⼤于指定的数时,它会截取超出的字符。
2. varchar[n]是变长且⾮unicode字符数据类型,n的取值在1到8000之间,该类型英⽂字符占⼀个字节,中⽂字符占两个字节。优点:更
加合理利⽤空间,不会造成过多的浪费。
3. nvarchar[n]是变长且unicode字符数据类型,n的取值在1到4000之间,该类型字符⽆论中英⽂都占取
两个字节
其中varchar和nvarchar两字段分别有字段值:你好hello
那么varchar字段占2×2+5=9个字节的存储空间,⽽nvarchar字段占7×2=14个字节的存储空间。
如字段值只是英⽂可选择varchar,⽽字段值存在较多的双字节(中⽂、韩⽂等)字符时⽤nvarchar

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。