sqlldr导⼊乱码,Oracle客户端字符集问题转⾃:
1,查Oracle数据库创建时候的字符集:
Oracle服务器端执⾏
SQL> select name, value$ from sys.props$ where name like 'NLS%';
NAME VALUE$
------------------------------ ----------------------------------------
NLS_LANGUAGE AMERICAN
NLS_TERRITORY AMERICA
NLS_CURRENCY $
NLS_ISO_CURRENCY AMERICA
NLS_NUMERIC_CHARACTERS .,
NLS_CHARACTERSET UTF8
NLS_CALENDAR GREGORIAN
NLS_DATE_FORMAT DD-MON-RR
NLS_DATE_LANGUAGE AMERICAN
NLS_SORT BINARY
NLS_TIME_FORMAT HH.MI.SSXFF AM
NAME VALUE$
------------------------------ ----------------------------------------
NLS_TIMESTAMP_FORMAT DD-MON-RR HH.MI.SSXFF AM
NLS_TIME_TZ_FORMAT HH.MI.SSXFF AM TZR
NLS_TIMESTAMP_TZ_FORMAT DD-MON-RR HH.MI.SSXFF AM TZR
NLS_DUAL_CURRENCY $
NLS_COMP BINARY
NLS_LENGTH_SEMANTICS BYTE
NLS_NCHAR_CONV_EXCP FALSE
NLS_NCHAR_CHARACTERSET AL16UTF16
NLS_RDBMS_VERSION 10.2.0.4.0
20 rows selected.
确认数据库创建的时候选择的字符集是 UTF-8
.执⾏sql :select userenv('language') from dual; 获取oracle服务端字符集X
SQL> select userenv('language') from dual;
USERENV('LANGUAGE')
-
---------------------------------------------------
SIMPLIFIED CHINESE_CHINA.UTF8
2. 检查执⾏ sqlldr 的客户端的 NLS_LANG 的设置
Oracle 客户端执⾏
[oracle@localhost hx]$ echo $NLS_LANG
AMERICAN_AMERICA.UTF8
3. 尽量让以上3个步骤检查出的字符集设置都⼀致,开始通过 sqlldr 导⼊⽂本,并检查结果。
3. 尽量让以上3个步骤检查出的字符集设置都⼀致,开始通过 sqlldr 导⼊⽂本,并检查结果。
通常出现问题的原因,可分为三种:
1. 服务器指定字符集与客户字符集不同,⽽与加载数据字符集⼀致。
解决⽅法:对于这种情况,只需要设置客户端字符集与服务器端字符集⼀致就可以了
oracle10g UTF8编码:AMERICAN_AMERICA.AL32UTF8
GBK编码:SIMPLIFIED CHINESE_CHINA.ZHS16GBK
客户端修改为中⽂是:在linux的终端上设置环境变量
1.LANG=zh_CN
2.NLS_LANG=zhs16gbk
2. 服务器指定字符集与客户字符集相同,与加载数据字符集不⼀致。
解决⽅法:强制加载数据字符集与服务器端字符集⼀致。
3. 服务器指定字符集与客户字符集不同,与输⼊数据字符集不⼀致。
对于这种情况,⽬前为⽌都还没有太好的解决⽅法。
其中有的时候可以尝试通过 iconv -f utf-8 -t gbk filename
从原字符集 utf-8 转换成 gbk
修改数据库端字符集的⽅法:
1.服务器端字符集的设置和修改:
1.1 创建数据库的时候直接选择正确的字符集(显⽰汉字的字符集主要有
ZHS16CGB231280,US7ASCII,WE8ISO8859P1,ZHS16GBK等)
1.2如果创建的时候没有选择字符集,那么字符集将使⽤默认的字符集.可以使⽤如下命令查看数据库的字符集.⽤oracle的合法⽤户登
录.select * from V$NLS_PARAMETERS.
SQL > select * from V$NLS_PARAMETERS
parameter value
NLS_LANGUAGE AMERICAN
NLS_TERRITORY AMERICA
…. ….
NLS_CHARACTERSET WE8ISO8859P1
NLS_SORT BINARY
NLS_NCHAR_CHARACTERSET WE8ISO8859P1
---- 从上述信息看出ORACLE 数据库的字符集为' WE8ISO8859P1'。
可以⽤update 命令修改数据库的字符集,但是注意:修改字符集可能会对原有数据造成破坏,修改之前⼀定要先备份数据库.命令如下:
⽤户sys 以sysdba的⾝份登录oracle. 字串9
SQL>update props$ set value$=’ZHS16GBK’ where name=’NLS_CHARACTERSET’
如果客户端的字符集和服务器端不相同,就必须修改字符集.否则不能正确的显⽰汉字.⼀般建议修改客户端的字符集.
1.3不同字符集数据库之间的数据导⼊
a)重新安装数据库或者是⽤update命令修改字符集。
b)强⾏修改oracle数据库当前字符集。以sysdba的⾝份登录oracle
SQL > create database character set ZHS16GBK (注:这⾥的字符集为导出数据的字符集)
* create database character set ZHS16GBK
ERROR at line 1:
ORA-01031: insufficient privileges
不⽤理会这个错误,⽤imp 装⼊数据。数据装完后,重启动oracle 数据,select * from V$NLS_PARAMETERS 此时,你会发现,数据库字符集⼜回到原来的字符集。
c)⽤第三⽅⼯具绕开字符集。如powerbuild的pipeline,delphi的datadump,MS access的数据导⼊导出⼯具。
客户端字符集
1、 客户端字符集含义
客户端字符集定义了客户端字符数据的编码⽅式,任何发⾃或发往客户端的字符数据均使⽤客户端定
义的字符集编码,客户端可以看作是能与数据库直接连接的各种应⽤,例如sqlplus,exp/imp等。客户端字符集是通过设置NLS_LANG参数来设定的。
2、NLS_LANG 参数格式
NLS_LANG= Language_ Territory. Client character se
Language: 显⽰oracle消息、校验、⽇期命名
Territory :指定默认⽇期、数字、货币等格式
Client character set :指定客户端将使⽤的字符集
例如: NLS_LANG=AMERICAN_AMERICA.US7ASCII
AMERICAN是语⾔,AMERICA是地区,US7ASCII是客户端字符集
3、 客户端字符集设置⽅法
1)UNIX 环境
$NLS_LANG=“simplified chinese”_china.zhs16gbk
$export NLS_LANG
编辑oracle⽤户的.profile⽂件(或.bash_profile linux)
$ export NLS_LANG="SIMPLIFIED CHINESE"_CHINA.UTF8
2)Windows 环境
编辑注册表
< HKEY_LOCAL_MACHINE---SOFTWARE---ORACLE—HOME0
在DOS名下执⾏:
Set NLS_LANG=“simplified chinese”_china.zhs16gbk
4、 NLS 参数查询
Oracle 提供若⼲NLS参数定制数据库和⽤户机以适应本地格式,例如有NLS_LANGUAGE,NLS_DATE_FORMAT,NLS_CALENDER等,可以通过查询以下数据字典或v$视图查看。
NLS_DATABASE_PARAMETERS-- 显⽰数据库当前NLS参数取值,包括数据库字符集取值
NLS_SESSION_PARAMETERS-- 显⽰由NLS_LANG 设置的参数,或经过alter session 改变后的参数值(不包括由NLS_LANG 设置的客户端字符集)
NLS_INSTANCE_PARAMETE-- 显⽰由参数⽂件a 定义的参数V$NLS_PARAMETERS--显⽰数据库当前NLS参数取值
图1-3 查询NLS参数值
5、 修改NLS参数
使⽤下列⽅法可以修改NLS参数
(1)修改实例启动时使⽤的初始化参数⽂件
(2)修改环境变量 NLS_LANG
(3)使⽤ALTER SESSION语句,在oracle会话中修改
(4)使⽤某些SQL函数
NLS 作⽤优先级别:Sql function>alter session>环境变量或注册表>参数⽂件>数据库默认 SQL*Loader的字符集转换
使⽤SQL*Loader向数据库装载数据,有两种转换字符集的模式
常规路径: 数据被转换为 NLS_LANG 指定的会话字符集或者控制⽂件指定的字符集。
控制⽂件可以指定字符集
SQL*Loader control file:
oracle登录命令LOAD DATA
CHARACTERSET UTF16
INFILE ulcase11.dat
REPLACE …
如果数据⽂件的字符集与NLS_LANG环境变量的字符集不⼀致,SQL*Loader以NLS_LANG指定的字符集编码存⼊数据库。
直接路径: 数据使⽤客户端指⽰被转换.
这样要求数据库的字符集是数据⽂件字符集的超级,否则有可能出现乱码。
乱码问题及解决办法
要在客户端正确显⽰ORACLE数据库中的汉字信息,⾸先必须使客户端的字符集与服务器端的字符集⼀致;其次是加载到ORACLE数据库的数据字符集必须与服务器字符集⼀致。据此,汉字显⽰乱码的问题⼤致可以分为以下⼏种情况:
1、客户端字符集与服务器端字符集不同,服务器端字符集与加载数据字符集⼀致。
如:
以system⽤户登录,创建表,插⼊数据。
这种情况是最常见的,只要把客户端的字符集设置正确即可。具体解决⽅案:
第⼀步:查询V$NLS_DATABASE_PARAMETERS得到服务端的字符集:
SQL>SELECT * FROM V$NLS_DATABASE_PARAMETERS WHERE PARAMETER=’ NLS_CHARACTERSET;
PARAMETER VALUE
-----------------------------------------------------
NLS_CHARACTERSET ZHS16GBK
第⼆步:根据服务端的字符集设定客户端的字符集,设定⽅法参见客户端的字符集的设定⽅式。以LINUX系统为例,可在当前⽤户
的.bash_profile⽂件中增加如下两⾏:
NLS_LANG=SIMPLIFIED Chinese_CHINA.ZHS16GBK
export NLS_LANG
2、客户端字符集与服务器端字符集相同,服务器端字符集与加载数据字符集不⼀致。这种情况⼀般发⽣在ORACLE版本升级或重新安装数据库时选择了与原来数据库不同的字符集,⽽恢复加载的备份数据仍是按原字符集卸出的场合。另⼀种情况是加载从其它使⽤不同字符集的ORACLE数据库卸出的数据。在这两种情况中,不管客户端字符集与服务器端字符集是否⼀致都⽆法正确显⽰汉字。如:
具体解决⽅案:
⽅案⼀:按服务端字符集的修改⽅法修改服务端字符集与加载数据字符集⼀致,然后导⼊数据。
⽅案⼆:利⽤数据格式转储,避开字符集带来的问题。即先将加载数据倒⼊到与其字符集⼀致的数据库中,然后再将数据要么按⽂本格式导出(数据量较⼩的情况下),要么通过第三⽅⼯具(如POWER BUILDER,ACCESS,FOXPRO等)倒出数据,最后将倒出的数据导⼊到⽬标数据库中。
3、客户端字符集与服务器端字符集不同,服务端字符集与输⼊数据字符集不同。这种情况是在客户端字符集与服务器端字符集不⼀致时,从客户端输⼊了汉字信息。输⼊的这些信息即便是把客户端字符集更改正确,也⽆法显⽰汉字。
解决⽅案:修改客户端字符集与服务端字符集⼀致后,重新输⼊数据。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论