解决UNICODE字符集下CStdioFile的Wr--688IT编程网

解决UNICODE字符集下

CStdioFile的Wr

以下代码文件以CStdioFile向无法向文本中写入中文(用查看不到写入的中文)

CStdioFile file；

file.Open(…)；

file.WriteString(_T("abc你好"))；//只能写入abc

解决办法：

使用setlocale语句设定区域

#include locale//头文件

CStdioFile file；

file.Open(…)；

char*old_locale=_strdup(setlocale(LC_CTYPE,NULL))；

setlocale(LC_CTYPE,"chs")；//设定

file.WriteString(_T("abc你好"))；//正常写入

setlocale(LC_CTYPE,old_locale)；

free(old_locale)；//还原区域设定

简化处理可以仅使用语句setlocale(LC_CTYPE,"chs")。

setlocale：

函数原形为：char*setlocale(int category,const char*locale)；

头文件：locale.h

所支持的操作系统为：ANSI,Win 95,Win NT

对于简体中文可以使用如下设置：setlocale(LC_ALL,"chs")；

为什么一定要调用setlocale呢?

因为在C/C++语言标准中定义了其运行时的字符集环境为"C"，也就是ASCII字符集的一个子集，那么mbstowcs在工作时会将cstr中所包含的字符串看作是ASCII编码的字符，而不认为是一个包含有chs编码的字符串，所以他会将每一个中文拆成2个ASCII编码进行转换，这样得到的结果就是会形成4个wchar_t的字符组成的串，那么如何才能够让mbstowcs正常工作呢?在调用mbstowcs进行转换之间必须明确的告诉mbstowcs目前cstr串中包含的是chs编码的字符串，通过setlocale(LC_ALL,"chs")函数调用来完成，需要注意的是这个函数会改变整个应用程序的字符集编码方式，必须要通过重新调用setlocale(LC_ALL,"C")函数来还原，这样就可以保证mbstowcs在转换时将cstr中的串看作是中文串，并且转换成为2个wchar_t字符，而不是4个。

本地化设置需要具备三个条件：

a.语言代码(Language Code)

b.国家代码(Country Code)

c.编码(Encoding)

本地名字可以用下面这些部分来构造：

语言代码_国家代码.编码比如(zh_CN.UTF-8,en_US等)

locale的别名表见/usr/lib/X11/locale/locale.alias(以Debian

GNU/Linux为例)

setlocale语言字符串参考

本文来自CSDN博客，转载请标明出处：另外还有一种方法就是重新写CStdioFile的派生类CStdioFileEx(网上有)。

//好像C++中没有类能够读些Unicode格式的文本文件，所以我写了下面这个类。用法很简单，大家尝试几下就明白了。

#pragma once class CStdioFileEx：public CStdioFile

{

public：

CStdioFileEx()；

CStdioFileEx(LPCTSTR lpszFileName,UINT nOpenFlags)；

virtual BOOL Open(LPCTSTR lpszFileName,UINT

nOpenFlags,CFileException*pError=NULL)；

virtual BOOL ReadString(CString&rString)；

BOOL ReadWideString(CStringW&rString)；

BOOL ReadAnsiString(CStringA&rString)；

virtual void WriteString(LPCTSTR lpsz)；

void WriteWideString(LPCWSTR lpsz)；

void WriteAnsiString(LPCSTR lpsz)；

bool IsUnicodeFormat(){return m_bIsUnicodeText；}

unsigned long GetCharCount()；

/Additional flag to allow Unicode text format writing

enum{modeWriteUnicode=0x 100000}；

static bool IsFileUnicode(const CString&sFilePath)；

protected：

UINT PreprocessFlags(const CString&sFilePath,UINT&nOpenFlags)；

bool m_bIsUnicodeText；

}；

//。cpp文件

#include"stdafx.h"

#include"StdioFileEx.h"

//在UCS编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，

//所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样

//如果接收者收到FEFF，就表明这个字节流是Big-Endian的；如果收到FFFE，就表明这个字节流是Little-Endian的。

unicode所有字符//因此字符"ZERO WIDTH NO-BREAK SPACE"又被称作BOM。

//UTF-8不需要BOM来表明字节顺序，但可以用BOM来表明编码方式。字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8编码是

//EF BB BF。所以如果接收者收到以EF BB BF开头的字节流，就知道这是UTF-8编码了。

//Windows就是使用BOM来标记文本文件的编码方式的。

//有些老的浏览器和文本编辑器不支持BOM。

#define UNICODE_BOM 0xFEFF//Unicode"byte order mark"which goes at start of file CStdioFileEx：CStdioFileEx()：CStdioFile()

{

m_bIsUnicodeText=false；

}

CStdioFileEx：CStdioFileEx(LPCTSTR lpszFileName,UINT nOpenFlags)

：

CStdioFile(lpszFileName,PreprocessFlags(lpszFileName,nOpenFlags))

{

}

BOOL CStdioFileEx：Open(LPCTSTR lpszFileName,UINT

nOpenFlags,CFileException*pError/*=NULL*/)

{

PreprocessFlags(lpszFileName,nOpenFlags)；

return CStdioFile：Open(lpszFileName,nOpenFlags,pError)；

}

BOOL CStdioFileEx：ReadString(CString&rString)

{

#ifdef _UNICODE return ReadWideString(rString)；

#else return ReadAnsiString(rString)；

688IT编程网

解决UNICODE字符集下CStdioFile的Wr

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

解决UNICODE字符集下CStdioFile的Wr

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式