C++获取字符串中的中文、英文、数字等--688IT编程网

C++获取字符串中的中⽂、英⽂、数字等

在 C++ 编程中经常处理 Unicode 编码的字符串，Unicode 通常⽤两个字节表⽰⼀个字符，原有的英⽂编码从单字节变成双字节，只需要把⾼字节全部填为 0 就可以。每⼀个字符在 Unicode 编码表中对应为⼀个编号。例如：B 对应 0042

在 Unicode 编码表中:

数字的编码范围为：0x0030 - 0x0039，⼩写英⽂字母的范围：0x0061 - 0x007A

⼤写英⽂字母范围：0x0041 - 0x005A, 汉⼦的编码范围： 0x4E00 - 0x9FFF

具体编码对照可以查看：

因此我们获取字符串中的中⽂、英⽂等的思路就是获取每⼀个字符的编码，然后判断编码范围是否在相应的编码范围内，具体代码如下：

std::wstring tempStr = L"";

std::wstring oldStr = "中⽂123*&……9@English”；

for(int i = 0; i < oldStr.length(); ++i)

{

// 获取每个字符的第⼀个字节

unsigned char* pCh = (unsigned char*)&oldStr[i];

// 数字

if((*pCh >= 0x30 && *pCh <= 0x39) && *(pCh + 1) == 0x00)

{

tempStr += oldStr[i];

中文字符unicode查询

}

// ⼤写字母

else if((*pCh >= 0x41 && *pCh <=0x5A) && *(pCh + 1) == 0x00)

{

tempStr += oldStr[i];

}

// ⼩写字母

else if((*pCh >= 0x61 && *pCh <= 0x7A) && *(pCh + 1) == 0x00)

{

tempStr += oldStr[i];

}

// 希腊⽂字

else if((*pCh >= 0xB1 && *pCh <= 0xC9) && *(pCh + 1) == 0x03)

{

tempStr += oldStr[i];

}

// 中⽂

else if (((*pCh >= 0) && (*pCh <= 0xff)) && (*(pCh + 1) >= 0x4e && *(pCh + 1) <= 0x9f))

{

tempStr += oldStr[i];

}

发表评论

688IT编程网

C++获取字符串中的中文、英文、数字等

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

C++获取字符串中的中文、英文、数字等

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式