C#汉字Unicode编码相互转换--688IT编程网

C#汉字Unicode编码相互转换

Unicode和汉字编码⼩知识

将汉字进⾏UNICODE编码，如：“王”编码后就成了“\王”，UNICODE字符以\u开始，后⾯有4个数字或者字母，所有字符都是16进制的数字，每两位表⽰的256以内的⼀个数字。⽽⼀个汉字是由两个字符组成，于是就很容易理解了，“738b”是两个字符，分别是“73”“8b”。但是在将 UNICODE字符编码的内容转换为汉字的时候，字符是从后⾯向前处理的，所以，需要把字符按照顺序“8b”“73”进⾏组合得到汉字。

下⾯是C#汉字Unicode编码相互转换代码。

using System;

using System.Text;

using System.Text.RegularExpressions;

using System.Globalization;

public class GB2312UnicodeConverter

{

///<summary>

///汉字转换为Unicode编码unicode汉字

///</summary>

///<param name="str">要编码的汉字字符串</param>

///<returns>Unicode编码的的字符串</returns>

public static string ToUnicode(string str)

{

byte[] bts = Encoding.Unicode.GetBytes(str);

string r = "";

for (int i = 0; i < bts.Length; i += 2) r += "\\u" + bts[i + 1].ToString("x").PadLeft(2, '0') + bts[i].ToString("x").PadLeft(2, '0');

return r;

}

///<summary>

///将Unicode编码转换为汉字字符串

///</summary>

///<param name="str">Unicode编码字符串</param>

///<returns>汉字字符串</returns>

public static string ToGB2312(string str)

{

string r = "";

MatchCollection mc = Regex.Matches(str, @"\\u([\w]{2})([\w]{2})", RegexOptions.Compiled | RegexOptions.IgnoreCase);

byte[] bts = new byte[2];

foreach(Match m in mc )

{

bts[0] = (byte)int.Parse(m.Groups[2].Value, NumberStyles.HexNumber);

bts[1] = (byte)int.Parse(m.Groups[1].Value, NumberStyles.HexNumber);

r += Encoding.Unicode.GetString(bts);

}

return r;

}

发表评论

688IT编程网

C#汉字Unicode编码相互转换

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

C#汉字Unicode编码相互转换

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式