UTF-8编码的空格(194160)问题--688IT编程网

UTF-8编码的空格（194160）问题

前台的字符串传递到后台进⾏处理，发现了⼀个较诡异的问题：字符串中的⼀个空格(ASCII：32)被UTF-8编码之后变成了⼀个诡异的字符(ASCII：194 和 160的组合)！但在后台其表象还是空格。

在UTF-8编码⾥⾯存在⼀个特殊的字符，其编码是“0xC2 0xA0”，转换成字符的时候表现为⼀个半⾓空格，跟⼀般的半⾓空格（ASCII

0x20）不同的是它的宽度不会被压缩，所以排版中常能⽤到它。但是GB2312、Unicode之类并没有这样的字符，所以转换后前台会显⽰

为“?”号，只是显⽰为问号⽽不是真正的问号，所以⽆法被替换！

对这两个看似相同的字符串进⾏⼀下转换可以确认：原始的字符串为：”#' %$ ()_ -{}.b“ 被转义后的字符串为：”#' %$ ()_ -{}.b“ 【注：双引号不算，转换为byte数组之后可以看到，原来的是16个字节，后来的那个是17个字节：这就是 32 --> 194 160 的结果】

字符串转数组编码方式

string tmp1 = "#' %$ ()_ -{}.b";

string tmp2 = "#' %$ ()_ -{}.b";

byte[] o1 = Encoding.UTF8.GetBytes(tmp1);

byte[] o2 = Encoding.UTF8.GetBytes(tmp2);

知道了这个原因之后，就好办了，写代码可以把194 和 160 的组合转换回去。程序（C#）如下所⽰：

private string ChangeUTF8Space(string targetStr)

{

try

{

string currentStr = string.Empty;

byte[] utf8Space = new byte[] { 0xc2, 0xa0 };

string tempSpace = Encoding.GetEncoding("UTF-8").GetString(utf8Space);

currentStr = targetStr.Replace(tempSpace, "");

return currentStr;

}

catch (Exception ex)

{

return targetStr;

}

更多的编码格式对照表可以看这篇⽂章：

发表评论

688IT编程网

UTF-8编码的空格(194160)问题

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

UTF-8编码的空格(194160)问题

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式