C#正则表达式——中⽂英⽂空格(全⾓半⾓空格)处理
1. 匹配中⽂(全⾓)空格
Regex.IsMatch(" ", "\u3000");\u3000是全⾓空格的16进制Unicode编码。
<wbr></wbr>
2. 匹配英⽂(半⾓)空格
Regex.IsMatch(" ", "\u0020")\u0020是半⾓空格的16进制Unicode编码。
<wbr></wbr>
3. 去除中⽂字符之间的英⽂(半⾓)空格
string text = "<p> 测 试 test1. ⼀下</p>";
js中文正则表达式
var result = Regex.Replace(text, "(?<=[\u4e00-\u9fa5])(\u0020)(?=[\u4e00-\u9fa5])",
string.Empty);Console.WriteLine(result);
/
/结果是:<p> 测试 test1. ⼀下</p>
(?=[\u4e00-\u9fa5]) 表⽰“正向预搜索”⼀个中⽂字符,判断\u0020的右侧是否为中⽂字符。
(?<=[\u4e00-\u9fa5]) 表⽰“反向预搜索”⼀个中⽂字符,判断\u0020的左侧是否为中⽂字符。
<wbr></wbr>
4. 在中⽂字符与英⽂字符之间增加空格
string text = "<p> test测试test1. ⼀hello下</p>";<wbr><wbr><wbr><wbr><wbr><wbr><wbr><wbr><wbr><wbr><wbr></wbr></wbr> </wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr></wbr>
text = Regex.Replace(text, @"(?<=[\u4e00-\u9fa5])([a-zA-Z])(?=[a-zA-Z])", " $1");text = Regex.Replace(text, @"(?<=[a-zA-Z]) ([a-zA-Z])(?=[\u4e00-\u9fa5])", "$1 ");
Console.WriteLine(text);
//输出结果:<p> test 测试 test1. ⼀ hello 下</p>
<wbr></wbr>
第⼀个正则表达式是针对“左中⽂,右英⽂”的情况。
第⼆个正则表达式是针对“左英⽂,右中⽂”的情况。
<wbr></wbr>

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。