正则表达式匹配标点符号
摘抄:
str = placeAll("[\\pP‘’“”]", "");
Unicode 编码并不只是为某个字符简单定义了⼀个编码,⽽且还将其进⾏了归类。正则匹配是什么
\pP 其中的⼩写 p 是 property 的意思,表⽰ Unicode 属性,⽤于 Unicode 正表达式的前缀。
⼤写 P 表⽰ Unicode 字符集七个字符属性之⼀:标点字符。
其他六个是
L:字母;
M:标记符号(⼀般不会单独出现);
Z:分隔符(⽐如空格、换⾏等);
S:符号(⽐如数学符号、货币符号等);
N:数字(⽐如阿拉伯数字、罗马数字等);
C:其他字符
上⾯这七个是属性,七个属性下还有若⼲个⼦属性,⽤于更进⼀步地进⾏细分。
Java 中⽤于 Unicode 的正则表达式数据都是由 Unicode 组织提供的。
Unicode 正则表达式标准(可以到所有的⼦属性)
/reports/tr18/
各 Unicode 字符属性的定义,可以⽤⼀看看某个字符具有什么属性。
/Public/
这个⽂本⽂档⼀⾏是⼀个字符,第⼀列是 Unicode 编码,第⼆列是字符名,第三列是 Unicode 属性, 以及其他⼀些字符信息。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。