JAVA正则表达式怎么表达汉字_Java的正则表达式匹配汉字--688IT编程网

JAVA正则表达式怎么表达汉字_Java的正则表达式匹配汉字[Java 提供了功能强⼤的正则表达式API，在包下。本教程介绍如何使⽤正则表达式API。]

刚才有同事问，顺便发出来记⼀下。

以前读《精通正则表达式》的时候已经知道Java的正则表达式⽀持\p{In

name}的形式来指定匹配属于name的Unicode区块的字符。JDK的

Pattern类的⽂档上也有相关例⼦，\p{InGreek}，表⽰匹配⼀个属于名为“Greek”的Unicode区块的字符。

那汉字怎么办？

Unicode⾥中⽂、⽇⽂与韩⽂的汉字是放在同⼀个(⼀些)区块⾥的，主要是在“CJK Unified Ideographs”当中，[最近需要在部署实时爬⾍检测系统时，需要动态显⽰页⾯内容，但也为了简单，于是想了个很奇怪的办法。想把⼀个长篇⼩说，《地缘政治⼤战略》中的所有内容赋值给字符串，但还有⼀些在“CJK Unified Ideographs Extension A”与“CJK Unified Ideographs Extension B”当中。

以前我没⽤这个⽅式匹配过汉字，还在想这名字⾥⾯有空格怎么办，试了⼀下\p{InCJK Unified Ideographs}发觉果然可以……当然，这种办法是不区分匹配到的汉字到底是中⽂、⽇⽂还是韩⽂的。也不区分简繁体。同事还问怎么⽤正则表达式只匹配简体中⽂，这个我就没想出什么好办法。

《精通正则表达式》⾥也提到.NET⽤的Unicode区块语法是\p{name}或者\p{Is

name}，相关⽂档在

这⾥。

放⼀demo代码：

public class TestUnicodeBlock {

public static void main(String[] args) {

final String regex = "\\p{InCJK Unified Ideographs}";

final String[] testChars = {

"\u6211", // a Chinese character

"\u300A", // a full-width punctuation

"\u3042", // a Hiragana character

"\uD55C" // a Hangul character

};

for (String s : testChars) {

System.out.printf("matched %s: %b\n", s, s.matches(regex));

unicode汉字

}

}[统计指定内容的汉字个数：String str = 北京欢迎你 hello welcome!;int count=0;Pattern pattern = Patternpile([\u4e00-

\u9fa5]);char c[] = CharArray();for(

688IT编程网

JAVA正则表达式怎么表达汉字_Java的正则表达式匹配汉字

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

JAVA正则表达式怎么表达汉字_Java的正则表达式匹配汉字

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式