Javaunicode中⽂编码转换和反转
参考⽹址
在java的很多配置⽂件中,尤其是国际化资源中经常遇到类似\uf432这样的unicode编码,搜集了下该编码相关的资料,⼤致处理⽅法有如下:
1、Unicode转汉字字符串。
这个过程最简单的⽅式就是直接获取。⽐如
String cnStr = "\ufeff\u4e2d\u56fd\u4eba";
System.out.println(cnStr); 即可获取对应的汉字字符 “中国⼈”;
但是呢,每次从输出读的话也未免过于不⽅便了,我们使⽤⽅法来做转换,直接获取。
参考如下
public static String unicodeToString(String str) {
Pattern pattern = Patternpile("(\\\\u(\\p{XDigit}{4}))");
Matcher matcher = pattern.matcher(str);
char ch;
while (matcher.find()) {
ch = (char) Integer.up(2), 16);
str = up(1), ch + "");
}
return str;
}
2、获取字符串的unicode编码,这个我们可以通过直接获取字符串的unicode⼆进制,然后将其byte转换成对应的16进制表⽰即可,函数⽰例如下
static String getUnicode(String s) {
try {
StringBuffer out = new StringBuffer("");
byte[] bytes = s.getBytes("unicode");
for (int i = 0; i < bytes.length - 1; i += 2) {
out.append("\\u");
String str = HexString(bytes[i + 1] & 0xff);
for (int j = str.length(); j < 2; j++) {
out.append("0");
}
String str1 = HexString(bytes[i] & 0xff);
out.append(str1);
unicode汉字out.append(str);
}
String();
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
return null;
}
}
通过上⾯的⽅式便可完整的使⽤unicode编码了,⼤家有其他⽅式的转换也可以告诉我下,互相学习
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论