JS中UTF-8和UTF-16互转
1.由于服务端使⽤的Go,默认是使⽤UTF-8编码的,⽽JS默认是Unicode编码的(也就是UTF-16),所以为了字符串编码的⼀致性,将前端字符串数据编码转换为UTF-8之后再发送给服务端,服务端发送过来的字符串数据转换回UTF-16再使⽤。
PS:关于编码可参考《》
2.UTF-16转UTF-8
var utf16ToUtf8 = function (utf16Str) {
var utf8Arr = [];
var byteSize = 0;
for (var i = 0; i < utf16Str.length; i++) {
//获取字符Unicode码值
var code = utf16Str.charCodeAt(i);
//如果码值是1个字节的范围,则直接写⼊
if (code >= 0x00 && code <= 0x7f) {
byteSize += 1;
utf8Arr.push(code);
//如果码值是2个字节以上的范围,则按规则进⾏填充补码转换
} else if (code >= 0x80 && code <= 0x7ff) {
byteSize += 2;
utf8Arr.push((192 | (31 & (code >> 6))));
utf8Arr.push((128 | (63 & code)))
} else if ((code >= 0x800 && code <= 0xd7ff)
|| (code >= 0xe000 && code <= 0xffff)) {
byteSize += 3;
utf8Arr.push((224 | (15 & (code >> 12))));
utf8Arr.push((128 | (63 & (code >> 6))));
utf8Arr.push((128 | (63 & code)))
} else if(code >= 0x10000 && code <= 0x10ffff ){
byteSize += 4;
utf8Arr.push((240 | (7 & (code >> 18))));
utf8Arr.push((128 | (63 & (code >> 12))));
utf8Arr.push((128 | (63 & (code >> 6))));
utf8Arr.push((128 | (63 & code)))
}
}
return utf8Arr
}
3.UTF-8转UTF-16
var utf8ToUtf16 = function (utf8Arr) {
var utf16Str = '';
for (var i = 0; i < utf8Arr.length; i++) {
//每个字节都转换为2进制字符串进⾏判断
var one = utf8Arr[i].toString(2);
//正则表达式判断该字节是否符合>=2个1和1个0的情况
var v = one.match(/^1+?(?=0)/);
/
/多个字节编码
if (v && one.length == 8) {
//获取该编码是多少个字节长度
var bytesLength = v[0].length;
//⾸个字节中的数据,因为⾸字节有效数据长度为8位减去1个0位,再减去bytesLength位的剩余位数
var store = utf8Arr[i].toString(2).slice(7 - bytesLength);
for (var st = 1; st < bytesLength; st++) {
//后⾯剩余字节中的数据,因为后⾯字节都是10xxxxxxx,所以slice中的2指的是去除10
store += utf8Arr[st + i].toString(2).slice(2)
}
//转换为Unicode码值
utf16Str += String.fromCharCode(parseInt(store, 2));
//调整剩余字节数
i += bytesLength - 1
} else {
//单个字节编码,和Unicode码值⼀致,直接将该字节转换为UTF-16
utf16Str += String.fromCharCode(utf8Arr[i])
}
}
return utf16Str
}
参考⽹址:《》
以上。
字符串长度js
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论