golang获取字符串长度的案例
1.不同字符与获取字符串长度
获取字符串长度,是字符串操作的重要⽅法。理论来说,获取字符串长度,只要从头到尾查⼀遍就可以了。但遗憾的是,不同字符具有不同的编码格式。拉丁字母⼀个字符只要⼀个字节就⾏,⽽中⽂则可能需要两道三个字节;UNICODE把所有字符设置为2个字节,UTF-8格式则把所有字符设置为1--3个字节。
因此,字符串长度的获得,不等于按字节数查,⽽要根据不同字符编码查。
对于中⽂开发者来说,经常需要对字符串进⾏长度判断。golang有⾃⼰的默认判断长度函数len();但遗憾的是,len()函数判断字符串长度的时候,是判断字符的字节数⽽不是字符长度。因此,在中⽂字符下,应该采⽤如下⽅法:
1)使⽤ bytes.Count() 统计
2)使⽤ strings.Count() 统计
3)将字符串转换为 []rune 后调⽤ len 函数进⾏统计
4)使⽤ utf8.RuneCountInString() 统计
3.样例展⽰
s := "欢迎学习Go的len()函数"
r := []rune(strTest)
fmt.Println(len(r))
fmt.Println(len(s))
fmt.Println(bytes.Count([]byte(s), nil) - 1)
fmt.Println(strings.Count(s, "") - 1)
fmt.Println(utf8.RuneCountInString(s))
补充:Go语⾔获取中英⽂混和字符串的长度以及⼦字符串的⽅法
1. 纯英⽂字符串
使⽤len()函数。
testString1 := "China!"
length1 := len(testString1)
fmt.Printf("testString1 字符串的长度是:%d", length1)
长度是6。
2. 中英⽂混合字符串
2.1 先使⽤len()函数。
testString2 := "我爱你中国,我爱你China!"
length2 := len(testString2)
fmt.Printf("字符串的长度是:%d", length2)
fmt.Printf("testString2字符串的长度是:%d\n", length2)
fmt.Printf("testString2中的最后⼀个字符是:%s\n", testString2[length2-1])
fmt.Printf("testString2中的最后⼀个字符是:%c\n", testString2[length2-1])
fmt.Printf("testString2中的下标6-末尾的⼦字符串是:%s\n",testString2[:15])
fmt.Printf("testString2中的下标6-末尾的⼦字符串是:%s\n",testString2[:16])
这种⽅法的到的是字节数。Go语⾔中,中⽂字符按utf-8编码,占3字节,故长度是31。故此⽅法不适⽤统计中英⽂混合或者中⽂字符串长度。
2.2 使⽤utf8.RuneCountInString()⽅法。
testString2 := "我爱你中国,我爱你China!"
length3 := utf8.RuneCountInString(testString2)
fmt.Printf("使⽤utf8中的⽅法统计的字符串长度是:%d\n", length3)
字符串长度可以用lenngtn吗js此⽅法可统计字符数,输出结果是15。
2.3 转成[]rune类型,再对此类型进⾏操作
testString2 := "我爱你中国,我爱你China!"
temp := []rune(testString2)
length4 := len(temp)
fmt.Printf("使⽤rune统计的字符串的长度是:%d\n", length4)
//获取字符串中最后⼀个字符
lastChar := string(temp[length4-1])
//获取下标从0到3(不包括3)的⼦串
subString1 := temp[0:3]
subString2 := temp[6:9]
fmt.Printf("testString2中的最后⼀个字符是:%s\n", lastChar)
fmt.Printf("testString2中的下标0-2的⼦字符串是:%s\n",string(subString1))
fmt.Printf("testString2中的下标6-8的⼦字符串是:%s\n",string(subString2))
此⽅法也可输出字符个数15。但是此⽅法能获取指定下标范围的⼦字符串,也能获取指定下标位置的字符。⽐第⼆种⽅法⽅便。
3.⽰例代码
package main
import (
"fmt"
"unicode/utf8"
)
func main() {
//纯英⽂
testString1 := "China!"
length1 := len(testString1)
fmt.Printf("testString1字符串的长度是:%d\n", length1)
lastCharA := testString1[length1-1]
//此处⽤%s格式输出最后⼀个字符会出错,只能⽤%c
fmt.Printf("testString1字符串中最后⼀个字符是:%s\n", lastCharA)
fmt.Printf("testString1字符串中最后⼀个字符是:%c\n", lastCharA)
fmt.Printf("testString1中的下标0-2的⼦字符串是:%s\n",testString1[0:3])
fmt.Printf("testString1中的下标3-末尾的⼦字符串是:%s\n",testString1[3:])
fmt.Println()
//中英⽂加⼀起15个字符
testString2 := "我爱你中国,我爱你China!"
/
/此处长度是输出字节数,Go语⾔中⽂字符是UTF-8编码,长度3字节,故此处应该是15+1+9+6=31
length2 := len(testString2)
fmt.Printf("testString2字符串的长度是:%d\n", length2)
fmt.Printf("testString2中的最后⼀个字符是:%s\n", testString2[length2-1])
fmt.Printf("testString2中的最后⼀个字符是:%c\n", testString2[length2-1])
fmt.Printf("testString2中的下标6-末尾的⼦字符串是:%s\n",testString2[:15])
fmt.Printf("testString2中的下标6-末尾的⼦字符串是:%s\n",testString2[:16])
fmt.Println()
//此处就是统计字符数
length3 := utf8.RuneCountInString(testString2)
fmt.Printf("使⽤utf8中的⽅法统计的字符串长度是:%d\n", length3)
fmt.Println()
//转成rune类型,再统计字符数
temp := []rune(testString2)
//获取中英⽂混合字符串长度
length4 := len(temp)
fmt.Printf("使⽤rune统计的字符串的长度是:%d\n", length4)
//获取字符串中最后⼀个字符
lastCharB := string(temp[length4-1])
//获取下标从0到3(不包括3)的⼦串
subString1 := temp[0:3]
subString2 := temp[6:]
fmt.Printf("testString2中的最后⼀个字符是:%s\n", lastCharB)
fmt.Printf("testString2中的下标0-2的⼦字符串是:%s\n",string(subString1))
fmt.Printf("testString2中的下标6-末尾的⼦字符串是:%s\n",string(subString2))
}
4. ⽰例结果
总结
如果是对中英⽂进⾏操作,建议⽤第三种⽅式。先转成rune[]型,再进⾏操作。
以上为个⼈经验,希望能给⼤家⼀个参考,也希望⼤家多多⽀持。如有错误或未考虑完全的地⽅,望不吝赐教。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论