ASCII 码只需要 7 bit 就能完整地表示,但只能表示英文字母在内的 128 个字符,为了表示世界上大部分的文字系统,发明了 Unicode ,它是 ASCII 的超集,包含世界上书写系统中存在的所有字符,并且为每个代码分配一个标准编号(称为 Unicode CodePoint),在 go 语言中称为 rune,是 int32 的别名。
go 语言中 ,字符串的底层表示是 byte(8 bit) 序列,而不是 rune( 32 bit )序列。
- func main() {
- str := "nihao"
- length := len(str)
- fmt.Println(length)
- for i, _ := range str {
- fmt.Println(reflect.TypeOf(str[i]))
- }
- }
运行结果为:
但是,如果使用 for range 遍历字符串取值的时候,得到的 value 类型为 rune 类型(3字符),也就是 int32 类型,对应 Unicode 字符型。
- func main() {
- str := "nihao"
- length := len(str)
- fmt.Println(length)
- for _, v := range str {
- fmt.Println(reflect.TypeOf(v))
- }
- }
运行结果:
所以在go语言中修改字符串的时候,针对不同的情况来进行编写:
此时需要将字符串转换为 []rune 切片进行操作
-
- func main() {
- str := "你好"
- fmt.Printf("修改前:%s", str)
- fmt.Println()
- strr := []rune(str)
- strr[0] = '我'
- fmt.Printf("修改后:%s", string(strr))
- }
结果:
如果使用 []byte 的话编译会不通过
此时使用 []rune 或者 []byte 都可以,但是一般会使用 []byte:
- func main() {
- str := "nihao"
- fmt.Printf("修改前:%s", str)
- fmt.Println()
- strr := []rune(str)
- strr[0] = 'w'
- fmt.Printf("[]rune修改后:%s", string(strr))
- fmt.Println()
- strrr := []byte(str)
- strrr[0] = 'w'
- fmt.Printf("[]byte修改后:%s", string(strr))
- fmt.Println()
- }
运行结果: