Go语言中,string
就是只读的采用utf8
编码的字节切片(slice) 因此用len
函数获取到的长度并不是字符个数,而是字节个数。 for循环遍历输出的也是各个字节。
rune
是int32
的别名,代表字符的Unicode编码,采用4个字节存储,将string
转成rune
就意味着任何一个字符都用4个字节来存储其unicode值,这样每次遍历的时候返回的就是unicode值,而不再是字节了,这样就可以解决乱码问题了
bytes操作的对象也是字节切片,与string的不可变不同,byte是可变的,因此string按增量方式构建字符串会导致多次内存分配和复制,使用bytes就不会因而更高效一点
func main() {
str := "Hello, Golang!"
fmt.Println(string2bytes1(str))
fmt.Println(string2bytes2(str))
fmt.Println(string2bytes3(str))
}
func string2bytes1(str string) []byte {
bs := make([]byte, 0)
for i := 0; i < len(str); i++ {
bs = append(bs, str[i])
}
return bs
}
func string2bytes2(str string) []byte {
return []byte(str)
}
func string2bytes3(s string) []byte {
sh := (*reflect.StringHeader)(unsafe.Pointer(&s))
bh := reflect.SliceHeader{
Data: sh.Data,
Len: sh.Len,
Cap: sh.Len,
}
return *(*[]byte)(unsafe.Pointer(&bh))
}
前两个方法是非常标准的转换方式,第三种方式使用了 unsafe
和 reflect
处理,是个不安全的做法,而且 StringHeader
在我使用的 1.21 已经废弃了。
func main() {
str := "Hello, Golang!"
bs := string2bytes3(str)
fmt.Println(bytes2string1(bs))
fmt.Println(bytes2string2(bs))
}
func bytes2string1(bs []byte) string {
return string(bs)
}
func bytes2string2(bs []byte) string {
return *(*string)(unsafe.Pointer(&bs))
}
第一种转换也是一个非常标准的转换方式,第二个方式使用了不安全的做法。
func main() {
str := "Hello, 中国!"
fmt.Println(string2rune1(str))
fmt.Println(string2rune2(str))
}
func string2rune1(str string) []rune {
rs := make([]rune, 0)
for _, r := range str {
rs = append(rs, r)
}
return rs
}
func string2rune2(str string) []rune {
return []rune(str)
}
这里的 for range
和上面 for index
是不一样的,索引字符串产生字节。For range 循环每次迭代都会解码一个 UTF-8 编码的符文,因此值类型是 rune。
func main() {
str := "Hello, 中国!"
rs := string2rune2(str)
fmt.Println(rune2string1(rs))
}
func rune2string1(rs []rune) string {
return string(rs)
}
[]rune 和 []byte 的相互转换需要先转成字符串再转换。
func main() {
str := "Hello, 中国!"
rs := string2rune1(str)
bs := string2bytes1(str)
convertedBytes := rune2bytes(rs)
convertedRunes := bytes2rune(bs)
fmt.Println(bs)
fmt.Println(convertedBytes)
fmt.Println(rs)
fmt.Println(convertedRunes)
}
func rune2bytes(rs []rune) []byte {
return []byte(string(rs))
}
func bytes2rune(bs []byte) []rune {
return []rune(string(bs))
}
希望大家通过这篇文章可以巩固自己对这几种类型的理解,以及更方便的对它们进行转换。
关注公众号【爱发白日梦的后端】分享技术干货、读书笔记、开源项目、实战经验、高效开发工具等,您的关注将是我的更新动力!