• Golang 中的 String、rune 和 byte


    解释

    String

    Go语言中,string就是只读的采用utf8编码的字节切片(slice) 因此用len函数获取到的长度并不是字符个数,而是字节个数。 for循环遍历输出的也是各个字节。

    rune

    runeint32的别名,代表字符的Unicode编码,采用4个字节存储,将string转成rune就意味着任何一个字符都用4个字节来存储其unicode值,这样每次遍历的时候返回的就是unicode值,而不再是字节了,这样就可以解决乱码问题了

    byte

    bytes操作的对象也是字节切片,与string的不可变不同,byte是可变的,因此string按增量方式构建字符串会导致多次内存分配和复制,使用bytes就不会因而更高效一点

    转换方式

    String、bytes 相互转换

    String to bytes

    func main() {
    	str := "Hello, Golang!"
    	fmt.Println(string2bytes1(str))
    	fmt.Println(string2bytes2(str))
    	fmt.Println(string2bytes3(str))
    }
    
    func string2bytes1(str string) []byte {
    	bs := make([]byte, 0)
    	for i := 0; i < len(str); i++ {
    		bs = append(bs, str[i])
    	}
    	return bs
    }
    
    func string2bytes2(str string) []byte {
    	return []byte(str)
    }
    
    func string2bytes3(s string) []byte {
    	sh := (*reflect.StringHeader)(unsafe.Pointer(&s))
    	bh := reflect.SliceHeader{
    		Data: sh.Data,
    		Len:  sh.Len,
    		Cap:  sh.Len,
    	}
    	return *(*[]byte)(unsafe.Pointer(&bh))
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28

    前两个方法是非常标准的转换方式,第三种方式使用了 unsafereflect 处理,是个不安全的做法,而且 StringHeader 在我使用的 1.21 已经废弃了。

    bytes to String

    func main() {
    	str := "Hello, Golang!"
    	bs := string2bytes3(str)
    	fmt.Println(bytes2string1(bs))
    	fmt.Println(bytes2string2(bs))
    }
    
    func bytes2string1(bs []byte) string {
    	return string(bs)
    }
    
    func bytes2string2(bs []byte) string {
    	return *(*string)(unsafe.Pointer(&bs))
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14

    第一种转换也是一个非常标准的转换方式,第二个方式使用了不安全的做法。

    String、rune 相互转换

    String to rune

    func main() {
    	str := "Hello, 中国!"
    
    	fmt.Println(string2rune1(str))
    	fmt.Println(string2rune2(str))
    }
    
    func string2rune1(str string) []rune {
    	rs := make([]rune, 0)
    	for _, r := range str {
    		rs = append(rs, r)
    	}
    	return rs
    }
    
    func string2rune2(str string) []rune {
    	return []rune(str)
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18

    这里的 for range 和上面 for index 是不一样的,索引字符串产生字节。For range 循环每次迭代都会解码一个 UTF-8 编码的符文,因此值类型是 rune。

    rune to String

    func main() {
    	str := "Hello, 中国!"
    
    	rs := string2rune2(str)
    	fmt.Println(rune2string1(rs))
    }
    
    func rune2string1(rs []rune) string {
    	return string(rs)
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    rune、bytes 相互转换

    []rune 和 []byte 的相互转换需要先转成字符串再转换。

    func main() {
    	str := "Hello, 中国!"
    
    	rs := string2rune1(str)
    	bs := string2bytes1(str)
    
    	convertedBytes := rune2bytes(rs)
    	convertedRunes := bytes2rune(bs)
    	fmt.Println(bs)
    	fmt.Println(convertedBytes)
    	fmt.Println(rs)
    	fmt.Println(convertedRunes)
    }
    
    func rune2bytes(rs []rune) []byte {
    	return []byte(string(rs))
    }
    
    func bytes2rune(bs []byte) []rune {
    	return []rune(string(bs))
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21

    总结

    希望大家通过这篇文章可以巩固自己对这几种类型的理解,以及更方便的对它们进行转换。

    关注公众号【爱发白日梦的后端】分享技术干货、读书笔记、开源项目、实战经验、高效开发工具等,您的关注将是我的更新动力!

  • 相关阅读:
    [附源码]java毕业设计医院疫情疾控管理系统
    Spring Cloud Consul
    (十八)数据结构-图的应用-最短路径
    free -m 命令详解
    FPGA学习笔记(四)通过数码管学习顶层模块和例化的编写
    手写嵌入式操作系统(基于stm8单片机)
    导致 JVM 内存泄露的 ThreadLocal 详解
    后端一次性返回10w条数据,该如何渲染
    双飞翼布局和圣杯布局
    yolov1代码中的coor_mask.unsqueeze(-1) & coor_mask.expand_as(tensor)
  • 原文地址:https://blog.csdn.net/liufotian/article/details/134027485