- `rune` 、 `byte` 和 `string` 都是 `Go` 的内置类型 ----- - `byte` - byte是`uint8`的别名,在所有方面都等同于`uint8` - 按惯例,它用于区分**字节值**和**8位无符号整数值**。 - `rune` - `rune`是`int32`的别名,在所有方面都等同于`int32` - 按惯例,它用于区分**字符值**和**整数值**。 - `string` - string是所有**8位字节字符串**的集合,通常但不一定代表UTF-8编码的文本 - 字符串可能为空,但是不能为 `nil` - 字符串类型的值是不可变的 - 由上面得解释我们大概可以明白 - `rune` 可以表示得比 `byte` 多 - `string` 类型的底层是一个`byte` 数组 - 以上解释都来此 `Go` 源码注释 - 刚刚上面标注了**字节**和**字符**,现在我们来梳理字符和字节的概念 ----- - 存储单位 **字节** - 计算机存储信息的最小单位,称之为**位** `bit`,二进制的一个`0`或`1`叫一位 - 计算机存储容量基本单位是**字节** `Byte`,8个**二进制位**组成 `1` 个字节 - 信息表示单位 **字符** - **字符** 是一种符号,像 英文`a`和中文`阿` 就是不同字符 - 不同的字符在不同的编码格式下,所需要的存储单位不一样 - `ASCLII` 编码中一个**英文字母一字节**,一个**汉字两字节** - `UTF-8` 编码中 一个**英文字母一字节**,一个**常见汉字3字节**,不常用的超大字符集汉字4字节 ----- - `Go` 源码文件默认采用`Unicode`字符集,`Unicode`码点和内存中字节序列的变换实现使用了`UTF-8`,这使得`Go`编程无需考虑编码转换的问题非常方便 - 从编码上来分析 - `byte`用来强调一个字节代表的数据(例如字符 `a` 就是 `97`),而不是数字; - `rune`用来表示`Unicode`的码点,即一个字符 - 通俗一点 - `byte` 只能操作简单的字符,不支持中文操作 - `rune` 能操作任何字符 - 代码演示 ```go package main import "fmt" func main() { str := "hello 世界!" fmt.Println(str) fmt.Println(len(str)) fmt.Println(str[1]) fmt.Println(string(str[1])) fmt.Println(str[1:]) fmt.Println(str[7:]) } ************************************* 输出 hello 世界! 13 101 e ello 世界! ��界! ``` - 会输出 `hello 世界!`,这证明 `Go` 是`UTF-8` 编码的,输出长度为 `13` 这说明了一个汉字3字节 - 输出 `ello 世界!` 说明 `string` 底层的数据结构是数组 - 输出 `��界!` 说明 `string` 底层是一个`byte` 数组,不然不会乱码 ```go package main import "fmt" func StrChangeByRune(str *string, i int, ch rune) { temp := []rune(*str) temp[i] = ch *str = string(temp) } func StrChangeByByte(str *string, i int, ch byte) { temp := []byte(*str) temp[i] = ch *str = string(temp) } func main() { str := "你好 hello" str1 := "你好 hello" StrChangeByRune(&str, 1, 'A') StrChangeByByte(&str1, 1, 'A') fmt.Println(str) fmt.Println(str1) } ******************************* 输出 你A hello �A�好 hello ``` - 由输出 `你A hello` 和 `�A�好 hello` 可以看出 - `byte` 的操作单位是一个字节,可以理解为一个英文字符 - `rune` 的操作单位是一个字符,不管这个字符是什么字符
有疑问加站长微信联系(非本文作者))
