Golang学习笔记之字符串(string)

在 Go 中字符串是 byte 数组。可以通过将内容放在双引号 "" 之间的方式来创建一个字符串。字符串是不可变值类型,内部⽤指针指向 UTF-8 字节数组。

• 默认值是空字符串 ""。
• ⽤索引号访问某字节,如 s[i]。
• 不能⽤序号获取字节元素指针, &s[i] ⾮法。
• 不可变类型,⽆法修改字节数组。
• 字节数组尾部不包含 NULL。

runtime.h
struct String
{
    byte* str;
    intgo len;
};

(1)使⽤索引号访问字符 。

s := "abc"
fmt.Println(s[0])           //97
fmt.Printf("%c\n", s[0])    //a
//'x\61'Unicode码,  0x63 ascil码
fmt.Println(s[0] == '\x61', s[0] == '\u0061', s[0] == '\U00000061') //true true true
fmt.Println(s[1] == 'b', s[2] == 0x63)                              //true true

通常Unicode表示一个字符时,通常会用"U+"然后紧接着一组十六进制的数字来表示这个字符,例如 字符a 通常用 U+0061 来表示。
直接按照字符的字形的话,可以用单引号 (') 括起来表示,也可按照码值来表示,可以用 \xNN ,\uNNNN , \UNNNNNNNN 的 格式,每个 N 代表一位数。例如 字符a 可以用 \x61 或 \u0061 或 \U00000061

(2)使⽤ "`" 定义不做转义处理的原始字符串,⽀持跨⾏。

s := `a
b\r\n\x00
c`
    fmt.Println(s)

输出


(3)使用len()可以反回字节数

    s := "abc"
    fmt.Println(len(s))                                    //3

(4)连接跨⾏字符串时, "+" 必须在上⼀⾏末尾,否则导致编译错误。

s := "Hello, " +
     "World!"

(5)rune

rune 是 Go 中的内置类型,它是 int32 的别名。在 Go 中,rune表示一个 Unicode 码点。无论一个码点会被编码为多少个字节,它都可以表示为一个 rune。
汉字在字节中占2-4个码点。直接使用下标访问并不能得到正确的值,可以先将其转换为rune类型再使用下标访问

    s := "黄哲"
    fmt.Println(s[0])        //233
    fmt.Printf("%c\n", s[0]) //é
    r := []rune(s)
    fmt.Println(r[0])        //40644
    fmt.Printf("%c\n", r[0]) //黄

(6)字符串是不可变的,在 Go 中字符串是不可变的。字符串一旦被创建就无法改变。

要修改字符串,可先将其转换成 []rune 或 []byte,完成后再转换为 string。⽆论哪种转换,都会重新分配内存,并复制字节数组。

func changeString(s string) string {
    // ru := []rune(s)
    // ru[0] = 'w'
    by := []byte(s)
    by[1] = 'G'
    return string(by)
}

(7)⽤ for 循环遍历字符串时,也有 byte 和 rune 两种⽅式。

    s := "黄哲abc"
    for i := 0; i < len(s); i++ { // byte
        fmt.Printf("%c,", s[i])
    }
    fmt.Println()
    for _, r := range s { // rune
        fmt.Printf("%c,", r)
    }

输出:


(8)字符串操作相关的API大多封装在 strings 包里

stringsAPI地址

我只说几个常用的
1、返回字符串s中有几个不重复的sep子串。
func Count(s, sep string) int

    s := "黄哲abc"
    fmt.Println(strings.Count(s, "a")) //1

2、子串sep在字符串s中第一次出现的位置,不存在则返回-1。
func Index(s, sep string) int

    s := "黄哲abc"
    fmt.Println(strings.Index(s, "ab")) //7

3、字符c在s中第一次出现的位置,不存在则返回-1。
func IndexByte(s string, c byte) int

    s := "a黄哲abc"
    fmt.Println(strings.IndexByte(s, 'a')) //1

4、判断字符串s是否包含字符串chars中的任一字符。
func ContainsAny(s, chars string) bool

    s := "a黄哲abc"
    fmt.Println(strings.ContainsAny(s, "abcd")) //true

其他的去上面的API里查吧,不一一列举了

(9)字符串转int类型,方法封装在strconv包里

https://studygolang.com/pkgdoc

1、func ParseInt(s string, base int, bitSize int) (i int64, err error)
返回字符串表示的整数值,接受正负号。
base指定进制(2到36),如果base为0,则会从字符串前置判断,"0x"是16进制,"0"是8进制,否则是10进制;
bitSize指定结果必须能无溢出赋值的整数类型,0、8、16、32、64分别代表 int、int8、int16、int32、int64;
返回的err是*NumErr类的,如果语法有误,err.Error = ErrSyntax;如果结果超出类型范围err.Error= ErrRange。

    s := "-1234556676876876"
    num, _ := strconv.ParseInt(s, 10, 64)
    fmt.Println(num) //-1234556676876876

func Atoi(s string) (i int, err error)
Atoi是ParseInt(s, 10, 0)的简写。

2、func ParseUint(s string, base int, bitSize int) (n uint64, err error)
ParseUint类似ParseInt但不接受正负号,用于无符号整型。有符号会返回0。

    s1 := "-1234556676876876"
    s2 := "123312"
    num1, err := strconv.ParseUint(s1, 10, 64)
    num2, _ := strconv.ParseUint(s2, 10, 64)
    fmt.Println(num1, err) //0 strconv.ParseUint: parsing "-1234556676876876": invalid syntax
    fmt.Println(num2)      //123312

3、func ParseFloat(s string, bitSize int) (f float64, err error)
解析一个表示浮点数的字符串并返回其值。
如果s合乎语法规则,函数会返回最为接近s表示值的一个浮点数。
bitSize指定了期望的接收类型,32是float32,64是float64;
返回值err是*NumErr类型的,语法有误的,err.Error=ErrSyntax;结果超出表示范围的,返回值f为±Inf,err.Error= ErrRange。

    s3:="12312.32131"
    f1,_:=strconv.ParseFloat(s3,32)
    f2,_:=strconv.ParseFloat(s3,64)
    fmt.Println(f1)      //12312.3212890625
    fmt.Println(f2)      //12312.32131

你可能感兴趣的:(Golang学习笔记之字符串(string))