golang:字符串

r囧r小猫 2022-02-28 09:24 470阅读 0赞

一个字符串是一个不可改变的字节序列,字符串可以包含任意的数据,但是通常是用来包含可读的文本,字符串是UTF-8字符的一个序列(当字符为 ASCII 码表上的字符时则占用 1 个字节,其它字符根据需要占用 2-4 个字节)。

UTF-8 是一种被广泛使用的编码格式,是文本文件的标准编码,其中包括 XML 和 JSON 在内也都使用该编码。由于该编码对占用字节长度的不定性,在Go语言中字符串可可能根据需要占用1到4个字节,这与其它编程语言如 C++、Java 或者 Python 不同(Java 始终使用 2 个字节)。Go语言这样做不仅减少了内存和硬盘空间占用,同时也不用像其它语言那样需要对使用 UTF-8 字符集的文本进行编码和解码。

字符串是一种值类型,而且值不可变,即创建某个文本后将无法再次修改这个文本的内容,更深入的讲,字符串是字节的定长数组。

定义字符串

可以使用””来定义字符串,字符串中可以使用转义字符来实现换行、缩进等效果,常用的转义字符包括:

  • \n:换行符
  • \r:回车符
  • \t:tab 键
  • \u 或 \U:Unicode 字符
  • \:反斜杠自身

    package main
    import (

    1. "fmt"

    )
    func main() {

    1. var str = "C语言中文网\nGo语言教程"
    2. fmt.Println(str)

    }

运行结果为:

  1. C语言中文网
  2. Go语言教程

一般的比较运算符(==、!=、<、<=、>=、>)是通过在内存中按字节比较来实现字符串比较的,因此比较的结果是字符串自然编码的顺序。字符串所占的字节长度可以通过函数len()来获取,比如len(str).

字符串的内容(纯字节)可以通过标准索引法来获取,在方括号[ ]内写入索引,索引从 0 开始计数:

  • 字符串 str 的第 1 个字节:str[0]
  • 第 i 个字节:str[i - 1]
  • 最后 1 个字节:str[len(str)-1]

需要注意的是,这种转换方案只对纯 ASCII 码的字符串有效。

注意:获取字符串中某个字节的地址属于非法行为,例如 &str[i]。

字符串的拼接 +

两个字符串 s1 和 s2 可以通过 s := s1 + s2 拼接在一起。将 s2 追加到 s1 尾部并生成一个新的字符串 s。

可以通过下面的方式来对代码中多行的字符串进行拼接:

  1. str := "Beginning of the string " +
  2. "second part of the string"

注意:因为编译器会在行尾自动补全分号,所以拼接字符串用的加号“+”必须放在第一行末尾。

也可以使用“+=”来对字符串进行拼接:

  1. s := "hel" + "lo,"
  2. s += "world!"
  3. fmt.Println(s) //输出 “hello, world!”

字符串实现基于UTF-8编码

golang中字符串的内部实现使用UTF-8编码,通过rune类型,可以方便的对每个UTF-8字符进行访问。当然,Go语言也支持按照传统的 ASCII 码方式逐字符进行访问。

定义多行字符串

在Go语言中,使用双引号书写字符串的方式是字符串常见表达方式之一,被称为字符串字面量(string literal),这种双引号字面量不能跨行,如果想要在源码中嵌入一个多行字符串时,就必须使用`反引号,代码如下:

  1. const str = `第一行
  2. 第二行
  3. 第三行
  4. \r\n
  5. `
  6. fmt.Println(str)

在这里插入图片描述
在这种方式下,反引号间换行将被作为字符串中的换行,但是所有的转义字符均无效,文本将会原样输出

多行字符串一般用于内嵌源码和内嵌数据等,代码如下:

  1. const codeTemplate = `// Generated by github.com/davyxu/cellnet/
  2. protoc-gen-msg
  3. // DO NOT EDIT!{
  4. {range .Protos}}
  5. // Source: {
  6. {.Name}}{
  7. {end}}
  8. package {
  9. {
  10. .PackageName}}
  11. {
  12. {
  13. if gt .TotalMessages 0}}
  14. import (
  15. "github.com/davyxu/cellnet"
  16. "reflect"
  17. _ "github.com/davyxu/cellnet/codec/pb"
  18. )
  19. {
  20. {
  21. end}}
  22. func init() {
  23. {
  24. {
  25. range .Protos}}
  26. // {
  27. {.Name}}{
  28. {range .Messages}}
  29. cellnet.RegisterMessageMeta("pb","{
  30. {.FullName}}", reflect.TypeOf((*{
  31. {
  32. .Name}})(nil)).Elem(), {
  33. {
  34. .MsgID}}) {
  35. {
  36. end}}
  37. {
  38. {
  39. end}}
  40. }

这段代码只定义了一个常量 codeTemplate,类型为字符串,使用`定义,字符串的内容为一段代码生成中使用到的 Go 源码格式。

在`间的所有代码均不会被编译器识别,而只是作为字符串的一部分。

发表评论

表情:
评论列表 (有 0 条评论,470人围观)

还没有评论,来说两句吧...

相关阅读

    相关 golang字符串

    一个字符串是一个不可改变的字节序列,字符串可以包含任意的数据,但是通常是用来包含可读的文本,字符串是UTF-8字符的一个序列(当字符为 ASCII 码表上的字符时则占用 1 个

    相关 golang字符串

    (1)最后要注意,字符串值是不可变的。也就是说,我们一旦创建了一个此类型的值,就不可能再对它本身做任何修改。 (2)字符串有两种表示。若用原生表示法,需用两个反引号“\`