【Python】字符串转换为ASCII码

蔚落 2022-04-24 13:46 865阅读 0赞

在这里先解释一下ASCII,Unicode 和 UTF-8这三者的关系

最早出现的是ASCII,一共包含128个字符(一个字节可以表示256种状态,但第一位所有默认为0,所以只有128种)。在接下来计算机的发展过程中,128种远远不能满足增加的需求(各种国家语言等),所以引入了Unicode,但Unicode只规定了符号的二进制代码,并没有规定存储方式。因此引入了UTF-8UTF-8是一种 Unicode 的实现方式。对于英语字母,UTF-8 编码和 ASCII 码是相同的。

python3 字符串默认的是 Unicode 编码

对于单个字符使用如下:

  1. >>> ord('A')
  2. 65
  3. >>> ord('中')
  4. 20013
  5. >>> chr(66)
  6. 'B'
  7. >>> chr(25991)
  8. '文'

对于一个长的字符串使用如下:

  1. import numpy as np
  2. str = 'hello world'
  3. ascii = np.fromstring(str, dtype=np.uint8)
  4. print(ascii)

输出为 [104 101 108 108 111 32 119 111 114 108 100]

发表评论

表情:
评论列表 (有 0 条评论,865人围观)

还没有评论,来说两句吧...

相关阅读