This commit is contained in:
krahets
2023-12-27 00:48:07 +08:00
parent e5eb0ab492
commit 5e0d7327db
51 changed files with 27097 additions and 284 deletions

View File

@@ -3629,7 +3629,7 @@
<ul>
<li>Python 中的 <code>str</code> 使用 Unicode 编码,并采用一种灵活的字符串表示,存储的字符长度取决于字符串中最大的 Unicode 码点。若字符串中全部是 ASCII 字符,则每个字符占用 1 字节;如果有字符超出了 ASCII 范围但全部在基本多语言平面BMP则每个字符占用 2 字节;如果有超出 BMP 的字符,则每个字符占用 4 字节。</li>
<li>Go 语言的 <code>string</code> 类型在内部使用 UTF-8 编码。Go 语言还提供了 <code>rune</code> 类型,它用于表示单个 Unicode 码点。</li>
<li>Rust 语言的 str 和 String 类型在内部使用 UTF-8 编码。Rust 也提供了 <code>char</code> 类型,用于表示单个 Unicode 码点。</li>
<li>Rust 语言的 <code>str</code><code>String</code> 类型在内部使用 UTF-8 编码。Rust 也提供了 <code>char</code> 类型,用于表示单个 Unicode 码点。</li>
</ul>
<p>需要注意的是,以上讨论的都是字符串在编程语言中的存储方式,<strong>这和字符串如何在文件中存储或在网络中传输是不同的问题</strong>。在文件存储或网络传输中,我们通常会将字符串编码为 UTF-8 格式,以达到最优的兼容性和空间效率。</p>