cn_billchen

[转] 汉字字符编码的科普笔记

一 GB2312与cp936

1. GB2312 简介

GB2312 即 GB2312-80 ，诞生于 1981 年，共收录 6763 个汉字，其中一级汉字 3755 个，二级汉字 3008 个；同时收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的 682 个字符，共 7445 个字符。 GB2312 的出现，基本满足了汉字的计算机处理需要，它所收录的汉字已经覆盖中国大陆 99.75% 的使用频率。用区位码表示。范围：区（ 01-87 ），位（ 01-94 ）。

2. Code Page

在 Windows 中使用 VIM 打开一个以 GB2312 方式编码的文档时， file encoding 显示的是“ cp936 ”。在 Windows 中， code page 指的就是字符集，在其他操作系统中称为字符编码（ character encodings ），两者是同一概念。 code pages 在 80 到 90 年代的 Windows 操作系统中使用，当 Windows 实现了 Unicode 时， code pages 就逐渐被取代。 Code Page 这个词来源于 IBM 的基于 EBCDIC 的 mainframe 系统，但包括微软、 SAP 和 Oracle 在内的很多制造商都使用这个说法。

另一个很奇怪的事情是，同样一份以 GB2312 编码的文档，在 Windows 里用 VIM 打开，就显示为 cp936 编码；在 Linux 里打开时却显示为 utf-8 编码，而不是“ cp936 ”的 unix 说法“ euc-cn ”！但是以十六进制方式查看，发现文字确实是以 GB2312 编码的。可能是 vimrc 里不知道哪儿写错了。具体情况请见 VIM 的帮助文档“ :h encoding-values ”。

3. GB2312 的编码

每个汉字及符号以两个字节来表示，高位字节使用了 0xA1-0xF7 ；低位字节使用了 0xA1-0xFE 。由于一级汉字从 16 区起始，汉字区的“高位字节”的范围是 0xB0-0xF7 ，“低位字节”的范围是 0xA1-0xFE 。

Unicode 出现后， GB2312 的全部 7445 个字符都在 Unicode 的覆盖范围之内，并分布在 U+00A4 到 U+FFE5 之间。另外， GB2312 的常用汉字按拼音排列，次常用汉字按笔画排列，因此与 Unicode 的汉字部分的字序是不同的。

二 GBK（Chinese Internal Code Specification）

1. 简介

GBK 诞生于 1993 年的 Unicode 1.1 版之后。之前的 GB2312-80 只有 6763 个汉字，且很多汉字在 1981 年之后才得到简化，故中国大陆制定了等同于 Unicode 1.1 版的“ GB 13000.1-93 ”，收录中国大陆、台湾、日本、韩国的通用字符集，共 20902 个汉字。微软利用 GB 2312-80 未使用的编码空间，收录 GB 13000.1-93 全部字符制定了 GBK 编码。最早实现于 Windows 95 简体中文版。虽然 GBK 收录 GB 13000.1-93 的全部字符，但编码方式并不相同。以下为 GBK 的双字节编码示意：

2. 编码

字符有一字节和双字节编码， 00-7F 范围内是一位，和 ASCII 保持一致，此范围内严格上说有 96 个文字和 32 个控制符号。双字节中，第一字节的范围是 81-FE （也就是不含 80 和 FF ），第二字节的一部分领域在 40-FE ，其他领域在 80-FE 。

三 GB18030

1. 简介

最新版本为 GB 18030-2005 ，与 GB 2312-1980 完全兼容，与 GBK 基本兼容，支持 GB 13000 及 Unicode 的全部统一汉字，共收录汉字 70244 个。与 UTF-8 相同，采用多字节编码，每个字可以由 1 个、 2 个或 4 个字节组成。支持中国国内少数民族的文字，收录范围包含繁体汉字以及日韩汉字。

2. 编码

单字节部分，收录了 GB/T 11383-1989 的 0x00 到 0x7F 全部 128 个字符；双字节部分： GB 13000.1-1993 的全部 CJK 统一汉字字符等，其首字节码位从 0x81 至 0xFE ，尾字节码位分别是 0x40 至 0x7E 和 0x80 至 0xFE 。；四字节部分：收录了上述双字节字符之外的， GB 13000 的 CJK 统一汉字扩充 A 、 CJK 统一汉字扩充 B 和已经在 GB 13000 中编码的中国少数民族文字的字符，采用 0x30 至 0x39 作为对双字节编码的扩充的后缀。这样扩充的四字节编码，其范围为 0x81308130 到 0xFE39FE39 。四字节字符的第一个字节的编码为 0x81 至 0xFE ；第二个字节的编码范围为 0x30 至 0x39 ；第三个字节编码范围为 0x81 至 0xFE ；第四个字节编码范围为 0x30 至 0x39 。

四 Unicode

1. Unicode 中的 scripts

Unicode 中的 script 指的是一种或多种书写系统中，用来代表文字信息的一个字符或其他书写符号的集合。例如，俄语和乌克兰语分别是西里尔 script 的不同子集。有些 script 支持且仅支持一种书写系统和语言，如亚美尼亚 script ；另一些 scripts 支持多种不同的书写系统，如 Latin script 支持英语、法语、德语、意大利语、越南语和拉丁语。有些语言使用多种不同的书写系统，因此也使用若干个 scripts 。在土耳其语中，阿拉伯语的 script 在 20 世纪之前使用，但到 20 世纪早期则转变为 Latin script 。汉字书写系统使用在以下语言中：普通话、吴语、粤语、闽语（译者注：台语）、湘语、客家语、赣语、晋语、徽州语、广西平语、侗语、白语（已废弃）、苗语（已废弃）、壮语（已废弃）、日语、韩语（已废弃，只使用于学术文本和报纸中），越南语（用于历史文献、学术文献或出于艺术与审美的考虑）及其他已经失传的语言（契丹文、女真文、西夏文）。

与 scripts 相补充的是 Unicode symbols 。 Scripts 和 symbols 覆盖了所有的 Unicode 字符，统一发音符号和统一标点符号字符经常具有内在的 script 属性，但是单独的 script 常常也具有自己的发音符号和标点符号。所以很多 script 不仅包括字母，也包括发音符号和其他标记、标点符号、数字甚至其自己的特异性的符号和空白字符。

下图分别为以 Script 为单位和以区块为单位划分 Unicode 字符。

关于 CJK 统一表意文字（ Han ideographic characters ）： Unicode 标准中的“统一表意文字”的说法是西文中一个传统词语，尽管专业语言学家更喜欢“ Sinogram ”这个词。字面上说， ideograph 只适用于某些古代的、原始的汉字形式，这些字的确是来源于表意描述。但绝大部分汉字是后来经组合、假借和其他非表意性的原则发展而来的，但“ Han ideographs ”这个说法仍在英文中沿用。

2. Unicode 平面（ Plane ）

Unicode 将代码点（ Code Point ）分为 17 个平面，其中第 0 个平面（基础多语言平面， Base Multilingual Plane ）包含代码点 0x0000-0xFFFF ，第 1 个平面包含 0x10000-0x1FFFF ，以此类推。其实第 0 平面已经包含了绝大部分各种语言的常用字符，位置空间分布示意图如下（左上角为原点，格子中的两位十六进制数表示高位字节）：

包含汉字（ Han ideographs ）的区块有：

CJK统一表意文字（4E00-9FFF）：常用汉字
CJK统一表意文字扩展A（3400-4DBF）：罕用汉字
CJK统一表意文字扩展B（20000-2A6DF）：罕用汉字
CJK统一表意文字扩展C（2A700-2B73F）：罕用汉字
CJK兼容表意文字（F900-FAFF）：重复字符，可统一的异形字
CJK兼容表意文字补充（2F800-2FA1F）：可统一的异形字

五 UTF-8

1. 简介

全称 UCS Transformation Format �C 8-bit ，是一种对 Unicode 的多字节编码。与 UTF-16 和 UTF-32 类似， UTF-8 可以表示 Unicode 字符集中的每个字符。与它们不同的是， UTF-8 与 ASCII 是向后兼容的，并且避免了尾数（ endianness ）的复杂性。鉴于各种原因， UTF-8 已成为 www 最重要的字符编码，涉及超过半数网页。 UTF-8 使用 1 至 4 个字节对 Unicode 字符集中的 1,112,064 个代码点中的每一个进行编码。具体而言，使用 1-3 个不等的字节数编码 Unicode 的第 0 个平面。数值较低的代码点使用较少的字节数，使得编码体系较为高效。注意， Unicode 对所有字符进行编码，完成从字符到代码点（如 0x4E00 ）的映射，而与字符的具体表示无关； UTF-8 完成由编码到内在表示（字节码）的映射，而不关心某个编码具体代表哪个字符。

2. 编码范围

Unicode 字符集的前 128 个字符与 ASCII 码保持一对一关系，使用一个字节进行编码，使得有效的 ASCII 文本在 UTF-8 编码的 Unicode 下仍然有效。理论上， UTF-8 可以至多编码 2 的 31 次方个字符（即 Universal 字符集起草时的理论上限）。

3. 编码规则

如果一个字符用一个字节编码，则最高位是 0 ，其他位给出编码值（ 0 到 127 ）；

如果一个字符用 k （ k>=2 ）个字节编码，则第一个字节的前 k 位为 1 ，接着是一个 0 。随后的（ k-1 ）个字节全部由“ 10 ”开头。所有字节的剩余位连接起来，形成了 Unicode 代码点值，从 0x80 到 0x10FFFF 。由此可见：

（ 1 ）一个以 0 开头的字节表示单字节字符

（ 2 ）一个以 11 开头的字节表示一个多字节字符的开头

（ 3 ）一个以 10 开头的字节表示一个多字节字符的非开头

这样设计使得任何一个字节序列都可以被识别，并不需要从字符串的头部开始。另外由图可见， UTF-8 其实是使用 1-6 个字节来代表一个字符的，即可以表示到 0x7FFFFFFF ，但是据说为了与 UTF-16 兼容，最高的若干位没有用，只用到 0x10FFFF 。

以下面这个文档为例，文档以 UTF-8 编码。

使用 16 进制方式显示，如图：

分析如下：

（ 1 ）在 UTF-8 中，单个字母是用一个字节表示的，如 A 表示为 0x41 （十进制的 65 ），以此可以定位到汉字“一”被表示为三个字节： 0xe4, 0xb8, 0x80 ；

（ 2 ）汉字“一”是 Unicode 中 CJK 统一表意文字区的第一个字符， Unicode 码为 0x4e00 ，既然表示为三个字节，则使用“ 1110xxxx 10xxxxxx 10xxxxxx ”的模板，把 4e00 这十六位编码套进去，正好就是“ e4 b8 80 ”；

（ 3 ） fileformat 是 unix ，因此换行符是一个 <NL> ，即 0x0a ；

（ 4 ）上述文档在 Ubuntu 里说大小为 29 bytes ，数一数的确如此。

六文泉驿

1. 简介

作为几千年中华文明的见证，浩瀚传统文化传承的载体，汉字是让我们每一个中国人引以为豪的东方文明标志之一。我们的祖先创造汉字，书写汉字，利用汉字和汉语的无穷魅力创造出让人叹为观止的文学、艺术。而今天进入了计算机时代的我们，虽然不再象古人一样手持毛笔，批著简帛，但我们的生活仍然无时无刻离不开汉字。

可以毫不夸张的讲，汉字是世界上已知的最为庞大的符号系统。早在殷商时期，我们的先人就创造出了数目巨大的甲骨文，从上万片发掘的甲骨中整理出来的单字就有四千余个。东汉许慎编撰的“说文解字”，收录汉字 9,353 个。至清朝康熙年间，由段玉裁等人收集整理的“康熙字典”收录汉字竟达 47,035 之多。加上少数民族文字，各种古代典籍上曾经出现但并未广泛使用的古汉字和异体字，汉字总数多达十万以上。作为现代计算机系统通用编码的统一码 (Unicode) 在最新发布的 5.2 版中共收录汉字 ( 包括简体、繁体，以及日、韩、越等地区使用的汉字 ) 共 74,394 个。（注：微软的中易宋体的最新版本只有 42,809 个字）

我们是一群致力于在计算机世界中推广汉字，丰富电子汉字资源的志愿者。我们希望通过自己无私的劳动，使得无论您在世界上任何一个角落，都可以免费地获得我们的电子汉字资源，能够流畅地通过汉字进行交流。“文泉驿”是以上述目标为宗旨而自发创建的非盈利性组织。

2. 文泉驿正黑（ WenQuanYi Zen Hei ）

文泉驿正黑体是一个 " 自由字体 " 。该字体包含了所有常用简体中文、繁体中文所需要的汉字 ( 最新版本包含超过 27842 个汉字，完整覆盖 GB2312/Big5/GBK 以及 GB18030 标准字符集 ) 。该字体同时还包含了日文、韩文和其他几十种语言符号。除此以外，该字体还嵌入了最新版本的文泉驿点阵宋体的中英文点阵，使得屏幕汉字显示清晰锐利，易于阅读。

作为黑体中文字体，文泉驿正黑为非衬线字体，笔画对比度明显，特别适合屏幕汉字显示以及文档标题字体。

3. 文泉驿微米黑（ WenQuanYi Micro Hei ）

文泉驿微米黑是一个 " 自由字体 " 。该字体包含了所有常用简体中文、繁体中文所需要的汉字 ( 最新版本包含超过 20932 个汉字，完整覆盖 GB2312/Big5 以及 GBK 标准字符集 ) 。该字体同时还包含了日文、韩文和其他几十种语言符号。以外，该字体还包含了高质量的 Droid Sans 拉丁符号和 Droid Sans Mono 等宽字体，并内置 Hinting 和 Kerning 信息。微米黑字体文件极小，特别使用于便携式电脑设备。

4. 文泉驿点阵宋体（ WenQuanYi Bitmap Song ）

文泉驿点阵宋体是一个 " 自由中文字体 " 。该字体包含了所有常用简体中文、繁体中文，日文及韩文所需要的汉字 ( 最新版本包含超过 27842 个汉字，完整覆盖 GB2312/Big5/GBK/GB18030 标准字符集 ) 。该字体同时还包含了英文、日文、韩文和其他多种语言符号。该点阵字体包含五个屏幕常用字号 (9pt-12pt) ，逾 21 万汉字点阵，这些点阵都经过参与者和组织者的精心设计和调整，手工优化后的汉字点阵显示清晰锐利，特别易于屏幕阅读使用。

我们目前提供下载的文泉驿点阵宋体只能够在 Linux/Unix 系统上使用。在 Windows 上使用该字体，请下载文泉驿正黑体，正黑体嵌入了所有 GBK 汉字点阵，在 9-12pt 范围内，将自动使用点阵宋体显示。

七正则表达式

1. Unicode 字符的一般正则表达式表示

支持 Unicode 的程序中的正则表达式通常支持 \uNUM 原序列，用来匹配一个具体的 Unicode 字符。这个数值通常是一个 4 位十六进制数，例如， \uC0B5 的意思是“匹配编号为 U+C0B5 的 Unicode 字符”，而没说具体需要比较哪些字节，因为具体的字节是由代表这个 Unicode 代码点的编码方式在内部决定的。如果程序内部使用的是 UTF-8 编码，这个字符就用 3 个字符表示。不过使用支持 Unicode 程序的用户，并不需要关心这个。

为了匹配任何一个 Unicode 字符，应该用 \X ，这相当于 Unicode 中的点号。在 Java 中，用 \uFFFF （ FFFF 是代码点）来匹配某个特定的 Unicode 字符。

2. Perl 或 PCRE 中 Unicode 字符的正则表达式表示

在 Perl 或 PCRE 中，并不支持 \uFFFF 这样的语法，而是使用 \x{FFFF} 。例如， \x{1234} 不会和“匹配 \x 1234 次”混淆，而是永远代表 U+1234 这个 Unicode 字符； \x{1234}{5678} 则代表匹配 U+1234 这个 Unicode 字符整整 5678 次。

Perl 或 PCRE 还是极少数的支持基于 Scripts 对 Unicode 进行匹配的正则表达式引擎！方法是 \p{Script_Name} 例如， \p{Bopomofo} 匹配一个注音符号字母， \p{Han} 匹配一个汉字。此外还支持基于区块的匹配，如 \p{InCJK_Unified_Ideographs} 匹配所有 CJK 统一表意文字区的字符（等同于 U+4E00…U+9FFF 。

在 Perl 中读取以 UTF-8 编码的文件，还有另一个问题：当使用 <> 或 <FILEHANDLE> 等方式读取文件时， perl 会把文件视为一系列字节流，而 UTF-8 是变长字节编码的，想以字符（而不是字节）为单位来处理，则必须进行解码。

例如，运行如下代码

打印出来的是每行一个带问号的小菱形，说明字符串 $_ 中每个单元是一个字节。要解决这个问题，有两种思路：一方面使用 binmode 改造句柄，使之以 UTF-8 方式读取，如下：

但是这样有个问题是第一个字符不能正常读取！之后的都正常！这是为什么啊！另一个思路是对读入的字符串进行处理，即告诉 perl 这个字符串（本质上是字节序列）要以 UTF-8 的多字节方式解析。这一过程是 decode ，因此用以下方法可以解决问题：

读入之后，就可以用 \x{abcd}, \p{Han} 或 \p{InCJK_Unified_Ideographs} 等方式对其进行正则表达式处理了。

3. Vim 对 Unicode 正则表达式的支持

作为最强大的文本编辑器， Vim 对正则表达式的支持是人尽皆知的。而且，毕竟是文本编辑器，执行个查找啊替换啊这种处理会比用 perl 直观得多。但是，对于 Unicode 字符的支持， Vim 采用的正则表达式引擎却远比不上 Perl（图为节选）：

有人说，为什么 Vim 不用 PCRE 呢？回复说， Vi 比 Perl 出来的早得多，应该问为什么 Perl 不跟 Vi 学。无论如何，在 Vim 里匹配 Unicode 字符会遇到一点麻烦：你可以用 /\u4e00 匹配“一”，也可以用 /[\u4e00-\u4eff] 匹配 Unicode 表中的第一行汉字（一、丁、万、三、上……），却不能用 /[\u4e00-\u9fff] 匹配 CJK 统一表意文字区块中的所有文字！不知道是不是我的使用有问题！

八 Ubuntu中的字符映射表（Character Map）

这是 Ubuntu 中相当于 Windows “字符映射表”的软件，可以在 Applications -> Accessories 中找到。且不说以文泉驿微米黑显示的字符表有多好看，就说这个 Character Details 就做得非常帅，给出的信息包括： UTF-8 编码方式、 XML 实体表示形式、英文释义、普通话发音、广东话发音、日语发音、韩语发音！

工作过程中有时候需要看看 Unicode 的 Scripts ，或者查找某个字符的 Unicode 码，或者要 copy 某种北欧语言的奇怪字符，都可以用 Character Map 。

另外，字符映射表支持根据字符查找与根据 Unicode 值查找：

在这两天的折腾过程中，帮了不少忙。

本来只是想解决 Perl 处理 UTF-8 中文文档的问题，不小心扯出来这么多东西。以上是这两天折腾的全部结果，折腾了 24 小时……没有苦劳也有疲劳啊。

九参考资料

http://en.wikipedia.org/wiki/Windows_code_page
http://en.wikipedia.org/wiki/UTF-8
http://en.wikipedia.org/wiki/Plane_(Unicode)
http://en.wikipedia.org/wiki/Mapping_of_Unicode_characters
http://en.wikipedia.org/wiki/List_of_languages_by_writing_system
http://en.wikipedia.org/wiki/Comparison_of_regular_expression_engines
http://en.wikipedia.org/wiki/Code_pages
http://en.wikipedia.org/wiki/CJK_Unified_Ideographs
http://en.wikipedia.org/wiki/Basic_Multilingual_Plane
http://zh.wikipedia.org/wiki/Gb2312
http://zh.wikipedia.org/wiki/GBK
http://zh.wikipedia.org/wiki/GB18030
http://www.utf8.com/
http://www.unicode.org/versions/Unicode5.2.0
http://www.unicode.org/reports/tr18/
http://www.unicode.org/charts/
http://www.regular-expressions.info/charclass.html
http://wenq.org/index.cgi?ZenHei
http://wenq.org/index.cgi?MicroHei
http://wenq.org/?BitmapSong
http://vim.wikia.com/wiki/Perl_compatible_regular_expressions
http://perldoc.perl.org/perlunicode.html
http://msdn.microsoft.com/en-us/library/20bw873z.aspx
http://forum.ubuntu.org.cn/viewtopic.php?t=244756

多云环境密钥硬核防护：KDPS如何实现千万级密钥生命周期管理？安当加密安全
当GitHub2023年报告显示63%的数据泄露源自测试环境时，某证券公司因测试机密钥硬编码导致量化模型被盗的教训，揭示了多云时代的安全真相：分散的密钥管理=为黑客铺就黄金路。上海安当KDPS关键数据保护系统，以国密认证的KSP密钥中台+HSM硬件加密机为核心，构建千万级密钥的“中央管控引擎”。本文从三大维度拆解其硬核能力：一、密钥管理“铁三角”：集中化、自动化、合规化能力维度传统方案痛点KDPS
《三生原理》如何优化注意力机制？
AI辅助创作：《三生原理》通过融合《周易》哲学的数理模型，对注意力机制进行了多维度优化，主要体现在动态计算重构、位置编码革新与训练效率提升三方面，具体路径如下：‌一、动态筛网替代传统注意力计算‌‌三级筛网分层过滤‌‌初级筛网‌：基于素数参数化公式（p=3(2n+1)+2(2n+m+1)）预判无效特征交互，压缩注意力计算范围，减少多头冗余计算45%。‌中级判据‌：引入五行属性权重动态分配机制，依据模
《三生原理》如何解决长程依赖问题？葫三生三生学派人工智能平面线性代数概率论算法
AI辅助创作：《三生原理》通过融合《周易》的生成哲学与分形数学，创新性地重构了序列建模的逻辑框架，有效缓解长程依赖问题，其核心技术路径如下：一、八卦拓扑位置编码替代正弦编码‌‌符号系统的动态映射‌将伏羲八卦的拓扑结构（乾☰、坤☷等）转化为位置矩阵，通过‌模12余数配对法则‌建立位置关联性：阳爻（⚊）映射奇数位，阴爻（⚋）映射偶数位，形成周期性位置感知网格在512长度序列中，位置关系捕捉准确率提升2
Solidity学习 - ABI 应用二进制接口本郡主是喵 #Solidity 学习区块链 Solidity
文章目录一、ABI基础概念1.ABI与API的区别2.ABI的核心作用二、ABI接口描述1.编译后的产物2.ABIJSON格式示例3.ABIJSON关键字段说明三、ABI编码1.编码示例2.编码数据的组成3.Solidity中的编码函数四、ABI解码1.解码的基本概念2.事件日志的解码五、ABI编解码可视化工具一、ABI基础概念1.ABI与API的区别API（应用程序接口）：是两个软件之间进行通信
简说 MISRA-C++ is0815 c++
MISRA-C++是嵌入式系统中广泛采用的C++编码规范，旨在提高代码安全性、可靠性和可维护性。以下是MISRA-C++的详细要求，涵盖核心规则分类、禁用特性及最佳实践：一、核心规则分类1.语言使用限制禁用动态内存分配（new/delete、std::malloc）风险：内存碎片、分配失败导致运行时崩溃替代：静态数组、对象池或定制内存分配器禁用异常处理（try/catch/throw）风险：异常展
C#使用ExcelDataReader高效读取excel文件写入数据库香煎三文鱼 .net core .Net6 C#C#读取excel
分享一个库ExcelDataReader，它专注读取、支持.xls/.xlsx、内存优化。首先安装NuGet包dotnetaddpackageExcelDataReaderdotnetaddpackageSystem.Text.Encoding.CodePages编码内存优化：每次仅读取一行，适合处理百万级数据。类型安全方法：可用GetString(0)、GetDouble(1)等强类型方法（需确
Xcode安装方式纵使风吹 Mac实用工具 xcode ios macos
Xcode安装方式1.什么是XcodeXcode是运行在操作系统MacOSX上的集成开发工具（IDE），由AppleInc开发。Xcode是开发macOS和iOS应用程序的最快捷的方式。Xcode具有统一的用户界面设计，编码、测试、调试都在一个简单的窗口内完成。在实际应用方面，Xcode常常被用作iOS手机模拟器。2.Xcode安装方式方式一：在Mac电脑中自带的商店里搜索Xcode软件进行安装。
【HarmonyOS next】ArkUI-X休闲娱乐搞笑日历【基础】 harmonyos-next
引言在跨平台应用开发中，网络图片在不同设备上的适配展示是常见挑战。本文将基于HarmonyOSnext的ArkUI-X框架，通过一个休闲娱乐日历应用，展示如何实现网络图片在华为和iOS设备上的完美适配。应用每日通过API获取搞笑日历图片，并在不同设备上智能适配显示。开发环境操作系统：macOS开发工具：DevEcoStudio5.0.4测试设备：华为Nova12Ultra、iPhone13Pro开
【HarmonyOS next】ArkUI-X休闲益智记忆翻牌【进阶】 harmonyos-next
本文通过记忆翻牌游戏实现，揭秘网络图片在HarmonyOS与iOS设备上的渲染差异，并提供专业级优化方案。基于ArkUI-X的Web组件技术，我们实现了一套代码双端运行的混合架构。一、跨平台实现架构//ArkTS核心实现importweb_webviewfrom'@ohos.web.webview';@Entry@ComponentstructIndex{controller:web_webvie
【HarmonyOS Next】ArkUI-X休闲益智接水果【进阶】 harmonyos-next
本文通过ArkUI-X实现跨平台接水果游戏，深入探究网络图片在HarmonyOS与iOS设备上的渲染差异，并提供专业级优化方案。基于WebView的混合架构，我们实现了单代码库双端适配的高效开发模式。一、跨平台架构设计//ArkTS核心实现importweb_webviewfrom'@ohos.web.webview';@Entry@ComponentstructIndex{controller:
【HarmonyOS next】ArkUI-X休闲益智儿童拼图【进阶】 harmonyos-next
【HarmonyOSnext】ArkUI-X休闲益智儿童拼图【进阶】一、前言：当拼图遇上跨端开发最近在开发一款跨平台的儿童拼图游戏时，我深刻体会到了ArkUI-X框架的威力——同一套代码竟能同时在华为Mate60Pro和iPhone15上流畅运行！这不仅节省了开发成本，更重要的是确保了多端用户体验的一致性。今天我们就来聊聊这个项目的核心技术点，特别是拖动坐标计算和图片剪影生成这两个让人"又爱又恨"
设计一个监控摄像头物联网IOT（webRTC、音视频、文件存储） Amarantine、沐风倩✨ 物联网IOT 物联网 java html5 webrtc 音视频视频编解码七牛云存储
前言：设计一个完整的监控摄像头物联网IoT平台涉及视频直播和点播、WebRTC和文件存储模块，可以分为以下几个主要部分：摄像头设备、服务端处理、Web前端、视频流存储和回放。以下是结合这些技术的一个具体完整流程设计，涵盖了各个组件的相互关系、数据流动及关键技术点。1.系统组成监控摄像头：摄像头设备负责采集实时视频流并进行编码（如H.264或VP8）。Java服务端：服务端基于SpringBoot等
python学习记录14 彤银浦学习 python
1.字符串的编码和解码不同的计算机之间在信道中传输的信息本质上是二进制数据，因此当你有一串文本需要传输给另外一台电脑时，则需要将这串文本编译为二进制类型的数据。python中的二进制数据类型称为byte类型。将字符串的str类型转变为byte类型称为字符串的编码，将byte类型转变为str类型称为字符串的解码。字符串的编码用到的是encode的方法，语法格式为：string.encode(enco
数电·优先编码器 CD4532的使用方法 Hi_kenyon 单片机嵌入式硬件
如何使用CD4532编码器CD4532是一个8输入优先编码器的集成电路芯片。它有8个输入信号（D0至D7），3个输出信号（A0至A2），以及一个有效输出信号（EO），这个信号可以用来判断是否有输入信号为高电平。这个芯片的功能是将8个输入信号编码为一个3位的二进制数，其中D7具有最高的优先级。使用CD4532的步骤如下：连接电源：将Vdd（芯片的第16脚）连接到+5V电源，将Vss（芯片的第8脚）连
《AI颠覆编码：GPT-4在编译器层面的奇幻漂流》的深度技术解析踢足球的，程序猿人工智能 python c语言
一、传统编译器的黄昏：LLVM面临的AI降维打击1.1经典优化器的性能天花板//LLVM循环优化Pass传统实现（LoopUnroll.cpp）voidLoopUnrollPass::runOnLoop(Loop*L){unsignedTripCount=SE->getSmallConstantTripCount(L);if(!TripCount||TripCount>UnrollThreshol
软件测试从业者必备的SQL知识十二测试录数据库 sql 数据库
作为职场人，学一门技能是用来解决日常工作问题的，没必要从头到尾把这块知识弄透，没那么多时间。基于此，十二根据自己的经验，把软件测试从业者需要掌握的SQL知识，整理如下；只要跟着这个顺序，从头到尾执行即可。前置准备事项：1、在自己电脑上安装一个mysql数据库，文章见->虚拟机Centos下安装Mysql完整过程（图文详解）_虚拟机安装mysql-CSDN博客2、找一个mysql客户端链接工具：初学
LeetCode--38.外观数列 dying_man leetcode 算法
前言：之前我不是说，我后续可能会讲一下递归吗，现在它来了，这道题会用到回溯的方法，并且比较纯粹哦解题思路：1.获取信息：（下面这些信息差不多是力扣上面的题目信息了，所以我这一环节在这次题解中的意义不大）外观数列是一个数位字符串序列，由递归公式定义：countAndSay(1)="1"countAndSay(n)是countAndSay(n-1)的行程长度编码。行程长度编码（RLE）是一种字符串压缩
英国留学生顺利拿到offer！博士学历+微软MOS国际认证加buff！全球认证考试中心 microsoft
在全球化职场竞争日益激烈的当下，英国留学生若想提升自身竞争力，考取高含金量的国际证书是一条有效途径。MicrosoftOfficeSpecialist（MOS）国际认证作为微软官方推出的办公软件专业认证，在全球168个国家和地区得到认可，每年吸引近百万人次报考，已成为众多外企筛选人才的重要标准。正值暑假，不少同学计划利用这段时间备考MOS，本文将结合实际经验，为大家提供一套系统的备考方案。一、为何
将图片的base64编码直接嵌入到html文件的css中 Kuo-Teng 软件开发实战 html css javascript
将图片的base64编码直接嵌入到html文件的css中1.背景2.将图片进行base64编码3.将图片的base64编码写入到css1.背景如果你需要在html中引入一张外部图片，你可能会这样做：如果你将引用的图片保存到本地，你可能会这样做：但是，如果网络延迟较高，或者在jar包中运行Java项目时无法根据路径顺利找到图片呢？那么，将图片的base64编码直接写入html文件便是最好的选择！2.
html 照片环 - 图片的动态3D环绕 das白 #javascript html 3d javascript 照片环 3D环绕
html照片环-图片的动态3D环绕引言一、源码二、图转base64参考链接引言效果展示：一、源码原始图片的base64编码字符太多了，博客放不下，将图片缩小后的加入html的源码如下：猫咪body{background-color:black;text-align:center;color:#FFF;}.jc{/*设置宽*/width:140px;/*设置高*/height:200px;/*设置背
【策划所需编程知识】叫我六胖子笔记游戏
1、TCP与UDP名称TCPUDP方式先奏后斩先斩后奏优点防外挂，慢但不出错用户体验好常用游戏MMORPGFPS、MOBA、IO类2、弱联网与实时联网名称弱联网实时联网方式只在必要时链接频率很高特点频率低频率高特点对宽带要求不高对宽带要求高常用游戏卡牌、放置挂机、轻度休闲、SLGFPS、MOBA、IO类
Linux 设备树详解：从概念到实战 Jay_515 Linux 学习嵌入式 linux 设备树
关键词：设备树（DeviceTree）、DTS、DTC、DTB、嵌入式Linux驱动开发为什么需要设备树？在旧版Linux内核中，硬件信息（如内存映射、外设地址、中断号等）直接硬编码在内核源码中。这导致：内核臃肿，需为不同硬件编译不同版本硬件变动需重新编译内核代码冗余严重（一个board-*.c文件对应一块开发板）设备树（DeviceTree）的引入彻底解决了这一问题！它通过描述硬件拓扑结构的文本
生僻字处理工具类兮动人 JavaSE 实用工具 java 生僻字处理工具类生僻字
对于生僻字的处理可以用到下面相关编码查询汉字对应的编码：https://www.qqxiuzi.cn/bianma/zifuji.php文章目录生僻字处理概述功能介绍快速开始判断是否是生僻字utf8字符串转gbk伪码gb18030字符串转gbk伪码gbk伪码转utf8gbk伪码转gb18030生僻字处理概述在系统存储、跨系统报文或文件传输过程中，保证生僻字信息的完整性。功能介绍通过生僻字工具类，判
swift 对象转Json 泓博 swift
在Swift中将对象转换为JSON可以通过以下方法实现：使用Codable协议Swift的Codable协议（Encodable和Decodable的组合）是处理JSON编码和解码的推荐方式。structPerson:Codable{varname:Stringvarage:Int}letperson=Person(name:"John",age:30)letencoder=JSONEncoder
《python算法与数据结构2000讲》0639. 解码方法 II IT狂飙 python 算法数据结构
《python算法与数据结构2000讲》0639.解码方法II标签：字符串、动态规划难度：困难题目大意描述：给定一个包含数字和字符'*'的字符串s。该字符串已经按照下面的映射关系进行了编码：A映射为1。B映射为2。…Z映射为26。除了上述映射方法，字符串s中可能包含字符'*'，可以表示1~9的任一数字（不包括0）。例如字符串"1*"可以表示为"11"、"12"、…、"18"、"19"中的任何一个编
Java开发者必备：5个提升编码效率的实用技巧 Java鼠鼠吖开发语言 java
导语在日常开发中，巧妙运用语言特性可以大幅提升代码质量和开发效率。本文分享5个经过验证的Java实用技巧，涵盖资源管理、集合操作和API设计等场景，附可直接复用的代码模板，帮助您写出更优雅健壮的代码。免费获取Java学习资料一、自动化资源管理技巧场景：传统try-finally代码冗长且易遗漏关闭操作改进方案：//传统写法（易出错）FileInputStreamfis=null;try{fis=n
Python编程基础：从变量到循环我是渣渣辉 python 开发语言
Python1.注释2.变量什么是变量？为什么使用变量（必要性）？定义变量标识符（变量）命名规范两个数交换3.python的数据类型基本数据类型复合数据类型数据类型的转换（input的输入默认是字符串类型）自动类型转换强制类型转换字符串格式化输出常用运算符算术运算符逻辑运算符关系运算符赋值运算符三目运算符位运算符所属运算符程序控制流程顺序选择循环总结1.注释python3.8默认是UTF-8编码#
7、使用Sonic Pi进行音乐编程轩辕姐姐树莓派冒险：从零开始的编程之旅 Sonic Pi 音乐编程树莓派
使用SonicPi进行音乐编程1.引言树莓派不仅仅是一个小型计算机或游戏机，它还可以成为一个强大的音乐合成器。通过使用SonicPi这款应用程序，我们可以将计算思维与音乐创作结合起来，创造出独一无二的音乐作品。本文将详细介绍如何使用SonicPi进行音乐编程，帮助你将树莓派变成一个多功能的音乐创作平台。2.SonicPi简介SonicPi是一款专门为树莓派设计的音乐编程应用程序，由音乐现场编码员S
基于Transformer实现机器翻译 yyyyurina. transformer 机器翻译深度学习
目录一、前言1.1什么是Transformer?1.2Transfomer的基本结构1.2Transformer的重要组成部分1.2.1位置编码（PositionalEncode）1.2.2自注意力机制（Self-Attention）1.2.3多头注意力（Multi-HeadAttention）1.2.4位置感知前馈层（Position-wiseFFN）1.2.5残差连接与层归一化二、AutoDL
.NET测试工具Parasoft dotTEST内置安全标准，编码合规更高效慧都小项 Parasoft 软件测试 .net Parasoft 安全编码标准代码合规嵌入式C#组件软件测试
在追求开发速度的时代，确保代码安全并满足严苛的行业合规标准如OWASP、CWE、PCIDSS、ISO26262等已成为开发者的核心挑战，但开发人员常因复杂的编码标准和漏洞排查而效率低下。.NET测试工具ParasoftdotTEST内置安全标准，实现即插即用，直观映射，有效解决这一痛点，提升开发效率，降低安全风险。一、即插即用，无缝集成安全编码标准在使用dotTEST时，开发团队可以轻松地根据OW
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置

[转] 汉字字符编码的科普笔记

你可能感兴趣的:(编码,职场,汉字,休闲)