Javascxl

关于字符集和乱码的思考

1.字符集的基本概念

什么是字符集？什么是字符编码？

按照“Character set encoding basics”文中的定义，字符集的编码模型分为以下4个层次

1）抽象字符清单Abstract character repertoire (ACR)，无序，无编码；

2）已编码字符集Coded character set (CCS)，有序，有编码；

3）字符编码规则Character encoding form (CEF)，有序，有编码；

4）字符编码方案Character encoding scheme (CES)，有序，有编码，有传输和储存规则（字节序）；

这种分层方式，比较偏于学术化，不太容易理解。按我个人的理解，GB2312/GBK/GB18030/ASCII这些字符集编码规则，由于都基于8-bit字节，是属于前三层的，可以认为是三层合一。如果拿Unicode来说明的话，Unicode中定义的所有字符的集合，是第一层；我们通常说的Unicode编码，是指的第二层；现在最常见的UTF-8，是指的第三层。当UCS-4在以8-bit为基础的计算机中存储和传输时，就要涉及字节序的问题，就是第四层，分为big-endian和little-endian。

借用“程序员趣味读物：谈谈Unicode编码”中举的一个记事本例子（内容不同）：

1）打开记事本(windows自带的那个)，输入“我”；

2）另存为我_ansi.txt，注意，编码选择“ANSI”；

3）另存为我_unicode.txt，注意，编码选择“Unicode”；

4）另存为我_unicode_big.txt，注意，编码选择“Unicode Big Endian”；

5）另存为我_utf8.txt，注意，编码选择“UTF-8”；

保存完以后，看一下4个文件的大小，很有意思吧，分别是2/4/4/6个字节，再用二进制方式（推荐使用ultraedit）查看一下其中的内容：（高位字节在前）

1）ansi:CE D2

2）unicode:FF FE 11 62

3）unicode_big:FE FF 62 11

4）UTF-8:EF BB BF E6 88 91

第一个文件，ansi，比较好解释，2字节，就是GB2312/GBK/GB18030编码，即简体中文windows的默认内码

第二个文件，unicode，就是Unicode编码，“我”的编码是0x62 0x11,不过前面多了2字节的前导符，FF FE，表示为little-endian

第三个文件，unicode_big，也是Unicode编码，不过前导符变为FE FF，表示big-endian

第四个文件，UTF-8，是在Unicode基础上的二次编码，分别将FE FF(big-endian)和62 11进行了二次编码，详细编码过程参见“程序员趣味读物：谈谈Unicode编码”

常见字符集（字符编码规则）

ASCII，读作阿斯克码，7bit表示，美国国家标准信息编码，是最常用英文字母和符号、数字的集合及编码；它的常见别名是ISO 8859-1 ，Latin1

EASCII，扩展ASCII码，完整的利用一个字节，在ASCII的基础上扩展了一些不常用字符

GB2312，国标中文字符编码，1980年制定并颁布；

GBK，国标码，1995年

GB18030，国标码，2000年

以上这三个编码标准都是向下兼容的，兼容的意思有两方面，其一是指字符的集合，其二是指编码。另外，在微软操作系统中（其实也影响到了Linux领域），经常出现“代码页”（code page）的概念，这些代码页，只是微软自己的定义，可以理解为CP936=GBK。

Unicode，UTF-8，我原来一直以为这两个东东是一回事，后来发现其实理解错了，UTF-8可以理解为是以Unicode为基础进行二次编码的，详见这篇文章：“程序员趣味读物：谈谈Unicode编码”，http://pcedu.pconline.com.cn/empolder/gj/other/0505/616631_1.html

2.关于乱码的思考

什么是乱码

个人认为，如果在储存或传输过程中，计算机中的信息不能被正常解析，从而导致在信息展示的时候出现无法被正确理解的情况，可以认为出现了“乱码”。常见的乱码有两种表现形式:

1）部分中文字符能够正常展示，另外的中文字符被展示为方框；

这种情况多数是由于缺少相应的字体支持，例如，在虚拟机上安装完linux之后，如果没有安装图形界面，默认的字符窗口其实是没有相应的字体支持的，这时的中文只能显示为方框，安装zhcon以后才能够正常展示GBK/UTF8的中文字符。

还有一个场景，部分网页上的字符，并不能被所有浏览器支持，或者该浏览器对某种编码方式的支持不完整，会出现部分字符展示为方框的情况。

另外，如果能够以GBK/GB2312正常展示的网页，如果手工将encoding变更为utf-8，则所有中文字符都会变成方框。

2）几乎所有字符都不能正常展示，许多字符被显示为“？”，或者被显示为一大堆不可理解的古怪字符；

这种情况很可能是由于字符编码不配套，需要具体分析。例如，在浏览器中能够正常显示的页面，如果将其编码更改为其他不兼容的编码，则很多会展示为“？”和乱七八糟字符的组合

乱码产生的原因

产生乱码的原因很复杂，也正是这个原因导致了对乱码问题的分析很难全面和彻底。但是，综合我目前遇到的乱码问题来看，只要将字符展示的过程剖析清楚，一段段的调整，总能找到解决的办法。

字符在计算机中，都是以二进制的方式进行存储的，而且文本本身是不能够标识它使用的编码方式的。也就是说，同一段二进制字节流，可以用很多种不同的编码方式去解码，然后根据解码后的结果（也是二进制字节流），在操作系统中按照预定义好的字体进行展示。所谓字体库，或者字库，其实就是数字和相应展示方式（点阵、truetype等）的组合。计算机本身是不会“体会”到“乱码”的发生的，它只是按照用户选定的字体，根据不同的数字进行展示而已，无论展示的结果如何，都只有人才能判断“乱码”与否。乱码的产生，其实只有两个原因，一是没有使用正确的解码规则来解释字节流，二是使用了错误的展示字体。实际应用当中，编码规则的问题居多。

单字节的编码通常情况下不会出现乱码的问题，特别是英文字符，而双字节由于多数情况下编码规则复杂，另外存在中间截断的问题，会比较复杂。从产生问题的渠道来看，常见的有以下几类：

1）网页展示乱码

多数情况下，可以通过更改页面编码方式来解决。少数情况下，浏览器本身处理多语言字符集有缺陷的时候，无论怎样修改编码方式，都不能彻底解决乱码问题。例如，截至本文定稿，IE9就存在部分UTF-8中文编码无法解析的问题，同样的网页在Chrome和firefox中都没有问题。

2）UNIX/LINUX终端显示乱码

2.1）终端的中文环境；

如果没有合适的中文环境（字库支持），无论解码方式如何正确，也不可能正常展示中文。在常用的终端工具中，例如：Xshell/Secure CRT/Putty，都可以设置终端的字符编解码方式，通常设置的值有两个系列：

其一，GB2312/GBK/GB18030/CP936/ANSI/Default等，其实都是兼容的编码，或者仅仅是名称不一样；

其二，UTF-8，这个是在互联网上最常见的编解码方式了；

另外，如果不是windows下的终端工具，而是系统自身的字符终端，则可以安装字符终端专用的中文环境，例如linux下的zhcon

2.2）cat显示文本文档内容

通过类似cat命令的方式显示纯文本文档的内容，通常只受一个因素的影响，即终端的工具的字符编码方式，常用工具中都可以进行设置。只要文本内容的编码方式与终端的编码方式一致（或兼容），则一定不会出现乱码。

2.3）命令行的中文提示（CLI）

命令行接口Command Line Interface的提示语言，是通过环境变量进行设置的，好几个变量都可以设置，但优先级有区别，其中LC_ALL > LC_XX > LANG，如果想用中文显示提示信息，可以这样设置：

export LC_ALL=zh_CN.gbk

其中zh表示使用中文输出提示信息，gbk表示使用GBK编码方式输出中文提示信息，这个编码方式要与终端的设置一致或者兼容才可以正常显示；

2.4）输入中文信息

从Shell环境输入中文，与vi/vim这种编辑器的情况稍有不同，编辑器的情况放到下一节说明。按照一般的理解（我原来就是这样理解的），只要能正常显示中文的地方，一定能够正常输入中文。但是，实测的情况略有不同，详见下面的表格。

输入中文信息，我暂时只考虑了以下三种情况：

a）在SHELL命令行中输入中文

这种场景下，如果终端字符集是GBK，LC_ALL为UTF-8时，输入的中文字节流乱序（第一个中文字符的高字节被放到字节流的末尾），无法正常展示。

b）使用cat等方式输入中文，并重定向到文件中

这种场景下，任何时候，都能够正常输入中文

c）使用文本编辑器，详见下一节描述

与仅仅显示中文信息不同，输入中文的时候实际上经历了更多的步骤。最开始从终端工具中输入中文编码字节流，然后经过网络协议传输到服务端，服务端收到字节流以后，根据终端设置的情况，再推送显示信息到终端工具，终端工具进行呈现。在SHELL命令行中输入中文不正常的情况，很有可能是由于服务端的处理逻辑不健全。

2.5）文本编辑器，例如vim

文本编辑器的种类很多，emacs/vi等，vi的版本也很多，各个主流UNIX平台的商业版本实现都不相同，还有vim。本文暂以vim为例子进行说明，其他编辑器的情况应该是类似的。可以参考：“让vim认识更多的编码”，http://blog.chinaunix.net/space.php?uid=20147410&do=blog&id=3018800。

遗憾的是，这篇文章并未给出vim处理这三个内部变量的顺序，经摸索，顺序应该为：

1）fileencoding

2）endocing

3）termencoding

这三个内部变量均可以通过set xxx=xxx的方式进行设置，并可以通过set和set all进行查看。另外，上面提到的博文中是使用LANG变量来改变vim的encoding变量值，但由于LANG的优先级最低，实际使用过程中，使用LC_ALL的效果最好，当然其实也可以直接在vim中使用set进行设置。

个人理解，如果仅仅从输入和输出（显示）的角度来看，其实vim等文本编辑工具并没有必要设置3个不同的变量来进行处理，这大概也是大多数商用unix平台的vi版本都没有类似设置的原因。提供3个变量的原因在于，vim试图提供一些编码转换的方式，例如，通过设置fileencoding变量，可以改变vim写入和读出使用的编码，而termencoding仅仅改变显示时使用的编码方式，而encoding其实只是提供缓冲。这与数据库的字符集（编码）处理方式是类似的。也可以这样理解，无论这三个变量设置为何值，其实并不见得不会影响数据的输入和展示。例如，在我们输入输出中文信息的时候，即便fileencoding=encoding=termencoding=iso8859(英文字符集)，只要文本文件的编码方式与终端的编码方式一致（兼容），比如都是GB2312，文本信息都可以正常展示和输入。

附表：不同设置情况下的中文显示结果

服务端环境：ubuntu 11.10 服务器版

客户端环境：中文win7+Xshell 4

文件编码	终端字符集	LC_ALL	cat输出	SHELL输入	VIM相关					备注
文件编码	终端字符集	LC_ALL	cat输出	SHELL输入	vim显示	vim输入	encoding	fileencoding	termencoding	备注
GBK	GBK	GBK	正常	正常	正常	正常	GBK	GBK
UTF-8	GBK	GBK	乱码	正常	正常	正常	GBK	UTF-8
GBK	UTF-8	GBK	乱码	正常	乱码	乱码	GBK			如果将encoding或termencoding改为utf-8，则可以正常显示
UTF-8	UTF-8	GBK	正常	正常	乱码	乱码	GBK	UTF-8		如果将encoding或termencoding改为utf-8，则可以正常显示
GBK	GBK	UTF-8	正常	乱码	乱码	乱码	UTF-8	latin1		如果将encoding或termencoding改为latin1，则可以正常显示；或者将encoding和fileencoding改为GBK(cp936)
UTF-8	GBK	UTF-8	乱码	乱码	乱码	乱码	UTF-8	utf-8		如果将encoding或termencoding改为cp936，则可以正常显示
GBK	UTF-8	UTF-8	乱码	正常	乱码	乱码	UTF-8	latin1		如果将fileencoding改为cp936，则可以正常显示
UTF-8	UTF-8	UTF-8	正常	正常	正常	正常	UTF-8

3）数据库乱码

数据库中与编码/字符集相关的设置主要有两个，一个是数据库本身的编码，另一个是客户端环境的编码。网上有很多关于数据库乱码问题的讨论，多数并没有涉及到问题的本质。数据库中保存的数据，其实与文件方式保存的数据没有什么两样，都只是字节流而已，而字节流本身通常是不能自我标识的，例如，如果仅仅根据二进制的编码，无法判断出它的内容是采用GB2312编码，还是EASCII编码，或者是一个图像信息。也许，正是由于字节流无法标识自己，因此需要有一个参数来标识数据库使用的文字编码。在客户端与服务端的编码设置统一的时候，无论在数据库的字段中存储什么样的数据，都是不影响数据的储存和展示的，原因是，不会发生编码转换。

例如，网上很多帖子讨论到乱码问题的时候，给出的建议都是，将数据库的字符集设置为utf-8，这当然不会有什么问题，utf-8编码是被最广泛使用的编码标准，所以支持也相当完备，特别是utf-8编码几乎可以被所有软件“识别”出来（特征码）。这样一来，实际上掩盖了编码的问题。其实，如果仅仅为了储存和展示中文信息，将数据库的字符集设置为iso-8859-1（单字节）编码，客户端的语言环境也设置为同样的编码方式，存取中文数据，也不会有任何乱码的情况发生。之所以产生乱码，是由于在某些地方出现了编码方式的不匹配。

比如，数据库的编码设置为GBK，但是客户端的设置为UTF-8，那么如果在客户端使用UTF-8的编码方式输入中文数据，当客户端软件发现这种不一致时，会执行从UTF-8到GBK的编码转换，然后通过网络插入到数据库的具体字段中。当这段数据被读取时，如果客户端的设置为UTF-8，那么同样要发生GBK到UTF-8的转换，最终以UTF-8的形式展示数据。但是，如果数据被读取时，客户端的设置为GBK，则数据无需转换就可以以GBK的形式直接呈现，然而，如果客户端是设置为UTF-8编码的网页，但使用GBK方式访问数据库，那么数据被最终呈现时就会出现乱码。

总之，数据库提供设置数据库和客户端编码方式的选项，只是为了更好的提供编码转换工作，并不是必需的，无论设置成何种编码方式，与实际存储在字段中的数据都没有必然联系，只是会在编码转换的时候提供方便，否则，这些转换工作就只能完全交给客户端来完成。

3.尚未解决的疑问

1)关于windows剪贴板的实现机制中，是否包括了编码转换

从现象上来看，当从一个ansi编码的文本中拷贝中文字符，再到utf-8编码的文本中进行粘贴，没有出现乱码，但是这两种编码方式是不同的，也就是说，必然在这个过程中出现了编码转换，个人怀疑是利用剪贴板进行复制的时候，进行了编码转换，将复制的文本保存为操作系统内码，然后粘贴的时候由应用程序进行内码到utf-8编码的转换，完成粘贴。

2)输入法输入不同编码的文本时，采取什么机制？

当打开一个cp936编码的文件进行编辑时，输入法的输出是cp936编码的，但打开一个utf-8编码文件进行编辑时，输入法的输出变成了utf-8的，输入法是如何知道什么时候应该使用什么编码的？个人猜想，有可能输入法的输出只是操作系统的内码，在文本编辑器中进行内码到其他编码的转换。

原出处：http://blog.chinaunix.net/uid-11187-id-3040030.html

补充：解决Ubuntu20.04.4安装KRS时无法下载github代码问题 mamak426 kv260 github 自动驾驶人工智能
官方代码下载自github（gitlab），如何访问外网的问题这里可以合法合规解决，就是先把github的代码导入gitee，再采取同步的方式解决：原代码段如下：仔细看代码内容，链接路径全为github。catkrs_rolling.reposrepositories:ros2/ament_lint:type:giturl:https://github.com/ament/ament_lintve
开源语音分离工具大比拼：人声 VS 背景音乐 ⚔️ - 获取干净训练语音 (数据截至 2025年4月17日)！！！小丁学Java python 人工智能
开源语音分离工具大比拼：人声VS背景音乐⚔️-获取干净训练语音(数据截至2025年4月17日)在音频处理，特别是机器学习训练数据的准备中，获取纯净的人声（去除背景音乐或噪声）是一个常见的痛点。幸运的是，开源社区提供了许多强大的工具来帮助我们完成这项任务！本文将盘点一系列GitHub上的开源语音分离项目，重点关注那些能有效分离“人物语音”和“背景音乐”的工具，并根据GitHub星标⭐（反映社区关注度
Javascript基础内容回顾—变量提升、事件循环和闭包等内容 GISer_Jinger javascript 前端
以下是前端面试中JavaScript基础易错问题的详解，结合常见考点和易混淆概念进行解析：⚠️一、变量作用域与提升varvslet/const◦变量提升：var声明的变量会提升到作用域顶部（值为undefined），而let/const存在暂时性死区（声明前访问报错）。◦循环陷阱：for(vari=0;iconsole.log(i));//输出3,3,3（共享同一作用域）}for(leti=0;i
巨兽的阴影：大型语言模型的挑战与伦理深渊田园Coder 人工智能科普人工智能科普
当GPT-4这样的庞然大物能够流畅对话、撰写诗歌、编写代码、解析图像，甚至在某些测试中媲美人类专家时，大型语言模型（LLM）仿佛成为了无所不能的“智能神谕”。然而，在这令人目眩的成就之下，潜藏着复杂而严峻的挑战与伦理困境，如同光芒万丈的科技巨兽脚下那片难以忽视的深邃阴影。这些挑战并非技术进步的偶然副作用，而是深植于LLM的运作本质、训练数据来源以及其与社会交互的复杂性之中。它们警示我们，在追逐能力
AI+Web3：从自动化工具到自主经济体的范式革命 Loving_enjoy 计算机学科论文创新点迁移学习人工智能机器学习
>想象你的AI助手不仅能回答问题，还能自主管理你的加密资产、参与DAO治理、在预测市场博弈，甚至为你创造持续收益——欢迎来到AI与Web3融合的新世界。传统互联网（Web2）的AI困在中心化的牢笼中：数据被垄断在科技巨头手中，算法决策如同黑箱，用户沦为被动的数据奶牛。**Web3与AI的碰撞正在打破这一枷锁**，催生出去中心化的自主智能体（AIAgent），它们拥有数字身份、加密钱包和经济决策权，
为什么让AI洗碗比写诗难百倍？清华教授揭秘具身智能鸿沟 Loving_enjoy 计算机学科论文创新点机器学习人工智能 facebook 课程设计
>**人类小脑数亿年进化出的运动智慧，成了AI最难破解的密码**2025年3月，一位网友困惑地发问：“我想让人工智能替我洗碗做饭洗衣服，没想到现在的AI反而在画画、写歌、搞创作……”对此，全国政协委员、中国科学院自动化研究所研究员赵晓光一针见血地指出：**“大模型没有创新能力，想让AI干体力活还要靠具身智能的发展。”**这个看似矛盾的现象背后，隐藏着人工智能发展进程中一个惊人的认知盲区。清华大学心
【论文阅读】Dynamic Few-Shot Visual Learning without Forgetting Bosenya12 论文阅读
系统概述如下：(a)一个基于卷积神经网络（ConvNet）的识别模型，该模型包含特征提取器和分类器；(b)一个少样本分类权重生成器。这两个组件都是在一组基础类别上训练的，我们为这些类别准备了大量训练数据。在测试阶段，权重生成器会接收少量新类别的训练数据以及基础类别的分类权重向量（分类器框内的绿色矩形），并为新类别生成相应的分类权重向量（分类器框内的蓝色矩形）。这样，卷积神经网络就能同时识别基础类别
【资源分享】外文文献检索网站 Bosenya12 资源文献检索
外文文献检索网站Sci-Hub网址链接：https://www.sci-hub.st/Sci-hub是一个可以无限搜索、查阅和下载大量优质论文的数据库。其优点在于可以免费下载论文文献。ScienceDirect网址链接：http://www.sciencedirect.com/ScienceDirect是一个拥有2500多本期刊以及近20000篇文章的科学数据库，里面的文献可以免费检索阅读。Pro
扩散模型中的 Transformer：图像生成及其延展应用询问 ChatGPT DeepSeek大模型官方教程 transformer chatgpt 深度学习自然语言处理人工智能 ai 大模型学习
扩散模型近年来在生成逼真但合成的连续媒体内容方面引起了广泛关注。本次演讲将介绍Transformer在图像生成的扩散模型中的应用，并进一步探讨其更广泛的前景。我们首先简要介绍扩散模型的基础知识以及它们的训练方式，从而建立基本背景。接着，我们讲解曾是扩散模型事实标准的基于UNet的网络架构，这将帮助我们理解引入Transformer架构并推动其发展的动因。随后，我们将深入探讨构成基础架构的核心模块，
AI+小程序新范式：智能推荐、语音交互的场景落地全攻略
AI+小程序新范式：智能推荐、语音交互的场景落地全攻略内容摘要在AI技术席卷全球的今天，小程序与AI的结合已不再是“锦上添花”，而是企业生存的“必答题”。当用户打开一个电商小程序，系统竟能提前预判其需求；当用户对着智能音箱说一句指令，小程序即刻完成从订票到推荐餐厅的“一条龙”服务——这些场景正在成为现实。但问题随之而来：智能推荐如何避免“精准骚扰”？语音交互如何突破方言和噪音的桎梏？技术背后隐藏着
STM实战开发（4）：STM32控制蜂鸣器发声的开发博客嵌入式开发项目 2025年嵌入式开发 stm32 嵌入式硬件单片机物联网
1.前言随着智能硬件的发展，蜂鸣器成为了很多嵌入式系统中的一个常见输出装置。无论是作为警报声，还是作为提示音，蜂鸣器都可以为用户提供直观的声音反馈。在嵌入式开发中，STM32由于其强大的性能和灵活的外设配置，成为了实现蜂鸣器控制的理想平台。本文将以STM32为开发平台，详细讲解如何控制蜂鸣器发声。通过本篇博客，你将能够了解蜂鸣器的工作原理、如何连接蜂鸣器到STM32单片机，以及如何编写控制蜂鸣器的
PDF 的开发工具库: Adobe PDF Library 纸上笔下 AcroBat pdf adobe SDK API 标准签名接口
AdobePDFLibrary是Adobe公司提供的一个软件开发工具包(SDK)，它本质上是AdobeAcrobat的"无界面"版本，但功能更为强大。作为PDF处理领域的专业解决方案，它为开发者提供了创建、操作和管理PDF文档的全面能力。1many1many1manyAdobePDFLibrary+createPDF()+manipulatePDF()+extractData()+renderPD
国内Ubuntu访问不了github等外网 weixin_66009678 ubuntu linux 运维
各位小伙伴们，大家好呀。大家是不是经常遇到访问不了外网的情况呀。在Ubuntu中可以这样做。访问这个网站网站测速-Ping检测-Trace查询-Dig查询-路由跟踪查询-tools.ipip.net，对于github.com，在这个网站输入github.com，会返回20.205.243.166然后在ubuntu上输入sudovi/etc/hosts然后增加如下：20.205.243.166git
0704-0706上海，又聚上了 GISer_Jinger 新浪微博前端
上次，还是0413，当时写了一篇，下次相见是何时？也鼓励自己下次相见是找到工作（实习也算），没想到真找到了，DWApp说到实习，其实没认真投递很多，互联网公司除了阿里系卡学历连笔试机会都没有的话，其他的都给了一定的面试机会，只是自己没能很好把握机会，也能理解毕竟刚开始面试又加上自己表达能力和总结的不到位，或多或少的和面试官有代沟，其实也好，万一是实习的Mentor两个人又聊不来互相不对头的话也不好
【论文阅读】Few-Shot PPG Signal Generation via Guided Diffusion Models Bosenya12 论文阅读
从少量样本数据选择到后处理的整体框架。首先，扩散模型在N样本数据集和指导下的训练。接着，模型生成一个增强的数据集，并进一步优化以提高保真度。最后，这些合成数据与少量样本训练数据集结合，用于基准模型的训练和评估。数据分布从最初的红色变为保真度增强的蓝色，这表明模型与真实数据更加吻合，如简化后的数据分布示意图所示。这篇文章的核心内容是介绍了一种名为BG-Diff（Bi-GuidedDiffusion）
从被动检索到主动思考：Naive RAG 到 Agentic RAG 的架构演进与关键技术解析一休哥助手人工智能架构 RAG
摘要随着大语言模型（LLMs）的广泛应用，检索增强生成（Retrieval-AugmentedGeneration,RAG）技术已成为解决模型知识滞后与幻觉问题的核心方案。本文深入剖析从基础NaiveRAG到新一代AgenticRAG的架构演进路径，聚焦关键技术创新点（如递归检索、自适应查询改写、工具集成、多智能体协作），并通过架构图对比与案例分析，揭示其在复杂任务处理中的范式转变。全文超过500
HarmonyOS开发秘籍：从监听系统变量到掌握AbilityStage回调大雨淅淅 #HarmonyOS开发 harmonyos 华为
目录一、HarmonyOS开发新视野二、AbilityStage组件初相识（一）组件定义与作用（二）与Module的对应关系三、开发前的准备工作（一）创建AbilityStage文件步骤（二）导入依赖与配置文件四、监听系统环境变量变化实战（一）关键代码解析（二）回调函数触发机制五、AbilityStage其他回调函数探秘（一）onAcceptWant()（二）onMemoryLevel()（三）o
Fibonacci sequence 斐波那契数列解法及分析 hiqex AL fib fibonacci
版权声明：欢迎转载，但请注明出处，若有什么不对的地方，欢迎指正，https://blog.csdn.net/wutenglong123/article/details/82764585斐波那契数列(Fibonaccisequence)斐波那契数列的性质多种多样，截至现在，人么依然没有将之研究透彻，本文就从中选取几个有趣的性质分析。定义Fib数列的定义如下：F(n)={0ifn=01ifn=1Fn−
【零基础学AI】第29讲：BERT模型实战 - 情感分析 1989 0基础学AI bert 人工智能深度学习神经网络 cnn python 自然语言处理
本节课你将学到BERT模型的核心原理与优势HuggingFaceTransformers库的BERT接口使用情感分析任务的完整实现流程模型微调(Fine-tuning)技巧开始之前环境要求Python3.8+需要安装的包：pipinstalltorchtransformersdatasetspandastqdmGPU推荐（可加速训练）前置知识第28讲Transformer基础基本PyTorch使用
【零基础学AI】第27讲：注意力机制（Attention） - 机器翻译实战 1989 0基础学AI 人工智能机器翻译自然语言处理 python tensorflow 机器学习神经网络
本节课你将学到理解注意力机制的核心思想掌握注意力计算的数学原理实现基于注意力机制的Seq2Seq模型构建英语到法语的神经翻译系统开始之前环境要求Python3.8+需要安装的包：tensorflow==2.8.0numpy==1.21.0matplotlib==3.4.0pandas==1.3.0前置知识RNN/LSTM原理（第26讲）序列数据处理（第26讲）自然语言处理基础（第14讲）核心概念为
【scl】博图程序的导入和导出 peace.. 西门子1200 windows 经验分享学习其他
导入或者导出博图文件的方法（也叫移植文件）目录前言编辑编辑前言本篇文章主要写一下关于博图文件的导入和导出，具体要怎么样才能将写好的程序或者块移植到其他地方，下面我们一起来看！一、程序块的导入和导出程序块包含FC块，FB块；注意：需要是SCL语言编写的程序块才可以导出源文件！导出步骤：找到要导出的程序块---->右键单击----->选择从块生成源---->可以选着一个块或关联块---->将文件保存-
TensorFlow图神经网络(GNN)入门指南 AI天才研究院 AI人工智能与大数据 tensorflow 神经网络人工智能 ai
TensorFlow图神经网络(GNN)入门指南关键词：TensorFlow、图神经网络、GNN、深度学习、图数据、节点嵌入、图卷积网络摘要：本文全面介绍如何使用TensorFlow实现图神经网络(GNN)。我们将从图数据的基本概念开始，深入探讨GNN的核心原理，包括图卷积网络(GCN)、图注意力网络(GAT)等流行架构，并通过TensorFlow代码示例展示如何构建和训练GNN模型。文章还将涵盖
STM32串口DMA方式向上位机连续发送接收数据 Justinlevy stm32 单片机 arm
目录一、DMA初步应用1、DMA含义2、DMA传输四要素3、使用区别4、DMA的应用场景5、DMA传输方式6、DMA中断二、创建项目1、STM32CubeMX创建1.1设置SYS1.2设置RCC1.3设置USART1.4DMA设置1.5时钟设置1.6文件配置2、KEIL代码配置2.1main.c文件代码2.2while循环中代码2.3编译烧录2.4运行结果三、DMA总结四、参考一、DMA初步应用1
鸿蒙（HarmonyOS）性能优化实战-启动分析工具Launch Profiler 学习指南愿天堂没有996 HarmonyOS 鸿蒙开发移动开发 harmonyos 性能优化 HarmonyOS OpenHarmony 移动开发
LaunchProfiler概述DevEcoStudio内置Profiler分析调优工具。其中Launch主要用于分析应用或服务的启动耗时，分析启动周期各阶段的耗时情况、核心线程的运行情况等，协助开发者识别启动缓慢的原因。此外，Launch任务窗口还集成了Time、CPU、Frame场景分析任务的功能，方便开发者在分析启动耗时的过程中同步对比同一时段的其他资源占用情况。场景示例如下代码在页面绘制之
Python: 如何用Python的迭代器或生成器实现斐波那契数列 KevinShi_BJ python
斐波那契数列（Fibonaccisequence）是指这样一个数列：1，1，2，3，5，8，13，21，34，55，89...这个数列从第3项开始，每一项都等于前两项之和。斐波那契数列的定义者，是意大利数学家莱昂纳多·斐波那契（LeonardoFibonacci）。以兔子繁殖为例子而引入，故又称为”兔子数列“。斐波那契数列又称黄金分割数列，n越大，相邻两值的比越接近黄金分割0.618，非常有趣。百
小米手机录音文件位置中少奇智能手机
录音机的文件位置有两个地方，一个地方是\Android\data\com.android.soundrecorder\files另外一个地方\MIUI\sound_recorder
笔记本屏幕亮度忽明忽暗是怎么回事？
当你正在沉浸在写代码、编辑文档或者观看影片的时候，笔记本屏幕突然变暗，或者瞬间又变得刺眼，这不仅打断了你的专注，还可能对眼睛造成伤害。这种屏幕亮度的忽明忽暗，往往令人不悦，也引发了对电脑硬件或软件出现问题的担忧。那么，为什么会出现这种情况呢？更重要的是，我们该如何解决这一问题呢？在本文中，我将与大家分享笔记本屏幕亮度不稳定的可能原因及相应的解决方法，希望能够帮助你迅速恢复屏幕的正常亮度，让你的工作
stm32开发板ADC和USART配置DMA循环模式的本质区别中少奇 stm32 嵌入式硬件单片机
USART的DMA配置成循环模式时发送会不停的传输数据，接收时只有有数据时才会传输，否则挂起等待。而ADC的DMA配置成循环模式时只有ADC转换完成后才会自动触发DMA传输，不是一直在传输。1.触发机制的差异‌‌USART（持续触发）‌USART的DMA传输由‌硬件事件持续驱动‌：发送时：当TX数据寄存器为空（TXE标志），DMA会立即填充新数据，形成‌不间断传输循环‌。接收时：当RX数据寄存器非
HarmonyOS 生命周期详解：用三张图彻底搞懂 UIAbility、页面与组件的生命周期
作者：像素笔记|发布时间：2025年6月27日摘要本文通过三层结构图、状态流程图、对比表格三大图表，深入解析HarmonyOSArkUI的生命周期机制，涵盖UIAbility、页面、组件各层级的触发顺序与最佳实践。同时提供高级场景管理方案、常见误区分析及实战级生命周期管理工具设计，助你打造高性能、高稳定性的HarmonyOS应用！一、三层生命周期结构图（图1）下图展示了HarmonyOS应用框架的
.NET9 实现 JSON 序列化和反序列化（Newtonsoft.Json & System.Text.Json）性能测试
为了在.NET9平台上对比Newtonsoft.Json和System.Text.Json的序列化与反序列化的性能，我们可以使用BenchmarkDotNet来进行压测。目录1.项目准备2.基准测试环境3.性能对比a.对象级别的序列化（Object-LevelSerialization）b.对象级别的反序列化（Object-LevelDeserialization）c.API响应级别的序列化（Ap
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分

关于字符集和乱码的思考

你可能感兴趣的:(关于字符集和乱码的思考)