luoyouren

彻底搞懂字符编码(unicode,mbcs,utf-8,utf-16,utf-32,big endian,little endian...)

转自：http://blog.csdn.net/softman11/article/details/6124345

最近有一些朋友常问我一些乱码的问题，和他们交流过程中，发现这个编码的相关知识还真是杂乱不堪，不少人对一些

知识理解似乎也有些偏差，网上百度,google的内容，也有不少以讹传讹，根本就是错误的（例如说 unicode编码是两

个字节），各种软件让你选择编码的时候，常常是很长的一个选单，让用户不知道该如何选。基于这样的问题，我就写

下我的理解吧，一方面帮助一些需要帮助的人纠正认识，一方面作为自己以后备查的资料。

1.ASCII(American Standard Code for Information Interchange)
美国信息交换标准代码，这是计算机上最早使用的通用的编码方案。那个时候计算机还只是拉丁文字的专利，根本没

有想到现在计算机的发展势头，如果想到了，可能一开始就会使用unicode了。当时绝大部分专家都认为，要用计算机

，必须熟练掌握英文。这种编码占用7个Bit，在计算机中占用一个字节，8位，最高位没用，通讯的时候有时用作奇偶

校验位。因此ASCII编码的取值范围实际上是：0x00-0x7f,只能表示128个字符。后来发现128个不太够用，做了扩展，

叫做ASCII扩展编码，用足八位，取值范围变成：0x00-0xff,能表示256个字符。其实这种扩展意义不大，因为256个字

符表示一些非拉丁文字远远不够，但是表示拉丁文字，又用不完。所以扩展的意义还是为了下面的ANSI编码服务。

2.ANSI（American National Standard Institite ）
美国国家标准协会，也就是说，每个国家（非拉丁语系国家）自己制定自己的文字的编码规则，并得到了ANSI认可，

符合ANSI的标准，全世界在表示对应国家文字的时候都通用这种编码就叫ANSI编码。换句话说，中国的ANSI编码和在日

本的ANSI的意思是不一样的，因为都代表自己国家的文字编码标准。比如中国的ANSI对应就是GB2312标准，日本就是

JIT标准，香港，台湾对应的是BIG5标准等等。当然这个问题也比较复杂，微软从95开始，用就是自己搞的一个标准GBK

。GB2312里面只有6763个汉字，682个符号，所以确实有时候不是很够用。GBK一直能和GB2312相互混淆并且相安无事的
一个重要原因是GBK全面兼容GB2312，所以没有出现任何冲突，你用GB2312编码的文件通过GBK去解释一定能获得相同的

显示效果，换句话说：GBK对GB2312就是，你有的，我也有，你没得的，我还有！

好了，ANSI的标准是什么呢，首先是ASCII的代码你不能用！也就是说ASCII码在任何ANSI中应该都是相同的。其他的，

你们自己扩展。所以呢，中国人就把ASCII码变成8位，0x7f之前我不动你的，我从0xa0开始编，0xa0到0xff才95个码位

，对于中国字那简直是杯水车薪，因此，就用两个字节吧，因此编码范围就从0xA1A1 - 0xFEFE，这个范围可以表示

23901个汉字。基本够用了吧，GB2312才7000多个呢！GBK更猛，编码范围是从0x8140 - 0xFEFE,可以表示3万多个汉字

。可以看出，这两种方案，都能保证汉字头一个字节在0x7f以上，从而和ASCII不会发生冲突。能够实现英文和汉字同

时显示。
BIG5，香港和台湾用的比较多，繁体，范围： 0xA140 - 0xF9FE, 0xA1A1 - 0xF9FE，每个字由两个字节组成，其第一

字节编码范围为0xA1~0xF9，第二字节编码范围为0x40-0x7E与0xA1-0xFE，总计收入13868个字 (包括5401个常用字、

7652 个次常用字、7个扩充字、以及808个各式符号)。

那么到底ANSI是多少位呢？这个不一定！比如在GB2312和GBK，BIG5中，是两位！但是其他标准或者其他语言如果不够

用，就完全可能不止两位！

例如：GB18030:
GB18030-2000(GBK2K)在GBK的基础上进一步扩展了汉字，增加了藏、蒙等少数民族的字形。GBK2K从根本上解决了字位

不够，字形不足的问题。它有几个特点：它并没有确定所有的字形，只是规定了编码范围，留待以后扩充。
编码是变长的，其二字节部分与GBK兼容；四字节部分是扩充的字形、字位，其编码范围是首字节0x81-0xfe、二字节

0x30-0x39、三字节0x81-0xfe、四字节0x30-0x39。它的推广是分阶段的，首先要求实现的是能够完全映射到

Unicode3.0标准的所有字形。它是国家标准，是强制性的。

搞懂了ANSI的含义，我们发现ANSI有个致命的缺陷，就是每个标准是各自为阵的，不保证能兼容。换句话说，要同时显

示中文和日本文或者阿拉伯文，就完全可能会出现一个编码两个字符集里面都有对应，不知道该显示哪一个的问题，也

就是编码重叠的问题。显然这样的方案不好，所以Unicode才会出现！

3.MBCS（Multi-Byte Chactacter System（Set)）
多字节字符系统或者字符集，基于ANSI编码的原理上，对一个字符的表示实际上无法确定他需要占用几个字节的，只

能从编码本身来区分和解释。因此计算机在存储的时候，就是采用多字节存储的形式。也就是你需要几个字节我给你放

几个字节，比如A我给你放一个字节，比如"中“，我就给你放两个字节，这样的字符表示形式就是MBCS。
在基于GBK的windows中，不会超过2个字节，所以windows这种表示形式有叫做DBCS（Double-Byte Chactacter System

），其实算是MBCS的一个特例。
C语言默认存放字符串就是用的MBCS格式。从原理上来说，这样是非常经济的一种方式。
4.CodePage

代码页，最早来自IBM，后来被微软，oracle ,SAP等广泛采用。因为ANSI编码每个国家都不统一，不兼容，可能导致冲

突，所以一个系统在处理文字的时候，必须要告诉计算机你的ANSI是哪个国家和地区的标准，这种国家和标准的代号（

其实就是字符编码格式的代号），微软称为Codepage代码页，其实这个代码页和字符集编码的意思是一样的。告诉你代

码页，本质就是告诉了你编码格式。
但是不同厂家的代码页可能是完全不同，哪怕是同样的编码，比如， UTF-8字符编码在IBM对应的代码页是1208，在微

软对应的是65001,在德国的SAP公司对应的是 4110 。所以啊，其实本来就是一个东西，大家各自为政，搞那么多新名

词，实在没必要！所以标准还是很重要的！！！
比如GBK的在微软的代码页是936，告诉你代码页是936其实和告诉你我编码格式是GBK效果完全相同。那么处理文本的时

候就不会有问题，不会去考虑某个代码是显示的韩文还是中文，同样，日文和韩文的代码页就和中文不同，这样就可以

避免编码冲突导致计算机不知如何处理的问题。当然用这个也可以很容易的切换语言版本。
但是这都是治标不治本的方法，还是无法解决同时显示多种语言的问题，所以最后还是都用unicode吧，永远不会有冲

突了。
5.Unicode(Universal Code)
这是一个编码方案，说白了就是一张包含全世界所有文字的一个编码表，不管你用的上，用不上，不管是现在用的，

还是以前用过的，只要这个世界上存在的文字符号，统统给你一个唯一的编码，这样就不可能有任何冲突了。不管你要

同时显示任何文字，都没有问题。
因此在这样的方案下，Unicode出现了。Unicode编码范围是：0-0x10FFFF，可以容纳1114112个字符，100多万啊。全

世界的字符根本用不完了，Unicode 5.0版本中，才用了238605个码位。所以足够了。
因此从码位范围看，严格的unicode需要3个字节来存储。但是考虑到理解性和计算机处理的方便性，理论上还是用4个

字节来描述。
Unicode采用的汉字相关编码用的是《CJK统一汉字编码字符集》— 国家标准 GB13000.1 是完全等同于国际标准《

通用多八位编码字符集 (UCS)》 ISO 10646.1。《GB13000.1》中最重要的也经常被采用的是其双字节形式的基本多文

种平面。在这65536个码位的空间中，定义了几乎所有国家或地区的语言文字和符号。其中从0x4E00到 0x9FA5 的连续

区域包含了 20902 个来自中国（包括台湾）、日本、韩国的汉字，称为 CJK (Chinese Japanese Korean) 汉字。CJK

是《GB2312-80》、《BIG5》等字符集的超集。
CJK包含了中国，日本，韩国，越南，香港，也就是CJKVH。这个在UNICODE的Charset chart中可以明显看到。
unicode的相关标准可以从unicode.org上面获得，目前已经进行到了6.0版本。

下面这段描述来自百度百科：
Unicode字符集可以简写为UCS（Unicode Character Set）。早期的 unicodeUnicode标准有UCS-2、UCS-4的说法。

UCS-2用两个字节编码，UCS-4用4个字节编码。UCS-4根据最高位为0的最高字节分成2^7=128个group。每个group再根据

次高字节分为256个平面（plane）。每个平面根据第3个字节分为256行（row），每行有256个码位（cell）。group 0

的平面0被称作BMP（Basic Multilingual Plane）。将UCS-4的BMP去掉前面的两个零字节就得到了UCS-2。　　每个平

面有2^16=65536个码位。Unicode计划使用了17个平面，一共有17*65536=1114112个码位。在Unicode 5.0.0版本中，已

定义的码位只有238605个，分布在平面0、平面1、平面2、平面14、平面15、平面16。其中平面15和平面16上只是定义

了两个各占65534个码位的专用区（Private Use Area），分别是0xF0000-0xFFFFD和0x100000-0x10FFFD。所谓专用区

，就是保留给大家放自定义字符的区域，可以简写为PUA。　　平面0也有一个专用区：0xE000-0xF8FF，有6400个码位

。平面0的0xD800-0xDFFF，共2048个码位，是一个被称作代理区（Surrogate）的特殊区域。代理区的目的用两个UTF-

16字符表示BMP以外的字符。在介绍UTF-16编码时会介绍。　　如前所述在Unicode 5.0.0版本中，238605-65534*2-

6400-2408=99089。余下的99089个已定义码位分布在平面0、平面1、平面2和平面14上，它们对应着Unicode目前定义的

99089个字符，其中包括71226个汉字。平面0、平面1、平面2和平面14上分别定义了52080、3419、43253和337个字符。

平面2的43253个字符都是汉字。平面0上定义了27973个汉字。

6.Unicode的实现方案
Unicode其实只是一张巨大的编码表。要在计算机里面实现，也出现了几种不同的方案。也就是说如何表示unicode

编码的问题。
（1）UTF-8（UCS Transformation Format 8bit)
这个方案的意思以8位为单位来标识文字，注意并不是说一个文字用8位标识。他其实是一种MBCS方案，可变字节的

。到底需要几个字节表示一个符号，这个要根据这个符号的unicode编码来决定，最多4个字节。
编码规则如下：
Unicode编码(16进制)　║　UTF-8 字节流(二进制) 　
　000000 - 00007F　║　0xxxxxxx 　　
000080 - 0007FF　║　110xxxxx 10xxxxxx 　　
000800 - 00FFFF　║　1110xxxx 10xxxxxx 10xxxxxx 　　
010000 - 10FFFF　║　11110xxx 10xxxxxx 10xxxxxx 10xxxxxx 　　
UTF-8的特点是对不同范围的字符使用不同长度的编码。对于0x00-0x7F之间的字符，UTF-8编码与ASCII编码完全相同。

UTF-8编码的最大长度是4个字节。从上表可以看出，4字节模板有21个x，即可以容纳21位二进制数字。Unicode的最大

码位0x10FFFF也只有21位。　　
例1：“汉”字的Unicode编码是0x6C49。0x6C49在0x0800-0xFFFF之间，使用用3字节模板了：1110xxxx 10xxxxxx

10xxxxxx。将0x6C49写成二进制是：0110 1100 0100 1001，用这个比特流依次代替模板中的x，得到：11100110

10110001 10001001，即E6 B1 89。　　
例2：Unicode编码0x20C30在0x010000-0x10FFFF之间，使用用4字节模板了：11110xxx 10xxxxxx 10xxxxxx 10xxxxxx。

将0x20C30写成21位二进制数字（不足21位就在前面补0）：0 0010 0000 1100 0011 0000，用这个比特流依次代替模板

中的x，得到：11110000 10100000 10110000 10110000，即F0 A0 B0 B0。

（2）UTF-16
UTF-16编码以16位无符号整数为单位。注意是16位为一个单位，不表示一个字符就只有16位。现在机器上的unicode编

码一般指的就是UTF-16。绝大部分2个字节就够了，但是不能绝对的说所有字符都是2个字节。这个要看字符的unicode

编码处于什么范围而定，有可能是2个字节，也可能是4个字节。这点请注意！
下面算法解释来自百度百科。

我们把Unicode unicode编码记作U。编码规则如下：
　　如果U<0x10000，U的UTF-16编码就是U对应的16位无符号整数（为书写简便，下文将16位无符号整数记作WORD）。

　　如果U≥0x10000，我们先计算U'=U-0x10000，然后将U'写成二进制形式：yyyy yyyy yyxx xxxx xxxx，U的UTF-16

编码（二进制）就是：110110yyyyyyyyyy 110111xxxxxxxxxx。为什么U'可以被写成20个二进制位？Unicode的最大码位

是0x10ffff，减去0x10000后，U'的最大值是0xfffff，所以肯定可以用20个二进制位表示。
例如：Unicode编码0x20C30，减去0x10000后，得到0x10C30，写成二进制是：0001 0000 1100 0011 0000。用前10

位依次替代模板中的y，用后10位依次替代模板中的x，就得到：1101100001000011 1101110000110000，即0xD843

0xDC30。　　
按照上述规则，Unicode编码0x10000-0x10FFFF的UTF-16编码有两个WORD，第一个WORD的高6位是110110，第二个

WORD的高6位是110111。可见，第一个WORD的取值范围（二进制）是11011000 00000000到11011011 11111111，即

0xD800-0xDBFF。第二个WORD的取值范围（二进制）是11011100 00000000到11011111 11111111，即0xDC00-0xDFFF。

　　为了将一个WORD的UTF-16编码与两个WORD的UTF-16编码区分开来，Unicode编码的设计者将0xD800-0xDFFF保留下来

，并称为代理区（Surrogate）：　　
D800－DB7F　║　High Surrogates　║　高位替代　　
DB80－DBFF　║　High Private Use Surrogates　║　高位专用替代　　
DC00－DFFF　║　Low Surrogates　║　低位替代　　
高位替代就是指这个范围的码位是两个WORD的UTF-16编码的第一个WORD。低位替代就是指这个范围的码位是两个

WORD的UTF-16编码的第二个WORD。那么，高位专用替代是什么意思？我们来解答这个问题，顺便看看怎么由UTF-16编码

推导Unicode编码。　　
如果一个字符的UTF-16编码的第一个WORD在0xDB80到0xDBFF之间，那么它的Unicode编码在什么范围内？我们知道第

二个WORD的取值范围是0xDC00-0xDFFF，所以这个字符的UTF-16编码范围应该是0xDB80 0xDC00到0xDBFF 0xDFFF。我们

将这个范围写成二进制：　　1101101110000000 11011100 00000000 - 1101101111111111 1101111111111111 　　按

照编码的相反步骤，取出高低WORD的后10位，并拼在一起，得到　　1110 0000 0000 0000 0000 - 1111 1111 1111

1111 1111
即0xe0000-0xfffff，按照编码的相反步骤再加上0x10000，得到0xf0000-0x10ffff。这就是UTF-16编码的第一个WORD在

0xdb80到0xdbff之间的Unicode编码范围，即平面15和平面16。因为Unicode标准将平面15和平面16都作为专用区，所以

0xDB80到0xDBFF之间的保留码位被称作高位专用替代。

（3）UTF-32
这个就简单了，和Unicode码表基本一一对应，固定四个字节。
为什么不采用UTF-32呢，因为unicode定义的范围太大了，其实99%的人使用的字符编码不会超过2个字节，所以如同统

一用4个字节，简单倒是简单了，但是数据冗余确实太大了，不好，所以16位是最好的。就算遇到超过16位能表示的字

符，我们也可以通过上面讲到的代理技术，采用32位标识，这样的方案是最好的。所以现在绝大部分机器实现unicode

还是采用的utf-16的方案。当然也有UTF-8的方案。比如windows用的就是UTF16方案，不少linux用的就是utf8方案。

7. 编码存储差异

这里就要引出两个名词：
LE（little endian):小字节字节序，意思就是一个单元在计算机中的存放时按照低位在前（低地址），高位在后（高

地址）的模式存放。

BE（big endian):大字节字节序，和LE相反，是高位在前，低位在后。

比如一个unicode编码为：0x006C49，如果是LE，那么在文件中的存放顺序应该是：49 6c 00
如果是BE ,那么顺序应该是：00 6c 49

8.编码格式的检测

到底采用什么编码，如果能检测就好了。专家们也是这么想的，所以专家给每种格式和字节序规定了一些特殊的编码，

这些编码在unicode 中是没有使用的，所以不用担心会冲突。

这个叫做BOM（Byte Order Mark）头。意思是字节序标志头。通过它基本能确定编码格式和字节序。
UTF编码　║　Byte Order Mark 　　
UTF-8　 ║　EF BB BF 　　
UTF-16LE ║　FF FE 　　
UTF-16BE ║　FE FF 　　
UTF-32LE ║　FF FE 00 00 　　
UTF-32BE ║　00 00 FE FF
所以通过检测文件前面的BOM头，基本能确定编码格式和字节序。
但是这个BOM头只是建议添加，不是强制的，所以不少软件和系统没有添加这个BOM头（所以有些软件格式中有带BOM头

和NoBOM头的选择），这个时候要检测什么格式，就比较麻烦了
当然可以检测，但是不能保证100%准确，只能通过编码范围从概率上来检查，虽然准确度还是比较高，但是不能保证

100%。所以，时常看到检测错误的软件，也不奇怪了。

总结：
终于写完了，其实这些问题都是不统一导致的，属于历史问题，所以才会有这些困惑，这里也呼吁所有的软件开发

人员自觉的采用Unicode标准进行文字处理，我相信在不久的将来，这些困扰都不会存在了，因为所有软件都是unicode

d ,只要有字库，任何文字都能同时显示，也可以到任何语言的平台上的去运行，不再有乱码的困惑！
其实现在绝大部分软件已经是这么做的了！
另外也不要被很多名词属于所迷惑，其实这些只是标准的问题，根本没有什么新的东西，更没有什么复杂的东西。

【Qt】QString字符串编码格式与数据转换漫步企鹅 qt QString char
QString提供了多种静态方法用于将不同编码格式的原始数据转换为QString对象。以下是常用方法的全面对比：1.fromLatin1(constchar*str,intsize=-1)功能：将Latin-1（ISO8859-1）编码的C字符串转换为QString。输入类型：单字节字符集（每个字节直接映射到Unicode的前256个码点）。适用场景：ASCII或ISO8859-1编码的文本，如西
c++26新功能—几个细节的完善 fpcc C++11 C++c++
一、C++26标准的完善正如前面在分析其它标准时，它分为语言本身的发展和库的发展。语言的特性是真正的C++标准的演进，而库的发展只是语言特性发展的支持或者原来库的完善。C++26做为一个较大版本的演进，极大的增强了C++语言的灵活性、易用性。极大的提高了C++语言的安全性和运行效率。二、几个具体的细节在本文中主要对几个比较小的细节进行分析说明，语言特性主要包括：1、扩展字符集：主要是提供了对@、$
使用Visual C++ 6.0的MFC开发多线程聊天程序
本文还有配套的精品资源，点击获取简介：本项目使用经典的开发环境VisualC++6.0结合MFC库编写了一个聊天室程序。MFC提供了一种结构化和面向对象的方法来开发Windows应用程序。程序主要使用了多线程技术来同时处理消息的接收和发送。涉及到的技术要点包括MFC基础类使用、多线程编程、网络通信、消息队列与同步机制、用户界面设计、事件处理、错误处理、代码组织以及测试与调试。这个项目不仅帮助理解M
利用人名语言分类案例演示RNN、LSTM和GRU的区别（基于PyTorch） .30-06Springfield rnn lstm gru 分类人工智能 python pytorch
文章目录一、程序结构1.1程序整体结构1.2各模块功能关系流程图二、数据预处理模块详解2.1定义字符集和语言类别2.2读取数据2.3人名转换为one-hot编码张量2.4自定义数据集类2.5数据加载器三、模型定义模块详解3.1RNN模型3.2LSTM模型3.3GRU模型四、模型训练与测试模块详解4.1测试模型基本功能4.2模型训练主函数五、结果可视化与对比模块详解六、模型预测模块详解七、案例结果分
MFC小例子说明千里修行 MFC Windows
目录一.枚举窗口EnumDialog1.枚举方式2.查找窗口3.检测当前应用程序是否存在二.按钮激活ButtonActive1.原理2.实现三.星形查看器AsterPassword1.原理2.实现四.图片浏览器ImageExplore1.原理2.实现五.模拟键鼠消息MouseKeboardClick1.原理2.实现六.屏幕放大镜ScreenMagnify1.原理2.实现七.屏幕截图功能SCreen
MFC的List Control自适应主界面大小 Vitta_U mfc list c++
响应WM_SIZE消息手动调整实现步骤：为对话框/窗口添加WM_SIZE消息处理：在ClassView中右键你的对话框类选择"类向导"→"Messages"→找到WM_SIZE添加OnSize处理函数.如图所示：再代码中自动生成OnSize()函数；voidCReadDataDlg::OnSize(UINTnType,intcx,intcy){CDialogEx::OnSize(nType,cx,
js 允许生成特殊的变量名基于字符集编码混淆的 XSS 绕过漏洞 -- Google 2025 Lost In Transliteration A5rZ 网络安全
题目实现了一个字符转换工具在/file路由用户可以通过ct参数自定义Content-Type//文件路由-提供静态文件服务（JS和CSS），支持内容类型验证app.MapGet("/file",(stringfilename="",string?ct=null,string?q=null)=>{//根据文件名查找对应的模板文件string?template=FindFile(filename);i
（Note）音频向量化表示
音频向量化表示经典语音特征（MFCC等）语音信号的传统特征提取方法包括MFCC（梅尔倒谱系数）、PLP等，用于描述语音的频谱包络信息。这些特征设计依据生理听觉模型，在ASR、情感识别等任务中长期有效。但它们仍属浅层特征，无法自动学习更高阶的语言和语音信息，对说话人和环境的鲁棒性有限，通常需配合复杂模型来提高性能。梅尔倒谱系数特征示意图自监督语音模型（Wav2Vec、HuBERT等）近年来，语音领域
Mysql—C语言API接口
Mysql—C语言API接口一、mysql-arp访问数据的操作流程1.初始化mysql操作句柄；2.连接mysql服务器；3.设置mysql客户端字符集（保持与服务器一致）；4.选择要操作的数据库；5.定义sql语句，并且执行语句；6.将查询结果保存到本地；7.获取结果中的条数和列数；8.根据条数和列数遍历结果集；9.释放保存在本地的结果集；10.关闭mysql句柄，释放资源；二、接口认识1.初
分享一个MFC的ProgressCtrl的扩展类(支持自定义显示文字、颜色、百分比及其位置) RevsInterstellar QT笔记 MFC笔记 mfc c++progressctrl 进度条控件扩展类
MFC自带的进度条控件CProgressCtrl不能在上面显示文字和百分比信息，这个类由CProgressCtrl派生，对其进行修改，可以改变其外观，更加美观实用。头文件：CXProgressCtrl.h#pragmaonce//CXProgressCtrlclassCXProgressCtrl:publicCProgressCtrl{DECLARE_DYNAMI
MFC界面库ToolkitPro v15.3.1的编译和使用教程(支持VS2015和VS2017) RevsInterstellar MFC笔记 mfc c++ToolKitPro Codejock.Xtreme 界面库 15.3.1
一、ToolkitProv15.3.1库的下载界面库全称为CodejockXtremeToolkitPro，目前可以免费使用的版本为v15.3.1，可以在CSDN上搜索下载，有很多，比如https://download.csdn.net/download/nizheng96/11151867二、ToolkitProv15.3.1库的编译虽然很多人在这个库的资源中说v15.3.1版本可以支持VS20
Oracle 导入导出 dmp 数据文件实战 dazhong2012 数据库 oracle 数据库
一、DMP文件基础知识1.DMP文件定义DMP（DataPumpDumpFile）是Oracle数据库专用的二进制格式文件，由expdp/impdp或旧版exp/imp工具生成。它包含数据库对象的元数据（表结构、索引等）和实际数据，是数据备份、迁移和恢复的核心载体。2.DMP文件结构文件头：记录Oracle版本、字符集、导出时间等元信息。数据段：存储表数据，按数据块组织，支持并行读写。索引段：加速
基于MFC的遥感图像匹配程序设计 HH予嵌入式驱动工程项目开发 mfc c++
基于MFC的遥感图像匹配程序设计下面我将为你设计一个使用MFC实现的遥感图像匹配程序，能够显示图片并在图上标注匹配点位置，支持地面点坐标的输入和输出。程序框架设计1.创建MFC项目使用VisualStudio创建一个MFC应用程序项目选择"单文档"界面勾选"文档/视图体系结构支持"2.主界面设计//在CMainFrame中添加以下成员变量classCMainFrame:publicCFrameWn
VC++实现的快速傅里叶变换频谱分析软件直推小新
本文还有配套的精品资源，点击获取简介：基于VC++和MFC的频谱分析程序通过快速傅里叶变换（FFT）技术，将时域信号转换至频域，实现对导入文本或Excel数据的离散谱分析。用户可通过图形界面轻松导入数据，选择分析选项并查看结果。程序利用FFT高效地计算频域数据，并通过图表展示信号频率成分。此分析工具适用于音频处理、通信、医学成像和机械故障诊断等领域。1.VC++和MFC框架介绍1.1VC++的发展
MFC对话框窗体设置不能调整大小斗转星移77 MFC mfc c++对话框样式
在VisualC++(VC++)中使用MFC（MicrosoftFoundationClasses）框架开发对话框程序时，如果你想要设置窗体（对话框）不能调整大小，可以通过修改对话框的样式来实现。这通常在对话框的构造函数中或者在创建对话框之前进行设置。方法1：在对话框的构造函数中设置如果你正在使用资源编辑器创建对话框，可以在其ClassWizard中找到对应的构造函数，然后添加代码来修改样式。例如
Linux iconv命令 fengyehongWorld Linux linux 运维
参考资料Linuxiconv指令目录一.简介二.查看支持的编码三.`SHIFT-JIS`转`UTF-8`一.简介⏹iconv是Linux上用于文本编码转换的标准工具，基于GNUlibiconv库，一般Linux操作系统都会内置该命令，无需额外进行安装。主要用于将文件从一种字符集（如GBK、Shift_JIS）转换为另一种（如UTF-8）。短option长option说明-f编码格式--from-c
Docker 安装 MySQL 详细教程及字符集问题解决李少兄 Java java docker
引言在本教程中，我们将通过Docker快速部署MySQL5.7数据库服务，并深入解决在使用过程中可能遇到的字符集问题。此过程不仅涉及基本的安装步骤，还会详细介绍如何利用Docker数据卷（volume）来持久化数据以及优化配置，确保数据库支持中文字符的正确存储与查询。准备工作确保已安装Docker。确认宿主机的3306端口未被其他服务占用。步骤一：拉取MySQL镜像打开终端或命令行工具，执行以下命
兄弟Brother MFC-L2805DW 打印机信息小魚資源大雜燴 windows
功能：具有打印、复印、扫描、传真功能。打印速度：A4纸打印速度可达34页/分钟，首页输出时间小于8.5秒，预热速度快，能高效处理打印任务。分辨率：打印分辨率为1200dpi×1200dpi，可确保清晰锐利的打印效果，文字和图像都能清晰呈现。自动双面：支持自动双面打印，可节省纸张，最多可处理250张80克/平方米的普通纸，也能处理多种类型纸张，如薄纸、厚纸、再生纸等，还支持多种纸张尺寸，包括A4、A
MySQL 数据库操作完整指南 yz123lucky Sql数据库学习使用指南数据库 mysql oracle
MySQL数据库操作完整指南目录创建数据库连接数据库创建表约束详解插入数据查询数据多表联合查询连接查询高级查询更新数据删除数据视图详解存储过程详解函数详解触发器事务处理索引优化安全性管理备份和恢复性能优化删除表和数据库1.创建数据库基本创建数据库--创建基本数据库CREATEDATABASECompanyDB;--创建带字符集的数据库CREATEDATABASECompanyDB_UTF8CHAR
【Python】正则表达式中的`^`和`[]` shengchao0920 python 正则表达式数据库
一、正则表达式：符号^^在正则表达式中有两种常见的含义，具体取决于它的位置：1.在字符集[]的开头时，表示取反（negation）。例如：[^s]：匹配任何非空白字符。[^a-z]：匹配任何不在a-z范围内的字符。2.在字符集之外时，表示字符串的开始（anchor）。例如：^https：匹配以“https”开头的字符串。^\d：匹配以数字开头的字符串。总结：在[]内：取反。在[]外：字符串开始。需
深入了解域名生成算法（DGA）：原理、应用及防御措施 BugHunter666 网络服务器运维 linux 前端
域名生成算法（DGA,DomainGenerationAlgorithm）是一种用于生成大量域名的算法，通常用于恶意软件和网络攻击中。它们的主要目的是通过生成看似合法的域名来逃避检测和阻止。例如，恶意软件可以使用DGA定期生成新的域名，以避免被网络安全系统发现并封锁。DGA的工作原理：生成域名：DGA通过算法生成大量的随机或伪随机的域名。这些域名通常是由一些固定的字符集和算法生成的，这些算法可能涉
【游戏测试】多语言/本地化测试-抽样测试 June bug 游戏测试游戏游戏测试多语言测试本地化测试经验分享
一、从可能出现显示问题的角度，多语言可以大致分为以下6类：字符集/编码支持类别（基础问题）：单字节字符语言：如英语、法语、德语、西班牙语（西欧字符）、意大利语、葡萄牙语等。主要使用ASCII或Latin-1扩展字符集。问题相对较少，但非ASCII字符（特殊符号、带重音字母如é,ñ,ß,ø）如果编码处理不当或字体不支持，可能显示为乱码(�)、方块(□)或问号(?)。双字节字符语言：如中文**（简体G
QByteArray，QString 与标准字符串的区别 ILOVECOMPUTING QByteArray QString std string 内存溢出内存指针 const char
QByteArray、QString与标准字符串的区别1.编码处理QByteArray存储原始字节数据（char*），不涉及编码转换。适合处理二进制数据（如图像、网络数据包），或明确知道编码格式的文本（如UTF-8）。示例：QByteArraydata="\x48\x65\x6C\x6C\x6F";//直接存储字节序列QString使用UTF-16编码存储文本，支持国际化字符集。自动处理编码转换，
ASCII Unicode UTF-8 字符集字符编码土豆Coder 字符及编码前端
ASCIIUnicodeUTF-8字符集字符编码基本概念字符字符集字符编码字符集和字符编码ASCII字符集Unicode字符集UTF-8测试题基本概念字符集为每个字符分配了一个唯一的编号，通过这个编号就能找到对应的字符。在编码过程中我们经常会使用字符，而使用字符的前提就是把字符放入内存中，而放入内存中的仅仅是字符的编号，而不是真正的字符实体。这就引出一个问题，如何将这些字符编号存入内存中，还能让计
C#操作Oracle数据库中文乱码 US7ASCII字符集（解决方案）彼岸丿丿落笔 C#数据库 Oracle C#数据库乱码数据库字符集
工作时遇到了存中文乱码的问题，存到数据库了都是问号？？？，直接再PLSQL中执行SQL确没有问题，网上查了很多资料并没有解决，最后通过不断尝试终于解决了，分享一下。PLSQL-帮助-支持信息，看到数据库的字符集如下CharacterSets Charactersize:1byte(s) CharSetID:1 NCharSetID:2000 UnicodeSupport:True NLS_LANG
使用MFC与TCP/IP构建多用户网络服务器 Lemaden
本文还有配套的精品资源，点击获取简介：本项目展示了如何利用微软基础类库（MFC）在VisualStudio2010中创建一个基于TCP/IP协议的网络服务器。TCP/IP是互联网通信的基础协议，负责数据的可靠传输。开发者需要了解MFC的类库结构，特别是CAsyncSocket类，用于实现TCP连接。服务器端通过继承CAsyncSocket类，创建自定义服务器类来监听客户端连接请求、接收和发送数据。
Java IO流必备：File、递归与字符集详解 EnigmaCoder Java java 开发语言
目录前言File创建File类的对象File类的相关方法方法递归认识递归文件搜索字符集常见字符集⚙️标准ASCII字符集⚙️GBK（汉字内码扩展规范，国标）⚙️Unicode（统一码、万国码）⚙️UTF-8（UnicodeTransformationFormat-8-bit）编码与解码⚙️字符串编码与解码方法总结⚙️示例代码（Java）⚙️核心注意事项前言大家好！我是EnigmaCoder。本文为
基于Java的不固定长度字符集在指定宽度和自适应模型下图片绘制生成实战鱼弦开发语言 java
基于Java的不固定长度字符集在指定宽度和自适应模型下图片绘制生成实战引言在现代软件开发中，动态生成包含文本内容的图片是一项常见需求，特别是在验证码生成、报告导出、社交媒体分享等场景。当面对不固定长度的字符集（如多语言文本、用户生成内容等）时，如何在指定宽度下实现美观的自适应文本布局成为技术难点。本文将深入探讨基于Java的实现方案，提供从原理到实战的完整指南。技术背景核心Java图形APIJav
GreatSQL从库报错13146：字符集不一致问题处理数据库mysql
GreatSQL从库报错13146：字符集不一致问题处理1.问题概述需要将数据反向同步到源端，在使用SELECTINTOOUTFILE和LOADDATA的方式进行数据恢复后配置同步，从库发生报错13146数据类型转换失败，导致同步异常；通过对比表结构和列的字符集，发现主从库相关表、列字符集设置不一致，修改为一致后，同步正常。2.问题复现本次测试基于GreatSQL8.0.322.1初始化2个单机实
MFC绘制Bezier曲线老土豆FUSK 计算几何算法与实现
MFC绘制Bezier曲线参考《计算几何算法与实现》–孔令德绘制的Bezier曲线次数为3，四个控制节点1、添加二维点类#pragmaonce//为了避免按照x和y方向进行重复运算，重载运算对象classCP2{public:CP2(void);~CP2(void);CP2(doublex,doubley);friendCP2operator+(constCP2&p0,constCP2&p1);/
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那

彻底搞懂字符编码(unicode,mbcs,utf-8,utf-16,utf-32,big endian,little endian...)

你可能感兴趣的:(mfc,字符集)