harrywater123

Unicode字符集的发展历史及与UTF-8，ISO8891-1等字符集的关系

摘要：本文从Unicode入手，介绍由于通信问题而产生的字符集，以及Unicode的发展情况。介绍各种字符集的及其使用。并适时的介绍一些历史情况，主要讨论字符集在java机C语言环境中的使用，及阐述UTF，ISO 8859-1，ASCII他们之间的关系。会介绍一些乱码知识，总而言之，乱码产生的原因就是编码与解码不一致造成的。

一、概念：

1、BCD码

最初的计算机性能和存储容量都比较差，所以普遍采用4位BCD（BinaryCoded Decimal）编码（这个编码出现比计算机还早，最早是用在打孔卡上的）。BCD编码简单点说就是将十进制用二进制表示，如下图所示。

BCD编码表示数字还可以，但表示字母或符号就很不好用，需要用多个编码来表示。后来经过演变发展成了ASCII码。ASCII含33（ASCII码范围为：0~31和127）个控制字符，和95（ASCII码范围32~126）个可显示字符。

2、由ASCII码发展到Unicode

ASCII编码存储方式：

其中最高位0，其余七位为0或1，可表示的范围为：0 ~ 2^7= 0 ~ 128

C语言实现打印字符A

# include 
int main()
{
    char ch = '65';
    printf("%c", ch);
    return 0;
}

后来，就像建造巴比伦塔一样，世界各地的都开始使用计算机，但是很多国家用的不是英文，他们的字母里有许多是ASCII里没有的，为了可以在计算机保存他们的文字，他们决定采用127号之后的空位来表示这些新的字母、符号，还加入了很多画表格时需要用下到的横线、竖线、交叉等形状，一直把序号编到了最后一个状态255。从128到255这一页的字符集被称"扩展字符集"。从此之后，贪婪的人类再没有新的状态可以用了。

等中国人们得到计算机时，已经没有可以利用的字节状态来表示汉字，况且有6000多个常用汉字需要保存呢。但是这难不倒智慧的中国人民，我们不客气地把那些127号之后的奇异符号们直接取消掉, 规定：一个小于127的字符的意义与原来相同，但两个大于127的字符连在一起时，就表示一个汉字，前面的一个字节（他称之为高字节）从0xA1用到0xF7，后面一个字节（低字节）从0xA1到0xFE，这样我们就可以组合出大约7000多个简体汉字了。在这些编码里，我们还把数学符号、罗马希腊的字母、日文的假名们都编进去了，连在 ASCII 里本来就有的数字、标点、字母都统统重新编了两个字节长的编码，这就是常说的"全角"字符，而原来在127号以下的那些就叫"半角"字符了。

中国人民看到这样很不错，于是就把这种汉字方案叫做"GB2312"。GB2312 是对ASCII 的中文扩展。

但是中国的汉字太多了，我们很快就就发现有许多人的人名没有办法在这里打出来，特别是某些很会麻烦别人的国家领导人。于是我们不得不继续把 GB2312 没有用到的代码点找出来老实不客气地用上。

后来还是不够用，于是干脆不再要求低字节一定是127号之后的内码，只要第一个字节是大于127就固定表示这是一个汉字的开始，不管后面跟的是不是扩展字符集里的内容。结果扩展之后的编码方案被称为 GBK 标准，GBK 包括了GB2312 的所有内容，同时又增加了近20000个新的汉字（包括繁体字）和符号。

后来少数民族也要用电脑了，于是我们再扩展，又加了几千个新的少数民族的字，GBK 扩成了 GB18030。从此之后，中华民族的文化就可以在计算机时代中传承了。

由于世界各地都产生了自己的编码方案，这是给人的沟通带来了巨大麻烦。于是有一个叫做ISO的国际组织开始着手解决这个问题，想用一种规范来表示出所有的语言。于是Unicode就这样产生了。Unicode是内存编码表示方案（是规范），而UTF是如何保存和传输Unicode的方案（是实现）这也是UTF与Unicode的区别。

注意：Unicode字符集有多种编码方式，如UTF-8、UTF-16等；ASCII只有一种；大多数MBCS（包括GB2312）也只有一种。

字符是各种文字和符号的总称，包括各个国家文字、标点符号、图形符号、数字等。字符集是多个字符的集合，字符集种类较多，每个字符集包含的字符个数不同，常见字符集有：ASCII字符集、ISO 8859字符集、GB2312字符集、BIG5字符集、GB18030字符集、Unicode字符集等。

各个国家和地区在制定编码标准的时候，“字符的集合”和“编码”一般都是同时制定的。因此，平常我们所说的“字符集”，比如：GB2312, GBK, JIS 等，除了有“字符的集合”这层含义外，同时也包含了“编码”的含义。

3、ISO 8859-1

ISO/IEC8859-1，又称Latin-1或“西欧语言”，是国际标准化组织内ISO/IEC 8859的第一个8位字符集。它以ASCII为基础，在空置的0xA0-0xFF的范围内，加入96个字母及符号，藉以供使用变音符号的拉丁字母语言使用。IOS 8859-1表示的字符就是Unicode的0x0000-0x00ff之间的字符。

在下文代码页中有关于ISO 8859-1与Windows-1252的区别。

4、Unicode编码详解

Unicode字符集可以简写为UCS（Unicode Character Set），0x0000~0X00ff与ISO 8859-1保持一致

Unicode可以逻辑分为17平面（Plane），每个平面拥有65536（ = 216）个代码点，虽然目前只有少数平面被使用。

平面0 (0000–FFFF): 基本多文种平面（Basic Multilingual Plane, BMP）.
平面1 (10000–1FFFF): 多文种补充平面（SupplementaryMultilingual Plane, SMP）.
平面2 (20000–2FFFF): 表意文字补充平面（SupplementaryIdeographic Plane, SIP）.
平面3 (30000–3FFFF): 表意文字第三平面（TertiaryIdeographic Plane, TIP）.
平面4 to 13 (40000–DFFFF)尚未使用
平面14 (E0000–EFFFF): 特别用途补充平面（SupplementarySpecial-purpose Plane, SSP）
平面15 (F0000–FFFFF)保留作为私人使用区（PrivateUse Area, PUA）
平面16 (100000–10FFFF)，保留作为私人使用区（PrivateUse Area, PUA）

中、日、韩的三种文字占用了Unicode中0x3000（12288）到0x9FFF（40959）的部分，共计28671个字符；而中文在BMP中的范围是：U+4E00到U+9FA5之间是汉字的Unicode编码。

5、 UTF格式详解

UTF是 Unicode Transformation Format的缩写。是Unicode的一种实现方案。任何文字在Unicode中都对应一个值，这个值称为代码点也叫码位（CodePoint）。代码点的值通常写为：U+ABCD，在Java中可以直接将一个字符赋值为，

public class Test1 {
	public static void main(String[] args) throws Exception {
		char ch = '\u6211';
		System.out.println(ch);
	}
}

输出结果：我

UTF-8四种具体实现方式：

1.第一种是一个字节的编码：即128个ascii字符（只需要一个字节）

格式：0xxxxxxx

2^7 - 1 = 127 = 7F = (0111-1111)

编码方式Unicoe范围由(U+0000 至 U+007F)

2.第二种是两个字节的编码：即带有符号的拉丁文，希腊文，西里尔字母，亚美尼亚语，希伯来文，阿拉伯文等，则需要两个字节编码(Unicode 范围由U+0080至U+07FF)

格式：110xxxxx 10xxxxxx

(0080)16 = (128)10

(07FF) 16 = (2047)10 = 2^11-1;

3.第三种是三字节的编码，即其他多文种平面(BMP)中的字符（这包括了大部分的汉字）（范围为: U+0800 至 U+FFFF）

格式：1110xxxx 10xxxxxx 10xxxxxx

U+0800 = 2048；

U+FFFF = 65535 = 2^16 -1；

1110xxxx 10xxxxxx 10xxxxxx

4.第四种是4-6字节编码。

U+1 0000至U+1 FFFFF：使用四字节

U+20 0000 至U+3FF FFFF：使用五字节

U+400 0000至U+7FFF FFFF

UTF-8就是以8位为单元对UCS进行编码。从UCS-2到UTF-8的编码方式如下：

UCS-2编码(16进制)	范围	UTF-8 字节流(二进制)
0000 - 007F	0 - 127	0xxxxxxx
0080 - 07FF	128-2047	110xxxxx 10xxxxxx
0800 - FFFF	2048-65535	1110xxxx 10xxxxxx 10xxxxxx

例如“汉”字的Unicode编码是6C49。6C49在0800-FFFF之间，所以肯定要用3字节模板了：1110xxxx 10xxxxxx 10xxxxxx。将6C49写成二进制是：0110 110001 001001，用这个比特流依次代替模板中的x，得到：11100110 10110001 10001001，即E6 B1 89。

目前计算机一般使用 2 个字节（16 位）来存放一个序号（DBCS,DoubleByte Character System），因此，这种方式存放的字符也被称作宽字节字符。比如，字符串"中文123" 在 Windows2000 下，内存中实际存放的是 5 个字符，一共10个字节；若在gb2312编码中，共计五个字符，7个字节。

6、代码页及字符集对照表

Windows将字符集称作代码页。代码页是字符集编码的别名，也有人称"内码表",

437 IBM437 OEM美国

932 shift_jis 日语 (Shift-JIS)

936 gb2312 简体中文 (GB2312)

950 big5 繁体中文 (Big5)

1200 utf-16 Unicode（Little-Endian）

1201 UnicodeFFFE Unicode (Big-Endian)

1252 Windows-1252 西欧字符 (Windows)

1253 windows-1253 希腊字符 (Windows)

65001 UTF-8

ISO-8859-1和Windows-1252的区别

ISO-8859-1，正式编号为ISO/IEC 8859-1:1998，又称Latin-1或“西欧语言”，是国际标准化组织内ISO/IEC 8859的第一个8位字符集。它以ASCII为基础，在空置的0xA0-0xFF的范围内，加入96个字母及符号，藉以供使用附加符号的拉丁字母语言使用。Unicode的前0-255个字符与ISO-8859-1相一致。

Windows-1252经常被错误地贴上ISO-8859-1的标签，因为它们十分相似。除了128到159（十六进制80到9F）范围内的很少使用的C1控制字符被替换为额外的字符外，Windows-1252代码页的字符和ISO-8859-1完全一致。Windows-28591代码页才是真正的ISO-8859-1，然而，英文版的Windows 7系统上似乎没有Windows-28591代码页，至于其他系统有没有我就不知道了。Windows-1252是ISO的超集。

最后说点废话，百度百科上的东西大部分都是复制粘贴中文维基百科上的，中文维基百科没有的东西，百度百科也不太可能会有，比如说Windows-1252。而维基上的中文资料远远少于英文资料，很多详尽的英文资料要么没有翻译成中文，要么只是翻译成很简略的中文，比如ISO-8859-1。翻译维基百科的词条又没有钱赚，中国人那么聪明，才不会去做这种吃力不讨好的事情。

UTF-16和UCS-2都是Unicode的编码方式。

Unicode使用一个确定的名字和一个叫做代码点（code point）的整数来定义一个字符。例如©字符被命名为“copyright sign”并且有一个值为U+00A9（0xA9，十进制169）的代码点。

Unicode的码空间为U+0000到U+10FFFF，共有1,112,064个代码点(code point)可用来映射字符. Unicode的码空间可以划分为17个平面(plane)，每个平面包含216(65,536)个代码点。每个平面的代码点可表示为从U+xx0000到U+xxFFFF, 其中xx表示十六进制值从0016 到1016，共计17个平面。

第一个Unicode平面(代码点从U+0000至U+FFFF)包含了最常用的字符，该平面被称为基本多语言平面（Basic Multilingual Plane），缩写为BMP。其他平面称为辅助平面(Supplementary Planes)。

UCS-2 (2-byte UniversalCharacter Set)是一种定长的编码方式，UCS-2仅仅简的使用一个16位码元来表示代码点，也就是说在0到0xFFFF的代码点范围内，它和UTF-16基本一致。

UTF-16 (16-bit UnicodeTransformation Format)是UCS-2的拓展，它可以表示BMP以为的字符。UTF-16使用一个或者两个16位的码元来表示代码点，这样就可以对0到0x10FFFF的代码点进行编码。

例如，在UCS-2和UTF-16中，BMP中的字符U+00A9copyright sign（©）都被编码为0x00A9。

但是在BMP之外的字符，例如，只能用UTF-16进行编码，使用两个16位码元来表示：0xD834 0xDF06。这被称作代理对，值得注意的是一个代理对仅仅表示一个字符，而不是两个。UCS-2并没有代理对的概念，所以会将0xD834 0xDF06解释为两个字符。

UTF-16与UCS-2的联系与区别：

简单的说，UTF-16可看成是UCS-2的父集。在没有辅助平面字符（surrogate code points）前，UTF-16与UCS-2所指的是同一的意思。（严格的说这并不正确，因为在UTF-16中从U+D800到U+DFFF的代码点不对应于任何字符，而在使用UCS-2的时代，U+D800到U+DFFF内的值被占用。）但当引入辅助平面字符后，就称为UTF-16了。

但UCS-2只是一个编码方案，UTF-16却要用于实际的传输，所以就不得不考虑字节序的问题。

7、UTF的字节序和BOM

UTF-8以字节为编码单元，没有字节序的问题。UTF-16以两个字节为编码单元，在解释一个UTF-16文本前，首先要弄清楚每个编码单元的字节序。例如收到一个“奎”的Unicode编码是594E，“乙”的Unicode编码是4E59。如果我们收到UTF-16字节流“594E”，那么这是“奎”还是“乙”？

Unicode规范中推荐的标记字节顺序的方法是BOM。BOM是Byte Order Mark。BOM是一个有点小聪明的想法：

在UCS编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTHNO-BREAK SPACE"。

这样如果接收者收到FEFF，就表明这个字节流是Big-Endian的；如果收到FFFE，就表明这个字节流是Little-Endian的。因此字符" zero widthno-break space"又被称作BOM。

UTF-8不需要BOM来表明字节顺序，但可以用BOM来表明编码方式。字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8编码是EF BB BF（读者可以用我们前面介绍的编码方法验证一下）。所以如果接收者收到以EF BB BF开头的字节流，就知道这是UTF-8编码了。

8、Windows记事本有四种保存格式

用记事本-文件-另存为，如上如图即可看到Windows记事本保存的四种格式，如上如所示，分别为：

l ANSI：在简体中文系统的windows中ANSI即gb2312.

l Unicode：对应UTF-16LE，

l Unicode Big Endian：对应UTF-16BE

l UTF-8：使用了变长的编码

Big Endian 和 Little Endian名词的由来

这两个术语来自于 Jonathan Swift 的《《格利佛游记》其中交战的两个派别无法就应该从哪一端－－小端还是大端－－打开一个半熟的鸡蛋达成一致。：）

“endian”这个词出自《格列佛游记》。小人国的内战就源于吃鸡蛋时是究竟从大头(Big-Endian)敲开还是从小头(Little-Endian)敲开，由此曾发生过六次叛乱，其中一个皇帝送了命，另一个丢了王位。

我们一般将endian翻译成“字节序”，将big endian和little endian称作“大尾”和“小尾”。

在那个时代，Swift是在讽刺英国和法国之间的持续冲突，Danny Cohen，一位网络协议的早期开创者，第一次使用这两个术语来指代字节顺序，后来这个术语被广泛接纳了。

主要表现在存储格式上，比如一个字符的编码为ABCD

Big Endian的(FE FF)存储格式为：AB CD；

Little Endian的（FF FE）存储格式为：CD AB ；

Windows记事本就是使用BOM来标记文本文件的编码方式的。当打开一个txt文本，会自动添加BOM。

二应用

1. 1 Java对字符的处理

1 ）、String类的
public byte[] getBytes(Charset charset)
这是java字符串处理的一个标准函数，其作用是将字符串所表示的字符按照charset编码，并以字节方式表示。注意字符串在java内存中总是按unicode编码存储的。

public class Test1 {
    public static void main(String[] args) throws Exception {
       String string = "你好！";
       String str1 = new String(string.getBytes("gbk"));
       System.out.println(str1);
    }
}

将一个String 类型Unicode字符串转为对应字节，一般String默认光标gbk编码；各个编译器可能不同，可以到windows-preference-general-workspace界面的左下角有显示，也可以自行调节。

2）、 new String（charset）

这是java字符串处理的另一个标准函数，和上一个函数的作用相反，将字节数组按照charset编码进行组合识别，最后转换为unicode存储。参考上述getBytes的例子

3）、setCharacterEncoding（）

该函数用来设置http请求或者相应的编码。

1.2. String 与byte的相互转换

java字符编码常见问题主要在两个方面

l 字节到String

l String转字节。

1 字节到String。

只有字节才有编码含义，String永远是Unicode。在java中，字符默认存储的编码为utf-8码，所以String str1 = “你好，Ice Blue”;Str的编码为utf-8可以用一下代码来实验：

System.out.println(Charset.defaultCharset());

以下java代码实现了将一个字符的编码转换为汉字。

public class Test02 {
   public static void main(String[] args) throws Exception {
      System.out.println("字节按编码转成字符:");
      String strUtf8Hex = "E4B8ADE69687"; // “中文”的utf8的16进制编码
      byte byteUtf8[] = hex2byte(strUtf8Hex);// 转成字节流
 
      String str = new String(byteUtf8,"UTF-8");
      System.out.println(str);
   }
 
   public static byte[] hex2byte(String str) {
      byte[] b = new byte[str.length() / 2];
      for (inti = 0; i < str.length(); i += 2) {
         String str2 = str.substring(i, i + 2);
         b[i / 2] = (byte) Integer.parseInt(str2, 16);
      }
      return b;
   }
}

2. String转字节。String.getBytes方法是按编码集转换编码，不能理解为取出String的字节来。是平时常见转码工作应该采用的方法。

以下代码实现了将一个汉字转换为其对应编码

public class Test1 {
   public static void main(String[]args) throws Exception {
      System.out.println("字节按编码转成字符:");
      String strUtf8Hex ="中文賦";// “中文”的utf8的16进制编码
      byte[] Utf8byte = strUtf8Hex.getBytes("UTF-16BE");
      System.out.println(byte2hex(Utf8byte));
   }
 
   public static String byte2hex(byte[]b) {
      String sum = "";
      String stmp = "";
      for (inti = 0; i < b.length; i++) {
         stmp = Integer.toHexString(b[i] & 0XFF);//保留前8位
         if (stmp.length() == 1)
            sum = sum + "0" + stmp;
         else
            sum = sum + stmp;
      }
      return sum.toUpperCase();
   }
}

3 控制台乱码问题

Eclipse 的控制台必须用GBK编码。所以条件1和条件4必须同时满足否则运行的还是乱码。才能保证不是乱码。

条件1，Window | Preferences | Workspace | Textfileencoding | GBK编码。这样定义的是整个工作区间的编码。这样就把整个工作空间的编码格式定死了，但是如果某一个工程用的是不同的编码格式的话这样单独再解决。如下：

条件2，工程上右键 | Properties | Resource | Textfileencoding | UTF-8编码。或者适合的编码格式。这样定义的是整个工程的编码。这样就把整个工程的编码格式定死了，但是如果某一个文件用的是不同的编码格式的话这样单独再解决。如下：

条件3，在某个文件上右键| Properties | Resource | Textfileencoding | UTF-8编码。或者适合的编码格式。这样定义的是单独某个文件的编码。

这里要说的是文件的实际编码格式优先用的是：第3个，其次再用2，最后先用1。有时候是123，必须满足条件。无论怎样这几种编码格式试一试就全知道了。

条件4，还有运行时编码设置如下：菜单：Run Configuration | 右侧的选项卡Common 的 Console Encoding 选择UTF-8编码。这个是用来控制console控制台显示，必须是与前面几个编码相同UTF-8，就不会乱码。

这样保证了工作空间和工程代码编程方式和工程里的单独文件的编码格式的不冲突。

拓展：

计算机数制的概念

基本概念：

数码：数制中表示基本数值大小的不同数字符号。

例如，

二进制有两个数码：0,1；

十进制有10个数码：0、1、2、3、4、5、6、7、8、9。

十六进制有16个数码：0、1、2、3、4、5、6、7、8、9，A、B、C、D、E、F

基数：数制所使用数码的个数。例如，二进制的基数为2；十进制的基数为10。

位权： 数制中某一位上的1所表示数值的大小（所处位置的价值）。例如，十进制的123，1的位权是100，2的位权是10，3的位权是1。二进制中的 1011 ，第一个1的位权是8，0的位权是4，第二个1的位权是2，第三个1的位权是1；

数制：按进位的原则进行计数，称为进位计数制，简称数制。不论是哪一种数制，其计数和运算都有共同的规律和特点。

⑴ 逢N进一

N是指数制中所需要的数字字符的总个数，称为基数。如：0、1、2、3、4、5、6、7、8、9等10个不同的符号来表示数值，这个10就是数字字符的总个数，也是十进制的基数，表示逢十进一。

⑵ 位权表示法

位权是指一个数字在某个固定位置上所代表的值，处在不同位置上的数字所代表的值不同，每个数字的位置决定了它的值或者位权。位权与基数的关系是：各进位制中位权的值是基数的若干次幂。

数制符号

二进制B(binary)

八进制O(octal)

十进制D(decimal)

十六进制H(hexadecimal)

至于进制转换网上有很多参考文档，这里不再赘述。

参考资料：

1 趣谈Unicode，ansi，utf-8,Unicode big endian这些编码有什么区别（http://blog.csdn.net/fanwenbo/article/details/2298800）

2 Unicode字符查询（http://unicode-table.com/cn/#control-character）

3 国标码查询（http://www.qqxiuzi.cn/bianma/guobiaoma.php）

4 Code Page Identifiers （ https://msdn.microsoft.com/en-us/library/windows/desktop/dd317756(v=vs.85).aspx）

你可能感兴趣的:(UTF与Unicode的关系)

凯立德C-CAR端口修改器：自定义导航系统通信端口朱佳顺
本文还有配套的精品资源，点击获取简介：凯立德C-CAR端口修改器是一款旨在帮助用户自定义和调整凯立德导航软件通信端口设置的工具。它简化了根据不同车辆配置或个人需求调整端口参数的过程，用户只需拖放NaviConfig.dll文件到指定位置即可完成修改。这对于需要在不同车辆间切换导航设备或解决设备不兼容问题的用户特别有用。然而，在使用时需要注意数据备份和确认来源，防止数据丢失或系统损坏。1.凯立德C-
html字段最大长度限制,html input 限制输入的长度并提示的方法朱佳顺 html字段最大长度限制
html中input标签的value值的长度理论上应该是2^32(数据来源于资料，没有测试过)，但为了防止一些input的输入数据过长来做一些限制，该如何实现呢？这篇文章就来介绍一下，如何限制input输入数据的长度并且输入的数据超过规定的长度该如何去提示？htmlinput限制输入字符串长度的方法input标签中的maxlength属性，可以用来规定输入字符串的最大长度。示例代码：htmlinp
67.220.90.4 forum index.php,http://67.220.92.14/forum/inde PHP注释实例技巧朱佳顺 67.220.90.4 forum index.php
复制代码代码如下:$a=1;$b=2;if(1==1){$andy=‘帅哥’;}?>一般注释的时候,用复制代码代码如下:/*$a=1;$b=2;*/if(1==1){$andy=‘帅哥’;}?>调程序的时候,老要把后面的*/拿到前面去,很麻烦复制代码代码如下:/**/$a=1;$b=2;if(1==1){$andy=‘帅哥’;}?>现在应该这样写这样是注释掉复制代码代码如下:/**$a=1;$b=
先学node.js还是php,vue和node先学哪个？朱佳顺先学node.js还是php
vue和node应该先学习node，node可以为vue提供包管理工具和模块化管理，可以使vue的开发更加简单快速。所以应该先学习node。vue介绍：Vue.js是web界面的渐进式框架。Vue.js的目标是通过尽可能简单的API实现响应的数据绑定和组合的视图组件。Vue.js自身不是一个全能框架——它只聚焦于视图层。因此它非常容易学习，非常容易与其它库或已有项目整合。另一方面，在与相关工具和支
python hack库_这里有123个黑客必备的Python工具！ weixin_39637571 python hack库
123个Python渗透测试工具，当然不仅于渗透~如果你想参与漏洞研究、逆向工程和渗透，我建议你时候用Python语言。Python已经有很多完善可用的库，我将在这里把他们列出来。这个清单里的工具大部分都是Python写成的，一部分是现有C库的Python绑定，这些库在Python中都可以简单使用。一些强力工具(pentestframeworks、bluetoothsmashers、webappl
模型的秘密武器：利用注意力改善长上下文推理能力步子哥人工智能自然语言处理深度学习语言模型
【导语】在大语言模型（LLM）不断刷新各项任务记录的今天，很多模型宣称能处理超长上下文内容，但在实际推理过程中，复杂问题往往因隐性事实的遗漏而败下阵来。今天，我们就以《AttentionRevealsMoreThanTokens:Training-FreeLong-ContextReasoningwithAttention-guidedRetrieval》为蓝本，带大家通俗解读如何利用Transf
Windows下工作组架构和域架构 weixin_33728708 数据库系统架构
工作组架构的网络工作组架构网络也被称为对等网络（peertopeer）域架构网络工作组架构网络域架构网络网络内每台计算机地位平等，资源和管理分散在各个计算机上网络内分为域控制器和成员服务器，如果有多台域控制器，则域控制器之间地位平等每台计算机都有一个本地安全账户管理器（SecurityAccountsManager,SAM）数据库，存储本地账户域内计算机共享一个集中的目录数据库（Directory
利用A、G、DL、P策略来管理网络资源访问权限 lyuharvey
问题描述:如现在某个企业是通过域来管理的。在域中，有三台打印机，其中，销售部门只能够访问打印机A;管理部门只能够使用打印机B;财务部门可以访问打印机C，当打印机C不能够使用时，则可以使用打印机B。在域中，还有三个共享文件夹，其中文件夹甲是销售部门专用文件夹，只有销售员工以及销售总监与财务总监可以访问;文件夹乙是财务专用文件夹，只有财务部门以及财务总监帐户可以访问;文件夹丙是一个公共文件夹，任何部门
OpenAI 团队组织架构和研发技术栈 AI天才研究院 ChatGPT 人工智能
OpenAI是一家致力于推动人工智能技术发展的公司，成立于2015年。其目标是确保人工智能技术造福全人类。为了实现这一目标，OpenAI采用了多种先进的技术和组织架构来推动其研发工作。目录OpenAI组织架构和研发技术栈概述1OpenAI团队的世界顶尖科学家IlyaSutskever：Ilya是OpenAI的联合创始人之一，也是深度学习领域的先驱。他在神经网络和深度学习方面的研究具有重要影响，曾与
物联网（IoT）架构中，平台层的应用与技术小赖同学啊智能硬件物联网架构
在物联网（IoT）架构中，平台层是连接物理设备（感知层）和应用服务（应用层）的核心部分。它负责数据的采集、处理、存储、分析以及设备管理等功能，是物联网系统的“大脑”。以下是平台层的主要功能及其技术实现手段：平台层的主要功能设备管理：功能：管理物联网设备的注册、配置、监控、维护和故障诊断。技术手段：设备注册与认证：使用MQTT、CoAP等协议实现设备接入，结合OAuth、X.509证书等技术进行设备
六十天前端强化训练之第十七天React Hooks 入门：useState 深度解析编程星辰海 #前端前端 react.js javascript
=====欢迎来到编程星辰海的博客讲解======看完可以给一个免费的三连吗，谢谢大佬！目录一、知识讲解1.Hooks是什么？2.useState的作用3.基本语法解析4.工作原理5.参数详解a)初始值设置方式b)更新函数特性6.注意事项7.类组件对比8.常见问题解答二、核心代码示例三、实现效果四、学习要点总结五、扩展阅读推荐官方文档优质文章推荐学习路径进阶资源六、实践步骤一、表单输入控制二、动态
【Kubernetes】Kubernetes 容器集群管理系统概述码农鑫哥的日常 kubernetes 容器云原生 1024程序员节
目录前言什么是云原生？容器编排介绍云原生容器云容器编排云平台SRE一、Kubernetes概述1.1K8S是什么？1.1.1作用1.2为什么要用K8S?1.2.1K8s目标1.2.2K8s对于docker的优势1.2.3K8s功能1.2.4K8s特性1.2.4.1弹性伸缩1.2.4.2自我修复1.2.4.3服务发现和负载均衡1.2.4.4自动发布（默认滚动发布模式）和回滚1.2.4.5集中化配置管
QEMU 调试 TF-A开发环境建立(使用 QEMU 调试 TF-A (Trusted Firmware-A) 之二） robin861109 使用QEMU调试TF-A 硬件架构 iot 物联网
文章目录前言1`TF-A(TrustedFirmware-A)`概述2`Cortex-A57`3`ARMFVP`基板4GDB调试环境介绍4.1GDB简介4.2设置GDB调试环境4.3使用GDB5、配置QEMU调试TF-A开发环境5.1安装交叉工具链5.2安装其他必需的依赖项5.3克隆TF-A源代码5.4编译TF-A（TrustedFirmware-A）6、仿真调试过程7、实际调试过程举例前言QEM
深入解析React 18核心特性：构建未来级Web应用的全面指南斯~内克 react知识点前端 react.js 前端框架
一、React18的里程碑意义React18作为近年来最具革命性的版本更新，标志着前端开发正式进入并发渲染时代。这个版本不仅带来了底层架构的革新，更重新定义了现代Web应用的性能标准与开发范式。根据npm官方统计，React18发布首周下载量突破1800万次，GitHub星标数新增3.4万，充分展现了开发者社区对其技术价值的认可。二、架构革命：并发模式深度解析2.1并发渲染原理//传统同步渲染模式
机器学习中的梯度到底是什么？（chat-gpt问答）湫怿机器学习 gpt 人工智能梯度
1、梯度是对损失函数求导吗？是的，梯度是对损失函数（或目标函数）求导数值化后的结果。梯度告诉我们目标函数在某个点上的方向性和变化率，这些信息是优化算法推进参数评估和更新的重要指标。在机器学习中，我们通过不断调整参数，使目标函数达到最小值，从而实现模型的训练和学习。2、为什么梯度要求偏导来求解？梯度是一个向量，它的方向指向函数值增加最快的方向，其大小表示函数值的变化率。为了确定梯度的方向和大小，需要
Android Jetpack qq_39892855
AndroidJetpack翻译Jetpack是一套让开发者更容易开发出完美安卓应用的组件。这个组件帮助你遵循最好的实践，让你减少写一些模板代码，简化复杂的task任务，能让你更加专注自己的业务代码。Jetpack使用的是androidx.*包名，与旧的android.*分开。这意味着它提供向后兼容性并且他会更频繁地更新，确保您始终可以访问最新和最好的Jetpack组件版本。特点加速开发组件可以单
红蓝对抗之Windows内网渗透实战 wespten 网络安全AI+渗透测试代码审计等保全栈网络安全开发 windows
无论是渗透测试，还是红蓝对抗，目的都是暴露风险，促进提升安全水平。企业往往在外网布置重兵把守，而内网防护相对来说千疮百孔，所以渗透高手往往通过攻击员工电脑、外网服务、职场WiFi等方式进入内网，然后发起内网渗透。而国内外红蓝对抗服务和开源攻击工具大多数以攻击Windows域为主，主要原因是域控拥有上帝能力，可以控制域内所有员工电脑，进而利用员工的合法权限获取目标权限和数据，达成渗透目的。以蓝军攻击
如何用爬虫根据关键词获取商品列表：一份简单易懂的代码示例 API小爬虫爬虫
在当今数字化时代，网络爬虫已经成为数据收集和分析的强大工具。无论是市场调研、价格监控还是产品分析，爬虫都能帮助我们快速获取大量有价值的信息。今天，我们就来探讨如何通过编写一个简单的爬虫程序，根据关键词获取商品列表。以下是一个基于Python语言的代码示例，适合初学者学习和实践。一、准备工作在开始编写爬虫之前，我们需要准备以下工具和库：Python环境：确保你的电脑上安装了Python。推荐使用Py
Spring Boot与Django对比：哪个更适合做为Web服务器框架？ m0_74824076 面试学习路线阿里巴巴 spring boot django 前端
文章目录1.基础背景与技术栈1.1SpringBoot1.2Django2.架构对比2.1SpringBoot架构2.2Django架构3.性能比较3.1SpringBoot性能3.2Django性能4.开发效率4.1SpringBoot开发效率4.2Django开发效率5.社区与生态系统5.1SpringBoot社区5.2Django社区6.部署与运维6.1SpringBoot部署与运维6.2D
打造高性能的react 大鸡腿最好吃 react.js
根本目的就是减少重复渲染使用使用shouldComponentUpdate规避冗余的更新逻辑shouldComponentUpdate触发的条件是只要父组件更新了，就会被触发，在里面判断传入的pros是否改变，不变则返回falsePureComponent+Immutable.jsPureComponent其实就是内置了对shouldComponentUpdate的实现，不过其对props的比对是
计算机视觉算法实战——驾驶员玩手机检测（主页有源码）喵了个AI 计算机视觉实战项目计算机视觉算法智能手机
✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨1.领域简介：玩手机检测的重要性与技术挑战驾驶员玩手机检测是智能交通安全领域的核心课题。根据NHTSA数据，美国每年因手机使用导致的交通事故超过3000起，中国公安部的统计显示开车使用手机的事故率是正常驾驶的23倍。该技术通过实时监测驾驶员手部动作和视线方向，识别非法使用手机行为，在以
【Python】构建Web应用的首选：Flask框架基础与实战萧鼎 python基础到进阶教程 python 前端 flask
构建Web应用的首选：Flask框架基础与实战在Python的Web开发生态中，Flask框架以其轻量、灵活和易用的特性成为构建Web应用的首选之一。无论是快速搭建一个小型应用原型，还是构建复杂的后端服务，Flask都提供了便捷的接口和丰富的扩展支持。本博客将介绍Flask的基础知识和核心概念，并通过一个简单的实例展示如何用Flask构建Web应用。一、Flask框架简介Flask是由ArminR
安全测试数据的分析、报告及业务应用蚂蚁质量安全测试质量体系安全网络 web安全
一、安全测试指标与测量目标在风险分析和管理流程中，有效运用安全测试数据的前提是准确定义安全测试指标和测量目标。例如，通过统计安全测试中发现的漏洞总数，能够量化应用程序的安全状态，还可据此设定软件安全测试的目标，如在应用程序投入生产环境前，将漏洞数量降低至可接受的最低限度。另一个具有管理价值的目标是将应用程序的安全状态与安全基线进行对比，以此评估应用安全流程的改进情况。假设安全指标基线对应的是仅完成
Android Jetpack介绍 Gary.Mi Android
1.文档背景本文是Jetpack介绍系列文档的开篇，是对Jetpack整体的介绍，后续会对其中的各个组件分别单独说明。2.官方简介Jetpack是一套库、工具和指南，可帮助开发者更轻松地编写优质应用。使用这些组件，可帮助开发者遵循最佳实践，摆脱编写样板代码的工作并简化复杂任务，使开发者将精力集中放在所需的代码上。Jetpack包含与平台API解除捆绑的androidx.*软件包库。这意味着，它可以
linux清空文件夹的命令 getapi linux github git
在Linux系统中，清空文件夹（即删除文件夹中的所有内容，但保留文件夹本身）可以通过多种方法实现。以下是几种常见的命令和操作方式：方法1:使用rm命令rm是一个强大的命令，用于删除文件和目录。要清空文件夹的内容，可以使用以下命令：rm-rf/path/to/folder/*解释：rm：删除命令。-r：递归删除，用于处理目录及其子目录。-f：强制删除，无需确认。/path/to/folder/*：指
Spring Boot应用首次请求性能优化实战：从数据库连接池到JVM调优一休哥助手 java spring boot 性能优化数据库
目录问题现象与背景分析性能瓶颈定位方法论数据库连接池深度优化SpringBean生命周期调优JVM层性能预热策略全链路监控体系建设生产环境验证方案总结与扩展思考1.问题现象与背景分析1.1典型问题场景在某互联网金融项目的SpringBoot应用上线后，运维团队发现一个关键现象：应用重启后首次访问提现接口耗时约1300ms后续请求稳定在200ms以内每日凌晨服务重启后，首笔交易超时率高达30%1.2
深入解析 Vue 3 Teleport：原理、应用与最佳实践赵大仁前端 Vue.js 技术 vue.js javascript 前端
深入解析Vue3Teleport：原理、应用与最佳实践1.引言Vue3引入了Teleport组件，它可以让我们将组件的渲染位置从当前组件层级移动到DOM的其他位置，而不影响Vue的响应式和组件状态管理。在开发中，我们经常遇到模态框、通知、弹窗、工具提示（Tooltip）等UI组件，这些组件通常需要被渲染到body或特定DOM节点，以避免z-index层级问题。Vue3的Teleport解决了这个问
大型语言模型与强化学习的融合：迈向通用人工智能的新范式——基于基础复现的实验平台构建（initial）大模型科普人工智能强化学习
1.引言大型语言模型（LLM）在自然语言处理领域的突破，展现了强大的知识存储、推理和生成能力，为人工智能带来了新的可能性。强化学习（RL）作为一种通过与环境交互学习最优策略的方法，在智能体训练中发挥着重要作用。本文旨在探索LLM与RL的深度融合，分析LLM如何赋能RL，并阐述这种融合对于迈向通用人工智能（AGI）的意义。为了更好地理解这一融合的潜力，我们基于“LargeLanguageModela
深入解析 React Diff 算法：原理、优化与实践赵大仁前端技术 js react.js 前端前端框架
深入解析ReactDiff算法：原理、优化与实践1.引言React作为前端领域的标杆框架，采用虚拟DOM（VirtualDOM）来提升UI更新性能。React的Diff算法（Reconciliation）是虚拟DOM运行机制的核心，它决定了如何高效地对比新旧DOM并执行最少的操作来更新UI。本篇文章将深入探讨ReactDiff算法的原理、优化策略，并通过生动的示例解析其工作方式，让你能够更直观地理
目标检测中衡量模型速度和精度的指标：FPS和mAP asdfg1258963 目标检测_ai 目标检测人工智能
“FPS”和“mAP”分别衡量了模型的速度和精度。FPS（FramesPerSecond）定义：FPS是“每秒传输帧数”的缩写，用于衡量计算机视觉系统（如目标检测、图像识别等）的实时性能。它表示系统每秒钟能够处理的图像或视频帧的数量。重要性：在实时应用中，如自动驾驶、视频监控等，FPS是一个关键指标。高FPS意味着系统能够快速处理输入的图像数据，实现实时响应。计算方式：FPS可以通过以下公式计算：
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&