CRongQ

字符编码之编码格式

写作目的

我曾经在校期间不管是学习编程涉及到字符串或者读写文件操作还是进行另保存文本文件时，时常会碰到对字符或者字符串进行处理的问题。我当时是知其然而不知所以然，所以在进行编程作业的过程中，往往花费较多精力去解决关于字符编码的问题（比如乱码），这为后来工作当中带来了极大的不便。最终楼主决定花点时间专门研究一下字符编码的问题，以免将来再次遇到这种情况时会稀里糊涂而浪费时间。

因此，写此文主要目的是梳理以前学到的东西，并且总结关键的知识点，再进一步对此加深理解。同时分享出来，也希望能够帮助诸位小伙伴。--开始写于2019.1月

本文概述

原本打算鼓励自己多阅读一些相关文献，就觉得已经足够了。然而，事实并非如此，这并不是说他人写得不够好，而是因为楼主从大量的文章中获取到的内容比较零散，再加上一些文章叙述的文字过多并且过于详细但又不够全面，又缺少借助演示图来理解。其实最主要的原因是没有整体性的知识点架构，这很容易扰乱楼主的思路，这显然不是一种好的学习方式。因此写本文之前，楼主在大佬们文章的基础上，同时参考了一些相关的书籍，去除了一些不必要的编码发展历史以及不必要过早解释的东西（实践性很强且没有一定开发经验是很难理解的知识），以楼主的理解抓取主要的知识点整理出来，为避免出现学习之后又忘记的尴尬局面。

本文会从其发展的阶段来讲解各种常见的编码格式。如果本文尚未涉及到其他编码格式，请另行研究。

正文

二进制文件和文本文件

在讲编码之前，我们首先得要弄懂二进制文件和文本文件的区别。我们时常编译一个程序会生成一个二进制映射文件，比如后缀名为.bin或者把项目生成DLL文件包含了.lib、.dll，此类文件一般是打不开的，如果用记事本打开，其内容就是一堆乱码，除非试图使用特定的工具，打开之后就是一大堆2进制或16进制的数据，这类文件就叫做二进制文件。而文本文件就是我们时常用到的以ASCII码形式或者其他编码格式来存储数据并可以运用软件打开查看内容的文件，比如txt文件，或者我正在写这篇文章用的doc文件。

存储的数据类型：二进制文件存储数据类型为图形文件（下面讲到的BMP格式文件就是图形文件）以及其他非字符型数据等(二进制映射文件)。

1.二进制文件是变长编码，也可以看成是值编码，它完全可以由编辑者指定的位数来确定一个实型数或者其他信息。（其他信息有用的信息用指定的二进制数据表示，如BMP文件里面的某些二进制数指定的是BMP头文件，又有一些二进制数指定的是头文件长度）

2. 而文本文件是定长编码，即固定位数为一个字符的编码，下文会详细讲到这些。文本文件是根据指定的编码格式转换为二进制数据存储在磁盘上，读取时，根据原来指定的编码格式转换为相应的字符显示出来。这就说明了我们另保存记事本时为何有编码的选项，就是这种原因。

假如二进制文件的内容里面如果有数字10，二进制数表示10，可能只占用2位数（当然可由编辑者灵活指定位数），那么其存储到磁盘里就是10，直接读取出来的可能还是10。然而由于二进制文件的数据位数完全是由于编辑者决定的，数字10存储的样子又不一定就是数字10.

假如以ASCII码形式文本文件的内容如果有数字10，则二进制数需要对照ASCII码表来转换成00110001 00110000(数字1十进制为49，数字0十进制为48)，各自占用8位，共16位数，那么其存储到磁盘里的是00110001 00110000，读取出来是还要把00110001 00110000根据编码格式转回为12. 文本文件是按照编码规范进行存储的，而二进制文件就是由编辑者决定的（比如说编译器作为编辑者，决定哪些数字符号用哪些二进制数据表示以及多少个字节）.

二进制文件的优点：

1.由于不用转换格式而存取速度快。

二进制文件是无格式存储起来的，意思是不同于文本文件必要使用编码格式。文本文件需要转换过程，从磁盘读取数据时，先把二进制数据根据编码格式转换为指定的字符。写字符存到磁盘时，先把字符根据编码格式转换为指定的二进制数据。

2.不用按照编码格式指定一个字符占用的字节而占用内存的空间小。

3.存储数据灵活。

缺点：

但是由于其存储的灵活度比文本文件高，所以增加了译码的难度。

什么叫编码？

在计算机里，所有数据进行存储和运算时都要使用二进制数来表示的。而当我们进行软件开发涉及字符处理或者文本编辑时，往往需要使用哪种数据对应指定的哪些二进制数字来表示的，例如字符"A"在ASCII码指定用"65"十进制(二进制为0100 0001)来表示，这就是编码。

二进制文件和文本文件都是属于编码。不同的是，文本文件有编码格式，而二进制文件没有。下面就开始讲解编码格式。

ASCII

ASCII（American Standard Code for Information Interchange，美国信息交换标准代码）。

如果我们完全按照个人的想法进行编码，那么当大家互相使用时就会造成编码混乱，毕竟那是因为每个人都有各自的一套编码约定。例如你把字符"A"用"65"十进制表示，而张三把字符"A"用"66"十进制表示，当你把张三编辑的文本在你的编码环境里打开，就出现了乱码的情况。所以，为了解决这个问题，大家就必须使用相同的编码约定，所以在以上例子中，张三必须要把字符”A”用”65”十进制表示，于是就有了编码格式，统一规定哪些字符是用哪些二进制数来表示的，每个人都要遵从这个规则。例如ASCII码。
ASCII码使用了指定的6位、7位或8位二进制数来组合出64、128或256种可能的字符。由于考虑到可靠性，不能使用转换字符，因此6位就排除掉了。又考虑到成本价格问题，8位也就排除掉了，所以这也就解释了一个字节8位中的最高位为0（即下一段讲到的高四位中的最高位）的原因，一共有7位ASCII码。

一个字节对应8位二进制数，分成高4位和低4位。高4位表示ASCII控制字符和ASCII打印字符这两个字符种类，低4位表示各个字符(数字、大小写字母，符号等)。高4位的最高位(即第8位，二进制数的最左边的位，高4位的最高位)通常为0。

ASCII存储格式

ASCII码优点

方便性：

例如26个字母是在ASCII码中的位置是连续的，只要将高四位中的某一位把0翻转成1，或者把1翻转成0，就可以获得相应的大小写字母。

例如数字0~9在低4位二进制相应的代码顺序是0001~1001,即归类按顺序来表示的，为的是方便记忆。

普及性：

ASCII码是一种极其可靠的标准，没有其他哪一种编码格式能像ASCII码一样普及，它扎根于我们计算机的键盘、视频显示器、系统硬件、打印机、字体文件，操作系统和因特网。

ASCII码缺点

由于ASCII码是美国标准，只能满足美国的要求，所以它并不能满足其他英语国家（更不用说东亚地区的国家）的需要。比如其他英语国家的一些特殊符号例如重音符号，在ASCII码是没有的。

ANSI

为了解决各国的编码需求，ANSI码由此产生了。ANSI编码使用0x00到0x7F(十进制0到127)范围的1个字节来遵从ASCII码的规则。超出的0x80到0xFFFF范围的2个字节来表示1个字符来表示其他语言的字符，即扩展的ASCII编码。由于2个字节最多可以存储字符数是2的16次方(65535个字符)，对于其他一个语言足够了。ASCII码之后的扩张编码就是由其他编码决定，例如中国GB2312编码作为ASCII码的扩展，其他国家语言也一样。而对于一些特殊的文字，还需要3~4个字节表示。

ANSI存储格式

如图所示，在GBK编码表当中，查找”中”字在[0xD6,0xD0]的位置存储了2个字节；其中第一个字节”0XD6”是在8位表示1个字节中，128个ASCII码之后剩下的128个代码（这里128个代码是ASCII的扩展，范围在[0x80~0xFF]），0XD6在汉码区的范围内。第二个字节的位置0XD0，可以根据第一个字节的汉码区的代码，查找相应的汉字。

该图来自于一个查询GBK格式汉字的网站。想要加深理解的小伙伴可以专找其他文字进行对照一下。

根据网上所讲的位元组问题，由于某些文章仅仅用文字描述，可能导致一些小伙伴也难以理解，那么下面楼主制作了一张图，以便助于大家理解。

由于8位表示一个字节，共有256个代码，那么ASCII码是由最初128个代码组成的，而较高的128个代码是ASCII码的扩展，某些文章所讲的首位元组其实就是ASCII码的扩展，而跟随位元组就是第二个字节开始的代码。所以1个象形文字=首位元组+跟随位元组。

注意：ANSI是一种编码格式，并不是ASCII码的扩展。比如说”2B栋”，其中”2、B”，在ANSI编码当中会以ASCII码形式进行表示并存储，只占用1个字节；而”栋”是ASCII码的扩展+跟随位元组所组成的1个字符。

ANSI优点

ANSI解决了ASCII码扩展的问题，使其他国家可以在各自的操作系统环境里拥有自己的一套字符集。

ANSI缺点

局限性：不同国家和地区制订了不同的标准，正是如此，不同ANSI编码之间是互不兼容的。当信息在国际间交流时，无法将两种或者两种语言以上的文字，存储在同一段ANSI编码的文本中。也就是说，ANSI只能存储ASCII码和ASCII扩展的其他国家指定的某种语言，并不能把两个或者两个以上的国家或地区的语言融合在一起。比如ASCII码的扩展要么是简体中文，要么是繁体汉字，两者不可兼容在一起，不可共享同一段ANSI编码。

所以，对于ASCII码的扩展，针对某些国家使用字符集时需要相应的操作系统环境。比如在简体中文windows操作系统中，ANSI编码代表GBK编码；而在日文windows操作系统中，ANSI编码代表Shift_JIS编码。这些都可称为本地编码。

DBCS

DBCS(double byte character set,双字节字符集)

为了融合其他国家语言（中文、日文、韩文）而同时保持与ASCII有着某种程度的兼容性，于是就出现了双字节字符集。双字节字符集前面128个代码就是ASCII码。前128个代码占有一个字节，而对于一个复杂的象形文字需要这128个代码的同时还要跟随有第二个字节，与ANSI的规则一样。这两个字节分为前导字节和尾随字节，代表一个单独的字符。虽然中文汉字、日文和韩文共享许多相同的象形文字，但毕竟这些语言是不同的。于是就有了四个不同的双位元组字元集：内码表932(日文)、949(韩语)、936(简体中文)、950（繁体汉字）。DBCS只有在为这些国家制作的windows版本才被支持。

DBCS存储格式

在DBCS存储格式图中，由于象形文字“栋”字占用2个字节，属于一个2个字节存储的字符集；其前面“2”、“B”各占用1个字节，是另一个1个字节存储的字符集。使用DBCS编码格式来存储“2B栋”，若要指针寻找“栋”字时，马上用指针指向图中的“1011 0000”时是无法判断该字节是一个1字节字符集，还是2字节字符集。这个需要回到字符串的首处（即“2”）开始进行解析（解析是指“0011 001”转换成“2”），该指针随着编码解析直到“栋”字的位置时，才会知道“1011 0000”是何物。

DBCS的优点

解决了ANSI编码的缺点，对各个国家的语言之间划分了内码区域，可以实现各个语言的信息交流。

DBCS的缺点

有些字符(特别是ASCII码)是由一个字节组成的，便会产生奇怪的编程问题。例如，一个字符串长度不能因为字节数量而决定。字符串的长度需要解析之后方能判断，每个字节都要被检查是不是双字节的前导字节。如果你有一个指针指向一个DBCS字符串的中间，那前一个字符的地址是什么呢？常规做法是回到字符串的开始，一直解析到指针的位置。那么这样做便会比较麻烦。

由于1个字符串中的每个字符都由1个或2个字节组成，所以某些字符有1个字节宽，而有的字符有2个字节宽。如果是一个汉字，我们无法用指针在解析之前去判断此字符是占用1个字节还是2个字节。

Unicode

Unicode在百度百科上解释为统一码、万国码、单一码，顾名思义就是Unicode可以容纳世界上所有文字和符号的字符编码方案，即它能解决各国不同的语言以及进行文本转换、处理字符要求的问题。

Unicode只有一个字符集，那么何为说是“只有一个字符集”呢？楼主在之前介绍的DBCS是双字节字符集，可以说是2个字符集，即如果是字母数字用ASCII码表示，就占用了一个字节，为一个字符集。而对于象形文字是ASCII码扩展+尾随字节，占用了两个字节，为另一个字符集，总共2个字符集。Unicode无论是纯数字字符还是象形文字都占用2个字节，只为一个字符集。其中，中、日、韩的三种文字占用了Unicode中0x3000到0x9FFF的部分。

在DBCS码中，一个象形文字是利用前导字节+尾随字节组成一个字符的，占用2个字节。但由于这并不是按编码顺序的固定长度来表示一种语言的字符的，处理DBCS字符串就会很杂乱，比如在前面提到的指针指向的位置问题，需要回到字符串de开始处解析之后，指针才能确定某字符的位置，比较麻烦。于是为了解决这个问题，便出现了Unicode码，处理Unicode码是有秩序长度固定的。何为“有秩序长度固定”呢？当你了解上文的内容便会知道，Unicode这一特点就是指无论某字符是哪种类型的，都必须占用2个字节，字符位置有序长度固定。

Unicode其实就是使用UTF-16编码格式的。UTF-16全称就是Unicode Transformation Format(Unicode转换格式)

Unicode的存储格式

Unicode缺点

Unicode不管是ASCII字符还是ASCII的扩展符，都占用两个字节，这导致对于只使用ASCII码就会造成浪费内存空间。

UTF-8编码

UTF-8（8-bit Unicode Transformation Format，8位Unicode转换格式）是一种针对Unicode的可变长度字符编码，又称万国码。

特点:UTF-8将一些字符编码为1个字节，一些字符编码为2个字节，另一些字符编码为3个节，还有一些是4个字节。值在0x0080以下的字符为1个字节，即ASCII码，这对美国的语言合适。0x0080到0x07FF之间的字符为2个字节，这对欧洲和中东地区的语言合适。0x0800以上的字符为3个字节，这对东亚地区的语言合适。代理对为4个字节。（摘自于Windows核心编程）

缺点：

如果值在0x080以上进行字符编码不如UTF-16高效。

UTF-32编码

（由于时间问题，我对于字符编码尚未过于深入，此文以后再更新。。。发表于2019-7月27日）

【从零开始学习计算机科学】计算机体系结构（一）计算机体系结构、指令、指令集（ISA）与量化评估贫苦游商学习服务器网络计算机体系结构 ISA 指令集量化评估
【从零开始学习计算机科学】计算机体系结构（一）计算机体系结构、指令、指令集（ISA）与量化评估概论计算机体系结构简介计算机的分类并行体系结构指令集体系结构（ISA）分类存储器寻址寻址模式操作数大小指令ISA的编码程序的优化计算机体系结构量化评估存储器体系结构概论计算机体系结构与计算机组成原理之间的联系非常紧密，其研究范畴基本一致，计算机体系结构与计算机组成原理两者是相辅相成的。但是，计算机体系结构
Java复习路线 Code good g 面试准备 java mysql 数据库
Java复习1、Java基础2、Java多线程3、Javaweb的复习4、MySql复习数据库常用的代码：思维导图：5、计算机组成原理6、网络编程7、Java注解和反射8、计算机网络9、html/css/js10、ssm11、spring12、springmvc13、springboot14、vue15、springcloud16、jvm17、Juc18、mybatis-plus学习19、git2
2023计算机组成原理考研知识点：哈佛结构计算机考研考研资料计算机网络哈佛结构数据结构
2023年计算机考研初试科目一般分四门，基本都考政治、英语一、数学一和计算机基础(计算机综合)，报考院校不同专业课考试内容一般不同，建议考生下正式备考2023年研考时先确认报考院校计算机研招科目内容，避免无效备考。计算机组成原理：哈佛结构将指令和数据放在两个独立的存储器，允许在一个机器周期内同时获得指令和操作数，提高了执行速度。2023年计算机组成原理复习题示例(来源于网络，如有侵权，请联系删除)
河南大学计算机组成原理实验报告1 凡巾计算机组成原理 teambition
Ⅰ、单片机键盘操作方式实验注：在进行单片机键盘控制实验时，必须把开关K4置于“OFF”状态，否则系统处于自锁状态，无法进行实验。1、实验连线（键盘实验）：实验连线如图1-1所示。（连线时应按如下方法：对于横排座，应使排线插头上的箭头面向自己插在横排座上；对于竖排座，应使排线插头上的箭头面向左边插在竖排座上。注意：F4只用一个排线插头孔）图1-1实验一键盘实验连线图2、实验过程：注意：操作过程中，可
计算机组成原理（知识点+易错点，超详细）|第四章指令系统 sailing_c 计算机组成原理计算机组成原理学习笔记
目录4.1指令系统4.1.1指令集体系结构4.1.2指令的基本格式4.1.3定长操作码指令格式4.1.4扩展操作码指令格式4.1.5指令的操作类型4.2指令的寻址方式4.2.1指令寻址和数据寻址4.2.2常见的数据寻址方式4.3程序的机器级代码表示4.3.1常用汇编指令介绍4.3.2选择语句的机器级表示4.3.3循环语句的机器级表示4.3.4过程调用的机器级表示4.4CISC和RISC的基本概念4
计算机组成原理知识点精汇（一）计算机基础知识 A.sir啊计算机组成原理计算机组成原理冯诺依曼硬件架构 CPU
一、冯·诺伊曼计算机的特点(1)计算机由运算器、控制器、存储器、输人设备和输出设备五大部件组成。(2)程序和数据存放在同一存储器中，并按地址寻访。(3)指令和数据均采用二进制运算。(4)指令由操作码和地址码组成，操作码用来表示操作的类型，地址码用来表示操作数和操作结果的地址。(5)机器以运算器为核心，输人输出设备与存储器之间的数据传送都要通过运算器。二、机器字长CPU一次操作中能够处理的数据的位数
计算机组成原理与系统结构知识点总结-简答题3【中央处理器+Flynn分类法+指令级并行+线程级并行-多处理机】 Geometry Fu 计算机组成原理与系统结构算法
中央处理器42.流水线中有哪三种冒险？请简述，并至少举出一种解决冒险的方法。结构冒险：需要的资源被占用（硬件资源冲突）。将指令和数据分别存储；设计指令/数据高速缓存。数据冒险：需要等待前面指令完成其读写操作。转发（旁路）；代码重排；阻塞和冒泡。控制冒险：根据前面正在执行的指令决策控制操作。静态分支预测；动态分支预测；分支延迟。Flynn分类法43.请简述Flynn分类法将计算机系统结构分成哪四类。
专业英语程序员爱德华英语专业英语
文章目录一、计算机1.计算机基础(1)计算机组成原理(2)计算机网络(3)数据库(4)编译原理(5)离散数学2.软件开发(1)编程词汇(2)开发术语(3)Linux(4)软件3.就业领域(1)职场(2)芯片(3)自动驾驶(4)嵌入式硬件4.深度学习(1)论文(2)深度学习DL(3)计算机视觉CV(4)自然语言处理NLP(5)推荐系统(6)计算机图形学二、数学三、机械、材料四、医药五、英美计量单位一
计算机组成原理----计算机系统概述王嘉俊925 计算机组成原理计组计算机组成原理
计算机分类按照输入输出信号的形式可以将电子计算机分为：电子模拟计算机和电子数字计算机。电子模拟计算机定义：采用连续的模拟信号（如电压、电流）进行输入和输出，模拟物理量之间的关系。特点：计算过程基于模拟电路，反映连续变化的物理现象。擅长处理微分方程、动态系统仿真。应用：早期用于科学计算（如飞行模拟、天气预报）和工程设计。局限：精度较低，难以编程和扩展。电子数字计算机定义：使用离散的数字信号（通常为二
“计算机组成原理-电子科技大学-学堂在线”———课堂笔记——第一章计算机系统概述日熙！ #学校学习笔记计算机组成原理
第一章计算机系统概述1.1计算机的概念和类型1>计算机的基本概念2>计算机的主要特点3>计算机的常见类型1.2计算机的诞生与发展1.3计算机系统的层次结构1.4计算机的性能评价指标1.1计算机的概念和类型1>计算机的基本概念什么是电子计算机？——————存储程序，执行程序，对数字信息进行各种复杂处理，输出运算结果的智能电子设备一个计算机系统主要包括以下5个逻辑模块：输入设备，存储器，输出设备，运算
23西安电子科技大学西电 833计算机专业基础综合 834 数据结构计算机组成原理考研参考书及学长学姐全程复习经验分享西电研梦考研数据结构经验分享
23西安电子科技大学西电833计算机专业基础综合834数据结构计算机组成原理考研参考书及学长学姐全程复习经验分享我觉得考研本身并不算难，难得在于给自己一个可以一直坚持下去的动力，所以第一个问题是我们要清楚为什么要考研？我并不能直接告诉你考研好还是工作好？但所有考研的人都需要把信息进行收集：1.你希望考的那个专业前景怎么样？2.各个学校的这个专业怎么样，业内是否认可，能给你提供什么资源？3.各个学校
华为出品Python入门教程：从零基础入门到精通，这一篇就够了学Python的AA python 数据科学 python 开发语言
前言本文罗列了了python零基础入门到精通的详细教程，内容均以知识目录的形式展开。01.python由来与发展介绍02.项目开发流程第一章markdown编辑器01.markdown基本语法02.Typora简介与安装03.Windows上gitee+Typora设置图床04.macOS上gitee+Typora设置图床第二章计算机核心基础01.计算机组成原理第三章编程语言01.编程语言介绍02
如何学习ARM嵌入式系统的设计 AAAA% 学习嵌入式硬件单片机
学习ARM嵌入式系统设计是一个系统性的过程，需要理论知识与实践技能相结合。以下是一份详细的学习路径指南，帮助你逐步掌握ARM嵌入式系统的设计：1.基础知识储备了解计算机体系结构：学习计算机组成原理，了解CPU、内存、IO等基本概念。学习C语言编程：C语言是嵌入式系统开发的主流语言，需要熟练掌握。理解操作系统原理：虽然嵌入式系统可能不总是运行完整的操作系统，但了解操作系统的基本概念对于理解系统设计至
计算机组成原理——总线系统汐颜花零知识证明
总线大致分为三类：CPU内部连接各寄存器及运算部件之间的总线，称为内部总线。CPU同计算机系统的其他高速功能部件，如储存器、通道等互相连接的总线，称为系统总线。中、低速I/O设备之间互相连接的总线，称为I/O总线。总线的特性物理特性：总线的物理特性是指总线的物理连接方式，包括总线的根数，总线的插头、插座的形状，引脚线的排列方式等。功能特性：功能特性描述总线中每一根线的功能。如地址总线的宽度指明了总
【计算机组成原理】1_绪论 BroccoliKing 计组网络硬件架构 fpga开发 arm开发 iot mcu
chap1绪论1.国产芯片现状MIPS阵营：龙芯X86阵营（常见于桌面和服务器）：兆芯（VIA），海光（AMD）ARM阵营（常见于移动嵌入式、手机平板等）：飞腾，海思，展讯，松果RISC-V阵营：阿里平头哥玄铁9102.冯·诺伊曼结构计算机2.1组成硬件系统：运行程序的基本组成部分运算器控制器：控制信号的产生方式包括微程序和硬布线存储器输入输出设备软件系统：系统软件和应用软件2.2层次结构3.指令
2020年上半年中级软件设计师上午试题的知识点（附试卷及答案） xiaohiiii 软件设计师数据库算法数据结构 uml 设计模式
以下是2020年上半年中级软件设计师上午试题的知识点分类整理，详细解释涉及的定义和知识点，供背诵记忆。1.计算机组成原理CPU执行算术运算或逻辑运算时，常将源操作数和结果暂存在（）中。累加器（AC）:用于暂存算术逻辑单元（ALU）的运算结果。程序计数器（PC）:存放下一条要执行的指令地址。指令寄存器（IR）:存放当前正在执行的指令。地址寄存器（AR）:保存当前CPU访问的内存地址。判断字长为16位
deepseek:三个月备考高级系统架构师 wujiada001 AI-MODEL 系统架构
一、备考总体规划（2025年2月11日-2025年5月）1.第一阶段：基础夯实（2025年2月11日-2025年3月10日）目标：快速掌握系统架构师考试的核心知识点。重点内容：计算机组成原理、操作系统、数据库原理。软件工程、设计模式、系统架构设计原则。网络通信、分布式系统、云计算、大数据等新兴技术。学习方法：阅读《系统架构设计师教程》或精简版教材，快速过一遍知识点。观看视频课程（如慕课网、腾讯课堂
计算机组成原理 | （一）计算机系统概论+（六）计算机的运算方法杜若南星笔记经验分享算法其他人工智能开发语言开源
宝子们好呀，从今天开始我准备更新自己的学习笔记了，教我计算机组成原理的老师是SDUCS的zrh老师，z老师真的非常认真负责，教的内容也很详细丰富，询问老师问题老师都事无巨细地为我们解答，感谢z老师的教导，接下来我就放上我的手写笔记，预计包括作业和知识点内容，供大家学习参考，适合大家预习和复习参考！（为了保证理解的连贯性，z老师讲课的顺序和课本章节可能不太一致，但是每章开头都有标记，大家不用担心不知
计算机组成原理——指令系统（六）不能只会打代码计算机组成原理计算机组成原理
在时间的长河中，我们都是追梦人，脚下的每一步都在刻画未来的模样。无论世界如何变幻，心中的那团火焰都不应熄灭。它是你突破黑暗、迎接黎明的力量源泉。每一个不曾起舞的日子，都是对生命的辜负；每一次跌倒后的站起，都是向着天空最有力的宣言。不要让外界的声音掩盖了你内心的真实渴望，也不要因为一时的迷茫而放弃了前行的勇气。在这趟独一无二的人生旅途中，你的价值不由他人定义，而是由你自己通过不懈的努力和追求来铸就。
（王道考研计算机网络）第四章网络层-第三节1：IP数据报格式及分片快乐江湖 tcp/ip 网络网络协议
指导获取：密码7281专栏目录首页：【专栏必读】王道考研408计算机网络+湖科大教书匠计算机网络+网络编程万字笔记、题目题型总结、注意事项、目录导航和思维导图王道考研408计算机组成原理万字笔记王道考研408数据结构+计算机算法设计与分析万字笔记王道考研408操作系统+Linux系统编程万字笔记文章目录一：IP数据报格式二：IP数据报分片一࿱
计算机组成原理面试题饭小粒计算机组成原理计算机组成原理
计算机组成原理是计算机科学的基础课程之一，涉及计算机系统的基本结构和工作原理。以下是一些可能出现在面试中的计算机组成原理相关题目：1.**什么是冯·诺依曼体系结构？**-冯·诺依曼体系结构是一种计算机组织架构，它将程序指令存储和数据存储在同一个可读写的内存空间内，由中央处理单元（CPU）执行指令。2.**解释指令周期和时钟周期。**-指令周期是CPU完成一条指令所需的全部时间。时钟周期是CPU内部
【计算机组成原理】带符号整数的表示——补码与反码蒙奇D索大保姆级教学计算机组成原理(CO)408 改行学it 笔记经验分享考研
反码与补码导读一、补码1.1原码转补码1.2补码转原码二、反码三、原码、补码、反码的相互转换结语导读大家好，很高兴又和大家见面啦！！！在上一篇内容中我们介绍了有符号整数的原码形式，有符号整数的原码表示法中，我们需要了解以下内容：机器数最高位为符号位——0为正，1为负；除最高位以外的二进制位为数值位原码形式的取值范围：−(2n−1−1)～2n−1−1-(2^{n-1}-1)～2^{n-1}-1−(2
10道计算机组成原理面试八股文（答案、分析和深入提问）整理 ocean2103 面试题面试 java spring boot
1.解释缓存（Cache）的工作原理及其类型。回答缓存（Cache）是计算机系统中用于提高数据访问速度的一种临时存储器。它位于中央处理器（CPU）与主存（RAM）之间，旨在减少CPU对主存的访问延迟，从而加速程序运行。缓存的工作原理局部性原理：时间局部性：如果某个数据被访问，那么它在近期内很可能会再次被访问。空间局部性：如果某个数据被访问，那么它附近的数据也很可能在不久的将来被访问。存储结构：缓存
计算机组成原理的学习笔记（1） Rinai_R 计算机组成原理学习笔记
学习笔记前言本文主要是对于b站尚硅谷的计算机组成原理的学习笔记，仅用于学习交流。一、hello.c如何运行起来？1.预处理阶段在编译C程序时，预处理器首先处理代码。预处理器会：插入头文件：例如，当在代码中使用#include时，预处理器会将stdio.h中的内容插入到源代码中。这样，编译器在处理时就得到了所有必要的函数声明和宏定义。宏替换和条件编译：将所有的宏定义替换为实际值，并处理任何条件编译的
计算机组成原理(计算机系统3)--实验七：新增指令实验起床悠悠计算机系统单片机嵌入式硬件
一、实验目标了解RISC-Vmini处理器架构，在其基础之上新增一个指令，完成设计并观察指令执⾏。二、实验内容1)修改数据通路，新增指令combrs1,rs2,rd采用R型指令格式，实现将rs1高16位和rs2低16位拼接成32位整数，并且保存到rd寄存器。2)在处理器上执行该指令，观察仿真波形，验证功能是否正确。3）自行设计其他功能指令，并验证设计是否正确三、实验环境硬件：桌面PC软件：Chis
计算机组成原理实验指令分析,计算机组成原理实验报告.doc 奶油小馒头计算机组成原理实验指令分析
文档介绍：评语:课中检查完成的题号及题数：课后完成的题号与题数：成绩:自评成绩:XX实验报告实验名称：CPU与简单模型机设计实验日期：2016.XX.XX班级：1001XXXX学号：2014XXXX：XX同组同学信息班级：1001XXXX学号：2014XXXXX：XXXX一、实验目的：1.掌握一个简单CPU的组成原理。2.在掌握部件单元电路的基础上，进一步将其构造一台基本模型计算机3.为其定义五条
计算机组成原理(计算机系统3)--实验八：处理器结构拓展实验起床悠悠计算机系统 java 数据库前端嵌入式硬件
一、实验目标：了解MIPS的五级流水线，和在运行过程中的所产生的各种不同的流水线冒险；通过指令顺序调整，或旁路与预测技术来提高流水线效率；更加了解流水线细节和其指令的改善方法；更加深入了解动态分支预测和BTB更加熟悉MIPS指令的使用。二、实验内容处理器结构实验一的扩展：用perf记录x86中的数据相关于指令序列调整前后的事件统计（stall、CPUcycles等）处理器结构实验二的扩展：在x86
计算机组成原理重点理解5-22 yaoyaoyao可爱呀
1.奇偶校验位奇偶校验位有两种类型：偶校验位与奇校验位。如果一组给定数据位中1的个数是奇数，那么偶校验位就置为1，从而使得总的1的个数是偶数。如果给定一组数据位中1的个数是偶数，那么奇校验位就置为1，使得总的1的个数是奇数例：100101011000奇校验：奇数个1，则添02.计算机原码，反码，补码在计算机中，数据的表示方式可以有原码、补码、反码和移码。(1)原码：将最高位用做符号位(0表示正数，
计算机组成原理重点理解之第3章5-24 yaoyaoyao可爱呀
1.寻址范围：例：某计算机字长16位，其存储器容量为64KB，按字编址时，其寻址范围是因为该计算机的字长是16位，每个存储单元1个字节，1字节等于8位，所以相当于2个字节。又因为他的存储器容量是64KB，则说明有64K个字节，64/2=322数据线和地址线一个16K*32位的SRAM存储芯片，其数据线和地址线之和为：芯片容量为16k×32位，16k=2的14次方，所以地址线14根，数据线32根，和
计算机组成原理(计算机系统3)--实验三：取指和指令译码设计起床悠悠计算机系统数据库
一、实验目标：设计完成一个连续取指令并进行指令译码的电路，从而掌握设计简单数据通路的基本方法。二、实验内容本实验完成：1）首先完成一个译码器；2）接着实现一个寄存器文件；3）最后添加指令存储器和地址部件等将这些部件组合成一个数据通路原型。三、实验环境硬件：桌面PC软件：LinuxChisel开发环境四、实验步骤及说明1）设计译码电路：输入位32bit的一个机器字，按照课本MIPS指令格式，完成ad
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1