Adai(阿呆)

字符编码笔记汇总：ASCII、GBXXXX、Unicode、UTF-8等

版权声明：本文系个人经多处资料学习、吸收、整理而得，如需转载，请注明出处：作者名+链接。

内容说明：本系列内容大致包括基本概念(字符集、字符编码)、常用字符集和字符编码(ASCII、GB系列、UniCode等)、乱码原因及解决方案、Python内字符编码的相关处理。（含大小端说明）

关键词：字符编码，ASCII、Unicode、utf-8、乱码与解决办法、Python

1. 基本概念

首先，说下编码和解码：计算机中储存的信息都是用二进制数表示的；而我们在屏幕上看到的英文、汉字等字符是二进制数转换之后的结果。通俗的说，按照何种规则将字符存储在计算机中，如’a’用什么表示，称为”编码”；反之，将存储在计算机中的二进制数解析显示出来，称为”解码”。在解码过程中，若使用了同编码方式不同的编码规则饿，则可能导致解析错误或者乱码。

其次理解字符集和字符编码：

字符集：是一个系统支持的所有抽象字符的集合。字符是各种文字和符号的总称，包括各国家文字、标点符号、图形符号、数字等。一般来说，不同的字符集有不同的对应字符编码规则，因此也常会看到有人说：字符集就规定了某个文字对应的二进制数字存放方式（编码）和某串二进制数值代表了哪个文字（解码）的转换关系。
字符编码：是一套法则，在符号集合（人们表达信息的方式）与数字系统（计算机存储和处理信息的方式）之间建立对应关系，也就是说字符编码就是将字符转换为计算机可以接受用0、1表达的数。

2. 常用字符集和字符编码

常见字符集有：ASCII字符集、GB2312字符集、BIG5字符集、Unicode字符集等，每种字符集有对应的一种或多种编码方式。

ASCII字符集&ASCII编码：
ASCII（American Standard Code for Information Interchange，美国信息交换标准代码）是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语，而其扩展版本EASCII则可以勉强显示其他西欧语言。它是现今最通用的单字节编码系统（但是有被Unicode追上的迹象），并等同于国际标准ISO/IEC 646。
ASCII字符集：主要包括控制字符（回车键、退格、换行键等）、可显示字符（英文大小写字符、阿拉伯数字和西文符号），共128个字符。
ASCII编码：将ASCII字符集转换为计算机可以接受的数字系统的数的规则。使用7位（bits）表示一个字符，共128字符；但是7位编码的字符集只能支持128个字符，为了表示更多的欧洲常用字符对ASCII进行了扩展，ASCII扩展字符集使用8位（bits）表示一个字符，共256字符。编码表可参见[1].
缺点：只能显示26个基本拉丁字母、阿拉伯数目字和英式标点符号，因此只能用于显示现代美国英语（而且在处理英语当中的外来词如naïve、café、élite等等时，所有重音符号都不得不去掉，即使这样做会违反拼写规则）。而EASCII虽然解决了部份西欧语言的显示问题，但对更多其他语言依然无能为力。因此现在的苹果电脑已经抛弃ASCII而转用Unicode。
简体中文字符集&gbXXXX编码
由于ASCII码只支持英文，为了显示中文，必须设计一套编码规则用于将汉字转换为计算机可以接受的数字系统的数。
为此，天朝专家把那些127号之后的奇异符号们（即EASCII）取消掉，规定：一个小于127的字符的意义与原来相同，但两个大于127的字符连在一起时，就表示一个汉字，前面的一个字节（他称之为高字节）从0xA1用到 0xF7，后面一个字节（低字节）从0xA1到0xFE，这样我们就可以组合出大约7000多个简体汉字了。在这些编码里，还把数学符号、罗马希腊的字母、日文的假名们都编进去了，连在ASCII里本来就有的数字、标点、字母都统统重新编了两个字节长的编码，这就是常说的”全角”字符，而原来在127号以下的那些就叫”半角”字符了。
上述编码规则就是GB2312，其对应的是中国国家标准简体中文字符集，1981年5月1日实施。中国大陆几乎所有的中文系统和国际化的软件都支持GB2312。GB2312的出现，基本满足了汉字的计算机处理需要，它所收录的汉字已经覆盖中国大陆99.75%的使用频率。但对于人名、古汉语等方面出现的罕用字，GB2312不能处理，这导致了后来gbk编码（可对应到gb18030字符集《信息技术中文编码字符集》）的出现。
gb18030特点：
- 采用多字节编码，每个字可以由1个、2个或4个字节组成。
- 编码空间庞大，最多可定义161万字符
- 支持中国国内少数民族的文字，无需动用造字区
- 收录范围包含繁体汉子以及日韩汉子
繁体中文字符集&Big5编码
Big5是繁体中文中最常用的电脑汉子字符集标准，共收录13,060个汉字，属中文内码。Big5码是一套双字节字符集，使用了双八码存储方法，以两个字节来安放一个字。第一个字节称为”高位字节”，第二个字节称为”低位字节”。”高位字节”使用了0x81-0xFE，”低位字节”使用了0x40-0x7E，及0xA1-0xFE。
Unicode字符集&utf-X编码
像天朝一样，为适合当地语言和字符，需要设计和实现类似GB232/GBK/GB18030/BIG5的编码方案。但这样各搞一套编码规则，在本地使用没有问题，一旦出现在网络中，由于不兼容，互相访问就出现了乱码现象。
为了解决这个问题，Unicode（也称之为万国码、统一码）诞生了，为表达任意语言的任意字符而设计，基于通用字符集（Universal Character Set）的标准发展而来，也可以理解为是一种将世界上所有符号都纳入其中的字符集，每一个符号都给予一个独一无二的编码。它使用4字节的数字来表达每个字母、符号，或者表意文字(ideograph)。每个数字代表唯一的至少在某种语言中使用的符号。需要理解的是，Unicode是字符集，UTF-32/ UTF-16/ UTF-8是对应Unicode的三种字符编码方案，也可以理解成Unicode的实现方式。
- UTF-32：对每个字符都是用4字节，就空间而言，是非常没有效率的。这种方法有其优点，最重要的一点就是可以在常数时间内定位字符串里的第N个字符，因为第N个字符从第4×Nth个字节开始。虽然每一个码位使用固定长定的字节看似方便，它并不如其它Unicode编码使用得广泛。
- UTF-16：考虑到一般大多数人不会用到超过前65535个以外的字符，UTF-16将0–65535范围内的字符编码成2个字节，如果真的需要表达那些很少使用的”星芒层(astral plane)”内超过这65535范围的Unicode字符，则需要使用一些诡异的技巧来实现。UTF-16编码最明显的优点是它在空间效率上比UTF-32高两倍，因为每个字符只需要2个字节来存储（除去65535范围以外的），而不是UTF-32中的4个字节。并且，如果我们假设某个字符串不包含任何星芒层中的字符，那么我们依然可以在常数时间内找到其中的第N个字符，直到它不成立为止这总是一个不错的推断。
- UTF-8：针对Unicode的可变长度字符编码（定长码），也是一种前缀码。它可以用来表示Unicode标准中的任何字符，且其编码中的第一个字节仍与ASCII兼容，这使得原来处理ASCII字符的软件无须或只须做少部份修改，即可继续使用。因此，它逐渐成为电子邮件、网页及其他存储或传送文字的应用中，优先采用的编码。互联网工程工作小组（IETF）要求所有互联网协议都必须支持UTF-8编码。
  UTF-8使用一至四个字节为每个字符编码，编码规则简单来说就是两条：
  1）对于单字节的符号，字节的第一位设为0，后面7位为这个符号的unicode码。因此对于英语字母，UTF-8编码和ASCII码是相同的。
  2）对于n字节的符号（n>1），第一个字节的前n位都设为1，第n+1位设为0，后面字节的前两位一律设为10。剩下的没有提及的二进制位，全部为这个符号的unicode码。
  具体编码范围和对应编码如下所示：
  0000 0000-0000 007F | 0xxxxxxx
  0000 0080-0000 07FF | 110xxxxx 10xxxxxx
  0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx
  0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
  特点：
  1）在处理经常会用到的ASCII字符方面非常有效，UTF-8是ASCII的一个超集。因为一个纯ASCII字符串也是一个合法的UTF-8字符串，所以现存的ASCII文本不需要转换。在处理扩展的拉丁字符集方面也不比UTF-16差。对于中文字符来说，比UTF-32要好。
  2）UTF-8不再存在字节顺序的问题，一份以utf-8编码的文档在不同的计算机之间是一样的比特流。UTF-8字符串可以由一个简单的算法可靠地识别出来。就是，一个字符串在任何其它编码中表现为合法的UTF-8的可能性很低，并随字符串长度增长而减小。
  3）UTF-8和UTF-16都是可扩展标记语言文档的标准编码。所有其它编码都必须通过显式或文本声明来指定。
  4）任何面向字节的字符串搜索算法都可以用于UTF-8的数据（只要输入仅由完整的UTF-8字符组成）。但是，对于包含字符记数的正则表达式或其它结构必须小心。
  5）缺点：utf-8在Unicode字符串中不可能由码点数量决定显示它所需要的长度，或者显示字符串之后在文本缓冲区中光标应该放置的位置，组合字符、变宽字体、不可打印字符和从右至左的文字都是其归因。此外，因为每个字符使用不同数量的字节编码，所以寻找串中第N个字符是一个O(N)复杂度的操作 — 即，串越长，则需要更多的时间来定位特定的字符。同时，还需要位变换来把字符编码成字节，把字节解码成字符。

另外，UTF-32和UTF-16还有一个不明显的缺点跟大端小端相关：不同的计算机系统会以不同的顺序保存字节，这取决于该系统使用的是大端(big-endian)还是小端(little-endian)。为了解决这个问题，多字节的Unicode编码方式定义了一个字节顺序标记（BOM，Byte Order Mark），它是一个特殊的非打印字符，你可以把它包含在文档的开头来指示你所使用的字节顺序。对于UTF-16，大端对应的字节顺序标记是U+FEFF，小端序对应的是FFFE。

补充说明：大端小端

小端：较高的有效字节存放在较高的的存储器地址，较低的有效字节存放在较低的存储器地址。

大端：较高的有效字节存放在较低的存储器地址，较低的有效字节存放在较高的存储器地址。

简单理解就是，大端存储类似人的正常思维，小端存储机器处理更方便。比如32bit整型0x12345678，大端存储为（低地址）12 34 56 78（高地址），小端存储为78 56 34 12。

ANSI编码
为使计算机支持更多语言，通常使用0x800~xFF范围的2个字节来表示1个字符。不同的国家和地区制定了不同的标准，由此产生了GB2312,BIG5,JIS等各自的编码标准。这些使用2个字节来代表一个字符的各种汉字延伸编码方式，称为 ANSI 编码。在简体中文系统下，ANSI 编码代表 GB2312 编码，在繁体中文操作系统下，ANSI 编码代表 Big5 编码。在非 Unicode 环境下，由于不同国家和地区采用的字符集不一致，很可能出现无法正常显示所有字符的情况。
通常Windows环境下，txt文件默认为ANSI编码，即Windows code pages，它将根据当前locale选定具体的编码，比如若为纯英文字符，则对应为ASCII码，若是简体中文，则默认对应为gb2312，而繁体中文默认对应Big5。
但未来的趋势应当是以Unicode字符集来保存字符，而且用户采用Unicode下的编码格式来保存的话，处理起来也会有速度上的优势。

3. 乱码原因和解决办法

对于是否乱码的判断关键在于：判断当前编码解码方式是否一致以及该字符集是否兼容该文字（比如中文）。也就是说，乱码的出现是因为编码和解码时用了不同或者不兼容的字符集。比如说一个用UTF-8编码后的字符，用GBK去解码。由于两个字符集的字库表不一样，同一个汉字在两个字符表的位置也不同，最终就会出现乱码。再比如说ACSII字符集不支持中文编码解码，输出中文时会出现乱码。

其他说明：加入文本中所有字符都在ASCII范围内，即英文字符等，那记事本保存的ANSI编码和ASCII或UTF-8是一样的。

乱码常见场景及解决办法：
比如
1）将需要utf8mb4编码的Emoji表情（占四字节）存入MySQL数据库（一般默认为utf-8(3字节)）中会报错；
解决办法：将MySQL字符集切换至utf8mb4，或者存入前将Emoji字符串解码为一段特殊的文字编码再存入，而从数据库取出时将这段特殊文字编码转换为Emoji显示，一般常通过解码为Unicode作为中转转换。
2）Windows桌面系统下，文本文件打开后乱码
解决办法：将文件编码方式修改成合适的编码方式，比如可通过Notepad++或者windows自带记事本——另存为时，选择新的编码方式：ANSI/Unicode（utf-16，直接用两个字节存入字符，小端格式）/Unicode big endian（大端格式）/UTF-8（这里有人提到这是为带BOM的UTF-8，但如果是为了跨平台，最有效的办法就是使用utf-8名单是否使用BOM则未必需要很纠结，因为现在的编辑器大多可以很好地处理BOM，比如VIM，像Python脚本也是可以很好地处理BOM），然后再保存即可。
3）下一节中提到的Python内字符编码的相关处理
总的来说，解决办法就是根据文件或者字符的编码方式/字符集设定相同的/兼容的字符编码方式来进行解码。那如何判别该文件是什么编码方式呢？Windows记事本的做法是在TXT文件的最前面保存一个标签，如果记事本打开一个TXT，发现这个标签，就说明是unicode。标签叫BOM，如果是0xFF 0xFE，是UTF16LE，如果是0xFE 0xFF则UTF16BE，如果是0xEF 0xBB 0xBF，则是UTF-8。如果没有这三个东西，那么就是ANSI，使用操作系统的默认语言编码来解释。

4. Python内字符编码的相关处理

获取和修改系统默认字符编码的方法：

import sys
print sys.getdefaultencoding()   #输出结果为ascii #或者
reload(sys)
sys.setdefaultenconding("utf-8")  #修改系统默认编码为utf-8
print sys.getdefaultencoding()   #如果没有修改过默认编码，输出结果为utf-8

自行设定文件编码方式，比如设编码方式为utf-8，在文件首行敲上如下代码，若是要设为其他编码方式，则把utf-8修改成想设的编码方式（如ascii、gbk）即可。一般首行我们都会声明该文件编码方式为utf-8，这里注意系统默认编码不会随之改变。

 # -*- coding: utf-8 -*- 
 #或者
 #coding=utf-8    #若是Windows下自带BOM且想去掉BOM字符，可修改encoding为utf-8_sig / utf_8_sig

文件内声明的字符串的编码方式跟之前保留的文件编码方法相关，若保留为ascii码，则字符串为ascii编码，若为utf-8，则字符串为utf-8编码，这里往往在中文字符前加上u用来声明该字符串为utf-8编码；
确认某个字符串是哪种编码类型:

>>>import chardet #需要自行安装chardet编码检测包 pip install detect (Anaconda需要在其对应的Scripts目录下打开命令行) 
>>>str = "string"
>>>chardet.detect(str2)
{'confidence': 1.0, 'language': '', 'encoding': 'ascii'}

设定某字符串的编码方式，可通过decode（解码）、encode（编码）实现：

#英文
print "string".decode("utf-8")
print "string".encode("gbk")
print "string".decode("utf-8").encode("gbk")
#中文
print "中文"   #是否乱码，根据当前保留的字符编码环境而异
print u"中文"  #文件编码方式设定为utf-8时，加u确保不会乱码
print "中文".decode("utf-8")  #等同于unicode('中文'，’utf-8‘),获取到unicode对象
#print "中文".encode("gbk") #否则，会报错
print "中文".decode("utf-8").encode("gbk") #各字符编码方式间的转换需要通过unicode对象作为中转，即先decode解码为unicode再重新编码，因原字符串是utf-8编码，此处强行转为gbk编码解释，会得到乱码输出
#编码方式理解
s="水壶"  #对应utf-8编码为\xe6\xb0\xb4\xe5\xa3\xb6,可在命令行窗口输入s查看,只有在utf-8下才有实际意义
>>>s
'\xe6\xb0\xb4\xe5\xa3\xb6'
print unicode(s,"big5") #瘞游ㄥ
print unicode(s,"gbk") #姘村６
print unicode(s,"gb2312") #姘村６
print unicode(s,"utf-8") #水壶

对于是否乱码的判断关键在于：判断当前编码解码方式是否一致以及该字符集是否兼容该文字（比如中文）。比如IDE和控制台报错，原因是print时，编码和IDE自身编码不一致导致。输出时将编码转换成一致的就可以正常输出。

理解Python2.X环境中str和unicode：

str是字节串，由unicode经过编码(encode)后的字节组成的；声明方式：s =’中文’ 或者 s = u’中文’.encode(‘utf-8’)
unicode才是真正意义上的字符串，由字符组成；声明方式：s = unicode(‘中文’,’utf-8’) 或者 s=’中文’.decode(‘utf-8’)或者s=u’中文’，可通过type(s)查看其类型

搞明白要处理的是str还是unicode, 使用对的处理方法(str.decode / unicode.encode);一般建议输入处全部转为unicode，而后处理，输出时再转成目标编码，即终极原则：decode early, unicode everywhere, encode late。

其他：Python3中字符串编码
3.x中将字符串和字节序列做了区别，字符串str是字符串标准形式与2.x中unicode类似，bytes类似2.x中的str有各种编码区别。bytes通过解码转化成str，str通过编码转化成bytes。
Python 3的源码.py文件的默认编码方式为UTF-8，所以，对于Python 3.x来说，编码问题已经不再是个大的问题，基本上很少遇到编码异常，但不再支持u中文的语法格式。而Python2中.py文件默认编码方式为ASCII，一般通过在首行放置编码声明(常用utf-8)。

参考文献：

字符集和字符编码(Charset & Encoding)
字符编码笔记：ASCII，Unicode和UTF-8——阮一峰
Windows 记事本的 ANSI、Unicode、UTF-8 这三种编码模式有什么区别？
PYTHON-进阶-编码处理小结
python字符串编码及乱码解决方案

尾言：文中若有笔误或不正确的地方，烦请包涵并指出；若有其他想法或意见也欢迎与我（[email protected]）交流，谢谢。

CTF——web方向学习攻略一则孤庸 CTF 网络安全 CTF
1计算机基础操作系统：熟悉Linux命令，方便使用Kali。网络技术：HCNA、CCNA。编程能力：拔高项，有更好。2web应用HTTP协议：必须掌握web开发框架web安全测试3数据库数据库基本操作SQL语句数据库优化4刷题
百度秋招测开面经情书学长面试百度笔记
1、自我介绍2、MySQL一、结合简历的项目说一下数据库设计如何优化二、说一下所知道的索引类型三、索引的优缺点四、索引的使用建议3、计算机基础一、TCP和UDP的区别二、TCP的三次握手的流程三、进程和线程的概念和区别四、深拷贝和浅拷贝的区别5、Linux一、文件查看前10行的命令二、文件编辑的命令三、vim和view的区别四、查看端口的命令五、查看进程的命令6、数据结构一、说一下知道的数据结构二
网络安全（黑客）——自学2024 白帽子黑客-宝哥 web安全安全嵌入式硬件网络单片机
一、什么是网络安全网络安全是一种综合性的概念，涵盖了保护计算机系统、网络基础设施和数据免受未经授权的访问、攻击、损害或盗窃的一系列措施和技术。经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。作为一个合格的网络安全工程师，应该做到攻守兼备，毕竟知己知彼，才能百战百胜。二、网络安全怎么入门安全并非孤立存在，而是建立在其计算机基础之上的应用技术。
电脑操作从零到精通：全方位入门资源包马屿人
本文还有配套的精品资源，点击获取简介：电脑快速入门资源下载提供了一系列教程，帮助初学者迅速掌握计算机基础知识和操作技能。教程涵盖了计算机组成部分、操作系统选择、文件管理、网络连接、办公软件应用、安全与维护、进阶技能等关键领域。资源包括详细的《电脑快速入门.PDF》教程和《***说明.txt》，初学者可借此逐步提升电脑操作技能，适应数字世界。1.计算机基础知识和组成部分1.1计算机硬件与软件概述计算
关于计算机程序设计语言正确说法是,计算机基础考试习题.doc 一只鱼的传说
计算机基础考试习题大学计算机基础教程考试模拟题库11.当磁盘设置写保护时，用户___A___磁盘。A.只能读不能写B.只能写不能读C.既能读又能写D.既不能读又不能写2.ENIAC计算机所采用的逻辑器件是___A____。A．电子管B．晶体管C．中小型集成电路D．大规模及超大规模集成电路3.通常人们所说的一个完整的计算机系统应包括____D_____。A.运算器、存储器和控制器B.计算机和它的外围
350页前端校招面试题直击大厂：前端基础、前端核心、计算机基础、项目、Hr面 2401_86400095 前端
**1.HTML2.CSS3.前端基础4.前端核心5.前端进阶6.移动端开发7.计算机基础8.算法与数据结构9.设计模式10.项目11.职业发展12.Hr面**正文HTML1.浏览器页面有哪三层构成，分别是什么，作用是什么?2.HTML5的优点与缺点？3.Doctype作用?严格模式与混杂模式如何区分？它们有何意义?4.HTML5有哪些新特性、移除了哪些元素？5.你做的网页在哪些浏览器测试过,这些
机器学习面试题目分享面试经验分享机器学习算法工程师深度学习经典问题好家伙VCC 面试机器学习面试经验分享 stm32 嵌入式硬件单片机 fpga开发
标题机器学习面经总结的常见面试题目等作业帮实习视觉算法一面凉凉经3.16号投递图像算法实习生，昨天hr打电话约了今早上牛客面试面试官还是很和蔼的，问了很多基础和细节，平时我都没有注意到的，肯定凉了，在这里记录一下，分享给大家由于我本科研究生都是计算机的，因此问了一些计算机基础的东西，但是由于年代久远，我都不记得了机器学习方面知识因为缺少一些动手实践，因此很多细节都不了解感谢面试官让我了解到这么多不
想学java，需要什么基础？吹来人间烟火
不需要什么基础，课程都是针对于零基础的同学，设计这个行业，本身入行门槛比较低，能力重于学历。真正科班出身的更是少数，大部分人都是通过找培训机构系统学习出来的，所以只要自己下定决心去学，就一定能学会的。另外，如果说普通人具备哪些能力可以更好地学习Java，那可以列出来三点。1、简单的英语读写能力；2、一定的数学基础；3、一定的计算机基础操作能力。Java是一门面向对象地编程语言，吸收了C++语言的各
计算机组装win7实训报告,计算机实训报告范文精选5篇喵喵哒哟计算机组装win7实训报告
实训报告是展示自身实训收获成长的重要报告，那么实训报告该如何写呢?小编精选了一些关于实训报告的优秀范例，一起来看看吧。计算机基础实训报告实训时间：xx年12月26日—12月28日实训目的：通过上机操作形式，潜移默化地进行综合操作素质的训练，增强学生综合运用所学知识解决实际问题的能力。实训内容：word文档与excel表格的编辑与操作。短短三天的计算机实训结束了，通过这三天的实训，我学到了很多的知识
计算机基础---缓冲区守住这块热土
写在前面，IO类总结之前，应该注意的几个问题:C++的缓冲区是什么概念？参考文档：51CTO---C++编程对缓冲区的理解C++的打开文件模式有哪些，之间的区别是什么？Part1缓冲区一、什么是缓冲区缓冲区又称为缓存，它是内存空间的一部分。也就是说，在内存空间中预留了一定的存储空间，这些存储空间用来缓冲输入或输出的数据，这部分预留的空间就叫做缓冲区。缓冲区根据其对应的是输入设备还是输出设备，分为输
让理科生沉默，让文科生落泪的题 abcdefghijk0987 java php javascript ViewUI
本文选自果壳上的一篇文章，感觉好有意思，故拿来分享。此文的精华之处在于考你计算机基础知识的同时，顺便考了你其他属文方面的知识，以及各种知识间的相通性。让你用计算机的思想去看待世界，看待万物。不多废话，给出原文地址：http://www.guokr.com/article/31315/一，选择题（皆为单选）：1.以下谁是二进制思想的最早提出者？a，伏羲；b，姬昌；c，莱布尼茨；d，柏拉图。答案：a，
计算机基础复习8.29 我叫啥都行计算机基础知识笔记后端计算机网络 linux
进程，线程，协程的区别进程是操作系统中进行资源分配和调度的基本单位，他拥有自己的独立内存空间和系统资源。每个进程都有独立的堆和栈，不与其他进程共享。进程间通信需要通过特定的机制，如管道，消息队列，信号量等。由于进程拥有独立的内存空间，因此其稳定性和安全性相对较高，但同时上下文切换的开销较大，因为需要保存和恢复整个进程的状态线程是进程内的一个执行单元，也是CPU调度和分派的基本单位。与进程不同，线程
计算机基础知识复习8.22 我叫啥都行计算机基础知识 java 开发语言后端笔记 sql
锁升级机制无锁->偏向锁->轻量级锁->重量级锁线程A进入synchronized开始抢锁，JVM会判断当前是否是偏向锁的状态，如果是就会根据MarkWord中存储的线程ID来判断，当前线程A是否就是持有偏向锁的线程，如果是，则忽略check，线程A直接执行临界区内的代码。如果MarkWord里的线程不是线程A，就会通过自旋尝试获取锁，如果获取到了，就将MarkWord中的线程ID改为自己，如果竞
计算机基础知识复习8.9 我叫啥都行计算机基础知识 java 开发语言后端笔记 jvm
什么是零拷贝是一种内存映射文件的方法，即将一个文件或者其他对象映射到进程的地址空间，实现文件磁盘地址和进程虚拟地址空间中一段虚拟地址的一一对映关系。就是内核缓冲区和应用缓冲区共享，从而减少了从读缓冲区到用户缓冲区的一次CPU拷贝StringStringBuilderStringBuffer使用String是不可变的，StringBuilder与StringBuffer都继承自AbstractStr
计算机基础复习8.28 我叫啥都行计算机基础知识计算机网络笔记后端
HTTP是什么http是超文本传输协议HTTP状态码2XX成功，报文已经收到并被正确处理3XX重定向，资源位置发生变动，需要客户端发送请求4XX客户端错误，请求报文有误，服务端无法处理5XX服务器错误，服务器在处理请求时内部发生了错误HTTP常见字段host字段客户端发送请求时，用来指定服务器的域名content-length字段服务器在返回数据时，会有content-length字段，表明本次回
计算机的有关英语单词大全,与计算机相关的英语词汇汇总喻双计算机的有关英语单词大全
与计算机相关的英语词汇汇总更新时间：2017/2/10:05:00浏览量：636手机版与计算机相关的英语词汇汇总计算机基础知识computern.电脑，电子计算机arithmeticlogicunit算术逻辑部件manipulatevt.操纵，操作keyboardn.键盘informationn.消息，知识printern.打印机hand-holda.使携，手拿的skittern.磁盘calcul
5分钟 Stable Diffusion 本地安装狒狒伯尼 stable diffusion
StableDiffusion是一种强大的文本到图像生成模型，由于其开源特性，用户可以在本地计算机上进行安装和使用。下面是一个精简的5分钟快速指南，帮助您在本地安装StableDiffusion。为了确保顺利操作，您需要具备一定的计算机基础知识，并预先安装Python和Git。安装前的准备确保系统要求：您需要一台安装了NVIDIA显卡的计算机（最好支持CUDA，至少6GB显存）。操作系统：Wind
Linux C/C++面试题汇总乔以亦 C/C++c++面试 linux
LinuxC/C++面试题汇总前言计算机基础程序的内存空间进程和线程相关关键字conststaticvolatileC/C++指针前言最近面试的比较多，看了很多关于面试的内容，有些平时工作用的比较少或者没有主要到的地方，长时间不看就会忘记，如果下次面试还需要再次找这些东西比较麻烦，所以写此篇文章就是为了方便以后面试，也给一些即将面试的人提供一些帮助。以后如果面试有新的值得关注的问题作者会及时更新。
大学计算机学习心得1000字,大学计算机学习心得体会刘瑷大学计算机学习心得1000字
大学计算机学习心得体会大学计算机基础学习心得计算机，即电脑，随着科学技术的发展，不断进行着更新发展。伴随着计算机走入人类生活，它已成为人们日常生活必不可少的一部分，甚至成为当下许多人工作生活依赖的工具，并衍生了一些与计算机有关的职业，如电脑工程师、软件设计师等。人们不再为了科学地研究大规模的数据运算而发展计算机，计算机已经不再只是用于科学计算，而逐渐推广到聊天、冲浪、游戏等。计算机与人类社会的其他
计算机基础（Windows 10+Office 2016）教程 —— 第2章计算机系统的构成墨染青竹梦悠然计算机基础（Windows 10+Office 2016）windows
第2章计算机系统的构成2.1微型计算机硬件系统2.1.1中央处理器2.1.2内存储器2.1.3主板2.1.4硬盘2.1.5键盘和鼠标2.1.6显示卡与显示器2.1.7其他硬件2.2计算机操作系统2.2.1操作系统的含义2.2.2操作系统的基本功能2.2.3操作系统的分类2.2.4微机操作系统的演化过程2.2.5国产操作系统2.1微型计算机硬件系统2.1.1中央处理器中央处理器是由一片或少数几片大规
计算机基础-机器语言、汇编语言、指令和数据一Ⅱ彡计算机组成原理计算机基础知识
机器语言与计算机机器语言是机器指令的集合。机器指令是一台计算机可以正确执行的命令。电子计算机的机器指令是一列二进制数字。计算机将之转变成一列高低电平，以使计算机受到驱动，进行运算。反之，计算机是可以执行机器指令，进行运算的机器。常用的PC机中，有一个芯片来完成上面所说的计算机功能。这个芯片就是CPU。计算机是指由CPU及其他受CPU直接或间接控制的芯片、器件、设备组成的计算机系统。例如操作:寄存器
计算机基础1-汇编基础 unity学院苍狼王unity技术学院计算机常识操作汇编
汇编语言是一种低级的计算机语言，它直接与计算机硬件进行交互。在汇编语言中，指令由一系列助记符（mnemonic）组成，用于执行特定的操作，如数据传输、算术运算和控制流程等。每个指令都对应着一条机器码，这些机器码直接由计算机硬件执行。汇编语言的基本概念包括以下几个方面：寄存器：寄存器是计算机内部的一些特殊存储单元，用于存储数据和执行操作。常见的寄存器有通用寄存器（如AX、BX、CX等）、标志寄存器（
java/数据库学习的心得 dst_ java/数据库学习 java
这是学习java/数据库一年后写下的心得，也一并谈谈他们对我学习前端有哪些影响java其实是一门很容易入门的语言，有点计算机基础的都能很好的上手，虽然已经一年多没写java了，回头再写肯定会生疏。但是让我去看代码逻辑（加了注释）啥的，还是能看懂的。java是一门面向对象的语言，这也是它的核心思想，我们在写java时不必关心内部怎么实现，只需要知道这个对象有哪些方法这些方法都能干什么，通过调用对象的
免费计算机网络基础ppt,计算机网络基础偏差一毫厘免费计算机网络基础ppt
计算机的基本知识ppt课件教案为大家详细介绍了互联网的起源及发展，让你在这里可以很好的了解网络的重点知识，结合生活实际，全方面的描述了网络现在带给人们的方便的便捷，想知道更多有关精彩内容就快来极光下载站体验一番吧！计算机网络基础知识ppt教案优势学好该知识点，掌握计算机基本的操作方法，是每个现代人必须学习的内容，目的就是在将来的工作、学习和生活中，能够更好地使用电脑，用好这个工具。通过计算机基础的
信息学奥赛NOIP/CSP-J初赛知识点汇总城南蝈蝈信息学奥赛信息学奥赛 NOIP CSPJ 初赛
信息学奥赛知识点(一)—计算机基础知识信息学奥赛知识点(二)—计算机结构及硬件信息学奥赛知识点(三)—计算机软件系统信息学奥赛知识点(四)—计算机语言信息学奥赛知识点(五)—进制转换信息学奥赛知识点(六)—信息编码信息学奥赛知识点(七)—原码补码反码信息学奥赛知识点(八)—计算机网络信息学奥赛知识点(九)—因特网概述信息学奥赛知识点(十)—计算机安全知识信息学奥赛知识点(十一)—逻辑运算信息学奥赛
0成本部署github前端项目流程佚名涙 github 前端
0成本部署github纯前端项目流程对业内来说应该是一个比较常规的操作，对于新手来说进行过一次应该就很难忘记了，但很多人仍然是不会的，认为部署项目很难，很专业，其实现在由于这些厂商的努力，大众（没有任何计算机基础）想要部署也是非常容易的使用Vercel拉取部署项目首先我们要将项目fork到我们的本地，这一步可以直接使用Vercel的自动化完成以这段时间较火的gpt镜像站：https://githu
跟老吕学计算机基础——前言 Python南帝跟老吕学计算机基础计算机基础知识计算机信息技术计算机软件计算机网络数字媒体及应用信息系统与数据库技术计算机历史
！！！记得先关注订阅本专栏【跟老吕学计算机基础】！！！！！不然后续找不到了哦！！！前言老吕想说本来想只写个故事型的东西，但是实际编写的时候，发现还是避免不了一些专业的东西必须要有明确定义之类的讲述，否则是没有办法完全讲述的清楚的，所以建议如果没有耐心看太多的朋友，先跳着看，后续遇到了想实际了解的更多的时候，可以返回来查询关键词来看，或者重新再看一遍老吕写的这个教程。本教程的目标让大家能够更全面的了
【网络安全】什么样的人适合学？该怎么学？网安老伯 web安全安全大数据学习 linux 网络安全计算机视觉
有很多想要转行网络安全或者选择网络安全专业的人在进行决定之前一定会有的问题：什么样的人适合学习网络安全？我适不适合学习网络安全？到底什么样的人适合学习网络安全呢？（需要什么前提条件呢）开门见山：其实总体来说什么人都可以学习，只要有计算机这方面爱好的都可以!（含零基础小白）当然，要是想要从事这方面工作的!具备以下条件会更好!1:大专以上学历。2:有计算机基础或者了解编程语言的学员。3:年龄18-40
学习大数据开发，需要满足哪些条件？学历，性别，专业有限制吗？ yoku酱
给大家介绍一下关于零基础学习大数据需要哪些条件？首先我们在平时的工作中，经常有小白同学问学习大数据有学历限制吗？我是大专学历可以学习大数据技术吗？我没有计算机基础，可以学习大数据吗？大数据学习是不是很难，零基础能学会吗？我是女生，可以学习大数据技术吗？下面我们针对这些问题来一一作答！首先对于零基础的童鞋想参加大数据开发学习，需要：1、一些数学常识，尤其是想从事数据分析这一块，至少要了解常用计算模型
你的Python 基础知识是成体系的吗？这套核心知识体系思维导图送给你！数据万花筒
点击上方蓝字关注我们本文转载自知乎，ZOE酱，https://zhuanlan.zhihu.com/p/35516692，不涉及任何商业用途，如有侵权，请联系后台删除！！1计算机基础2Python语言基础3标准数据类型(一)数值&字典&集合4标准类型补充5标准数据类型(二)序列对象6标准数据类型(三)字符串7条件&循环8【进阶】条件&循环9函数&模块10【进阶】函数11模块12面向对象编程13【进
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，

字符编码笔记汇总：ASCII、GBXXXX、Unicode、UTF-8等