不爱生姜不吃醋⭐️⭐️⭐️
声明:
本文写的是关于计算机的存储规则 ❗️
看完之后觉得不错的话麻烦动动小手点个赞赞吧
如果本文有什么错误的话欢迎在评论区中指正哦
与其明天开始,不如现在行动!
大家的支持就是我最大的动力!冲啊!
在计算机中,任意数据都是以二进制形式来存储。一个0
或1
叫做一个bit
(比特位),把八个bit
分为一组叫做字节,字节是计算机最小的存储单元。存储英文只需要一个字节。
存储:一个字符‘a’
,经过ASCII查询后得到其十进制位为97
,二进制位为110 0001
,此时不足八位,计算机就会进行编码:对其二进制进行补零变为0110 0001
存入硬盘。
读取:计算机把存储在硬盘中的数据转化成十进制后查询ASCII变为字符。
通过上述图片我们可以了解到英文字母的存储规则,但是如果是汉字的话,就不能使用ASCII表。
为了解决不能使用汉字这个问题,国家在1980年的时候发布了GB 2312(中华人民共和国国家标准信息交换用汉字编码字符集)。1984年台湾省实施BIG5字符集(台湾省繁体中文标准字符集)。后面国家为了统一使用,在2000年的时候发布GBK字符集,其中包含国家标准GB13000-1的全部中日韩汉字还有BIG5编码中的所有汉字。
Windows系统简体中文的默认字符集就是GBK(显示的是ANSI)。
GBK的存储规则分为两个方面:
GBK对于英文的存储规则:
GBK对于中文的存储规则:
Unicode字符集是国际标准字符集,将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言、跨平台的文本信息转换。
Unicode字符集的UTF-8编码格式中:
Unicode的UFT-8编码格式中对于英文的存储规则:
Unicode的UFT-8编码格式中对于汉字的存储规则:
注意:UTF-8不是一种字符集,它是Unicode字符集的一种编码方式
文章内容是关于计算机的存储规则。
本文中若是有出现的错误请在评论区或者私信指出,我再进行改正优化,如果文章对你有所帮助,请给博主一个宝贵的三连,感谢大家!!!