【Java基础学习打卡03】计算机中数据的表示、存储与处理

目录

  • 前言
  • 一、数据的表示
    • 1.数据与信息
    • 2.计算机中的数据
    • 3.计算机中数据的单位
  • 二、数据的存储
  • 三、数据的处理
    • 1.进位计数值
    • 2.进制间转换
  • 四、字符编码
  • 总结


前言

本小节主要介绍在计算机中数据的表示、存储与处理。要知道计算机内部使用二进制数据,也就是0和1组成的数据。要了解数据单位有哪几种,如何存储数据,有哪些进位计数值,如何转换。计算机字符编码是怎么回事。


一、数据的表示

1.数据与信息

  • 数据是没有被分析和解释的原始或未加工的材料,比如数字、字符等。
  • 信息则是已经被处理和组织,能够传达有意义的信息和知识的结果。

【Java基础学习打卡03】计算机中数据的表示、存储与处理_第1张图片
在计算机应用中,数据和信息的界限有时是模糊的。它们之间的区别并不是绝对的,取决于数据的处理方式和行业应用。

2.计算机中的数据

冯·诺依曼提出计算机使用二进制(17世纪至18世纪的德国数学家莱布尼茨第一个提出)。

计算机是使用二进制的形式来表示所有的数据和指令的。二进制(Binary)是一种数制,只包含0和1两个字符,是计算机系统中数据处理的最基本单位。

3.计算机中数据的单位

计算机中的数据单位主要有以下几种:

单位 说明
位(Bit) 计算机中最基本的数据单位,它只有0和1两种状态。位是计算机处理信息的最小单位。
字节(Byte) 字节是计算机内存中存储、传输和处理信息的基本单位。 1Byte = 8Bit
千字节(KB) 千字节是计算机中常用的存储容量单位。 1KB= 1024Byte
兆字节(MB) 兆字节是计算机中大容量存储设备(如硬盘、光盘等)的常用容量单位。 1MB=1024KB
吉字节(GB) 吉字节是计算机中用于描述大型存储设备容量的单位。 1GB=1024MB
太字节(TB) 太字节是计算机中存储容量更大的单位。 1TB=1024GB

遵循国际标准,数据单位一般采用二进制计算(每个单位等于1024的倍数),而非十进制计算(每个单位等于10的倍数)。

字长: 计算机中的字长是指CPU每次能够处理的二进制数据的位数,通常计算机的字长越长,处理速度和能力越强,所能表示的整数范围也就越广。

二、数据的存储

计算机中存储数据的最小单位是Bit,存储容量的基本单位是字节。

计算机中数据的存储可以分为两个方面:内存存储和外存储。

  • 内存存储指的是计算机在运行程序时,所使用的内部存储器,通常被称为RAM (随机访问内存)。RAM在计算机关闭或断电时,其中的数据会被清除,因此数据的永久存储需要使用外存储方式。
  • 外存储是指计算机中用来存储程序和数据的非易失性存储器,常见的外存储器包括机械硬盘(HDD)、固态硬盘(SSD)、USB闪存盘、CD/DVD光盘等。这些存储器的数据可以长期保留,即使关闭电源也不会丢失。

数据在计算机中的存储方式,通常以二进制的形式储存在计算机的内部存储器和外部存储器中。计算机通过操作二进制码来实现对数据的储存、传输和处理。

三、数据的处理

1.进位计数值

二进制(Binary) 八进制(Octonary)
十进制(Decimal) 十六进制(Hexadecimal)

二进制是计算机中最基本的进位计数值,使用数字 0 和 1 表示,也成为“二进制数(Binary)”。计算机内部的所有存储、传输和处理都是以二进制的形式进行的。

进位:逢2进1

二进制 十进制 二进制 十进制
0 0 101 5
1 1 1010 10
10 2 1100100 100
11 3 11001000 200
100 4 11111010000 2000

八进制是一种在计算机领域中用的进位计数值,使用数字 0 至 7 表示,每三个二进制位可以表示一个八进制数位。在一些程序设计语言和操作系统中,八进制数值可以用前缀数字0来表示。

进位:逢8进1

八进制 十进制 八进制 十进制
0 0 24 20
1 1 36 30
2 2 50 40
10 8 144 100
11 9 1750 1000

十六进制是另一种在计算机领域中用的进位计数值,使用数字 0 至 9 和字母 A 至 F(AF表示1015) 表示,每四个二进制位可以表示一个十六进制数位。在一些程序设计语言和操作系统中,十六进制数值可以用前缀0x或h来表示。

进位:逢16进1

十六进制 十进制 十六进制 十进制
0 0 f 15
1 1 10 16
2 2 64 100
a 10 3e8 1000
b 11 2710 10000

2.进制间转换

二进制转为十进制(按权展开求和)将二进制的数写成加权系数展开式,而后根据十进制的加法规则进行求和。

11001 = 1x 2 4 2^{4} 24+1x 2 3 2^{3} 23+0x 2 2 2^{2} 22+0x 2 1 2^{1} 21+1x 2 0 2^{0} 20=25

规律:个位上的数字的次数是0,十位上的数字的次数是1,…,依次递增,而十分位的数字的次数是-1,百分位上数字的次数是-2,…,依次递减。

十进制转为二进制(除2取余,逆序排列)用2整除十进制整数,可以得到一个商和余数;再用2去除商,又会得到一个商和余数,如此进行,直到商为小于1时为止,然后把先得到的余数作为二进制数的低位有效位,后得到的余数作为二进制数的高位有效位,依次排列起来。

53 2 \sqrt[2]{53} 253 =26…1
26 2 \sqrt[2]{26} 226 =13…0
13 2 \sqrt[2]{13} 213 =6…1
6 2 \sqrt[2]{6} 26 =3…0
3 2 \sqrt[2]{3} 23 =1…1
1 2 \sqrt[2]{1} 21 =0…1

由下往上依次排列所得余数:110101

四、字符编码

计算机字符编码是将文本字符映射到数字代码的过程。 由于计算机只能处理数字,因此需要一种方式将文本字符转换成数字,在计算机内部进行处理和存储。字符编码就是描述如何将字符映射为数字的一组规则。
【Java基础学习打卡03】计算机中数据的表示、存储与处理_第2张图片
常见的字符编码包括ASCII码、Unicode、UTF-8等。

ASCII码是最早的字符编码方式,它使用7位二进制数来表示128个字符,包括英文字母、数字和一些标点符号。
【Java基础学习打卡03】计算机中数据的表示、存储与处理_第3张图片
Unicode是一种字符集标准,它将全世界所有的字符都标准化到一个集合中,使得不同的语言都可以使用相同的数字代码来表示字符。UTF-8是基于Unicode的一种变长字符编码方式,使用1到4个字节来编码每个字符。

通过字符编码,计算机可以在不同的系统和应用程序之间共享数据,并且支持多语言和跨语言通信。我们日常编程中一般设置编码为UTF-8。


总结

计算机中数据的表示、存储和处理,还有字符编码都需要了解。

你可能感兴趣的:(《Java基础学习打卡》,学习,Java基础,计算机数据,进位计数值,二进制)