Aaronskr

【数据类型存储原理】数据的存储 - 深度剖析数据在内存中的存储

数据的存储

前言
✨数据类型汇总
- 整型家族
- 浮点型家族
- 自定义类型
- ‍指针类型。
- 空类型
大小端字节序说明
- 出现大小端字节序的原因
- 字节序的概念
- ✋大小端字节序
- ‍百度系统工程师笔试题（通过编程判断该编译器为大端存储还是小端存储）
- - 问题分析
  - 代码演示
  - 代码分析
整型数据在内存中的存储
- 原码、反码、补码
- 截断与整型提升
- 整型数据存储练习
浮点型数据在内存中的存储
- 证明整数和浮点数的存取方式不同
- IEEE标准形式
- IEEE存储标准规定
- IEEE读取标准规定
总结

前言

我们在敲代码的时候总是会定义各种变量，对各种数据进行存储，比如int a = 10；就是将10这个数据存放进变量a中，而变量a，就是我们在内存中申请开辟的一块空间。
在内存中如何开辟空间给变量的问题博主已经在函数栈帧里用反汇编的方式将其原理剖析了，具体可看图解函数栈帧 - 函数栈帧的创建及销毁。
本文将进一步剖析在已经开辟好存储单元的情况下，各种数据是如何存储的。

在了解数据如何存储之前，应该先了解我们常见的数据类型。

✨数据类型汇总

在C99标准中，我们可将数据类型划分为以下几大类。

整型家族

浮点型家族（实型家族）

自定义类型（构造类型）

指针类型

空类型

下面一一介绍这五种类型的基本情况。

整型家族

char
		unsigned char
		signed char
short
		unsigned short [int]
		signed short [int]
int
		unsigned int
		signed int
long
		unsigned long [int]
		signed long [int]

注：在C99之后的标准规定，将char类型数据划分为整型家族，因为字符在内存中会将其转化为ASCII码值进行存储。

如上所示，所有的整型家族都被分为有符号整型和无符号整型，并且signed都是可以被省略的，换言之，signed int完全等价于int，其他以此类推，但其中有一个例外： char类型和signed char并不等价，只写一个char ch = 0；我们将无法分辨这个ch变量到底是有符号字符型还是无符号字符型，他完全取决于编译器，但经博主测试，大部分编译器下char类型都被编译器翻译为有符号的char类型。

在C99中还引入了long long - 长长整型，用法和long类型一致，但C语言语法规定，sizeof（long）<= sizeof（long long），而long类型所占内存大小为4/8字节，所以long long类型所占内存空间大小一定为8个字节。

浮点型家族

float
double

浮点型家族只有float和double这两种类型，float类型所占空间大小为4byte，double类型所占空间大小为8byte。

他们之间的区别除了所占空间大小不同之外还有精度的区别，float称为单精度浮点型，有效精度为小数点后6位，而double类型称为双精度浮点型，精确到小数点后15位，但其有效数字只有11位左右。

自定义类型

> 数组类型
> 结构体类型 struct
> 枚举类型 enum
> 联合类型 union

这里可能会有很多人无法李姐为什么数组类型也被划分为自定义类型，这里稍微做一些解释。

我们知道数组类型的变量定义形式：数据类型+数组名+[数组大小]；

如：

int arr[10] = { 0 };

这里可能会让很多人产生误区，认为arr数组的类型是int类型，也就把这条语句理解为是int类型的、数组名为arr的数组大小为10的数组，其实不然，这个数组的数组名确实是arr，但其数据类型是int [10]，这里可能让大部分人无法接受，

举个简单的例子即可解释：

我们知道，sizeof操作符是用来计算所占内存空间大小的，其操作数既可以是变量名，也可以是变量类型。

#define _CRT_SECURE_NO_WARNINGS 1

#include 

int main()
{
     
	int a = 10;

	printf("%d\n", sizeof(a));
	printf("%d\n", sizeof(int));

	return 0;
}

这两种写法都正确，打印结果为：

而对于数组，操作数也同样可以是数组名或者数组类型：

#define _CRT_SECURE_NO_WARNINGS 1

#include 

int main()
{
     
	/*int a = 10;

	printf("%d\n", sizeof(a));
	printf("%d\n", sizeof(int));*/

	int arr[10] = {
      0 };

	printf("%d\n", sizeof(arr));
	printf("%d\n", sizeof(int[10]));

	return 0;
}

其打印结果为：

这么一来，就验证了int [10]是数组类型。

知道了这点，解释为什么数组类型是自定义类型就更清晰了，用上面解释的结论就可以知道，int arr[10]和int arr[9]的数组类型不同，并不都是int类型的，数组大小是我们程序员人为规定的，所以可以把他划分为自定义类型。

其他的自定义类型比较明显，这里就不一一解释。

‍指针类型。

指针类型很特殊。

我们常说的指针有两个含义：

某一个变量的地址，也就是其在内存中的编号，我们可称其为指针。
用于存放地址（编号）的变量，我们称其为指针变量，常简称指针。

指针类型的定义方式为：

数据类型+*（用于标识指针类型）+指针变量名

常见的指针类型有：

int* pi;
char* pc;
float* pf;
void* pv;

这里着重介绍一点，指针变量赋值大部分都是取出某变量地址存放进指针变量，如int pc = &c；

但有一个例外：

int main()
{
	char* pc = "hello world";

	printf("%c\n", *pc);

	return 0;
}

这里之间将一个字符串常量赋值给指针变量pc，我们知道，字符串常量时放在常量区的，他的值不可修改，并且这里的字符串加上隐藏的’\0’总共是12个字节，而我们的指针变量根据平台的不同只能是4/8个字节，怎么都不可能放的下这个字符串常量，所以这么理解是错误的。

我们将其打印看看结果：

打印结果为单字母h，这么一来其实就解释的通了，将整个常量字符串赋值给指针变量，其实并不会把整个字符串放进去，而是把整个字符串的首地址赋给指针变量，比较指针存放的就是地址，这和将字符数组名赋值给指针变量类似，存放的都是首元素地址。

空类型

void 用于表示空类型（无类型）
通常应用于函数的返回类型、函数的参数、指针类型。

下面举几空类型的例子帮助理解：

返回类型：

void test(int x)
{
     
	printf("%d\n", x);
}

int main()
{
     
	int a = 10;
	test(a);

	return 0;
}

这里test函数的返回类型就是void。

函数的参数：

int test(void)
{
     
	return 1;
}

int main()
{
     
	int ret = test();

	printf("%d\n", ret);

	return 0;
}

这个代码就是将函数的参数置为空，表示不允许主调函数传参，如果非要传参，编译器将给出警告。

int test(void)
{
     
	return 1;
}

int main()
{
     
	int a = 10;
	int ret = test(a);

	printf("%d\n", ret);

	return 0;
}

指针类型：

void* pc;

表示定义一个指针pc，但他什么都不指向，作为一个空指针存在。

大小端字节序说明

我们知道不管是什么样的数据，最终都会被编译器编译为二进制机器码进行存储，并且我们的内存是以字节为最小存储单元划分而进行存储的，那么就存在了一个问题，数据以字节为单位进行存储的时候，是以怎样的顺序进行存储的呢？这就引出了大小端字节序的概念。

出现大小端字节序的原因

为什么会有大小端字节序模式之分呢？这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为8bit位。但是在C语言中除了8bit的char类型之外，还有16bit的short类型，32bit的long类型（要看具体的编译器，64位平台long类型为64位），另外，对于位数大于8位的处理器，例如16位或者32位的处理器，由于寄存器的宽度大于一个字节，那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。

例如：一个16bit位的short类型变量x ，在内存中的地址为0x0010，变量x 的值为0x1122 ，那么0x11为高字节，0x22为低字节。对于大端模式，就将 0x11放在低地址中，即0x0010中，0x22 放在高地址中，即0x0011中。小端模式，刚好相反。我们常用的X86（32位平台）结构是小端模式，而KEILC51则为大端模式。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

字节序的概念

字节序，即字节顺序，又称端序或尾序，在计算机科学领域中，指「存储器」中或者「数字通信链路」中，组成多字节的字节排列顺序。在几乎所有的机器上，多字节对象都被存储为连续的字节序列。例如在C语言中，一个 int类型的变量x地址为0x100，那么其对应的地址表达式&x的值为0x100 且 x 的4个字节将被存储在存储器的0x100, 0x101, 0x102, 0x103位置。字节的排列方式有2个通用规则。

顺序排列 - 大端字节序

逆序排列 - 小端字节序

上面的文字描述也许过于抽象，接下来用较为容易理解的方式分别简单的介绍大端字节序和小端字节序的概念。

✋大小端字节序

所谓大小端字节序，就是将多字节数据中的高低字节位按不同顺序存放在内存中的高低地址处，相当于顺（逆）序存放。接下来博主将把上述抽象概念划分逐一介绍：

首先理解什么叫做多字节数据。

我们知道一个数据根据大小不同被划分为不同的数据类型，各数据类型所占字节数不同，我们也就据此根据数据字节大小来将其存放于不同的数据类型中。

比如字符类型 - 其扩展之后的ASCII码值为0~255，我们知道一个字节是8位，按照无符号字符型的理解也就是从00000000 ~ 11111111，刚好是0 ~ 255，所以字符类型被称为单字符类型数据。

而十六进制数，如：0x11223344则为多字节数据，其中有4个字节，分别是0x11、0x22、0x33、0x44，像这样的数据则被称为多字节数据。

理解什么叫做多字节数据的高字节位。

在一个二进制序列中，

如：0101011010100101101010010110~~1001~~

我们把前方高亮部分的0101称为高字节位，把后端加删除线的~~1001~~ 部分称为低字节位，以此区分。

其实很好理解，因为最后一个1的的权重为2⁰，也就是2的0次方，而第一个0的权重为2³¹，也就是2的31次方，以此来区分高低字节位也是很不错的选择。

接下来介绍大小端字节序的存储方式：

大端字节序

所谓大端字节序，就是将处于高字节位的数据存放在内存的低地址处，将处于低字节位的数据存放在内存的高地址处

如今给一数据：0x11223344

在内存中的存放形式为：

以这样的形式存放的模式，就称为大端存储模式，这样的存放顺序，也就被称为大端字节序。

小端字节序

所谓小端字节序，就是将处于高字节位的数据存放在内存的高地址处，将处于低字节位的数据存放在内存的低地址处

今给一数据：0x11223344

在内存中的存放形式为：

以这样的形式存放的模式，就称为小端存储模式，这样的存放顺序，也就被称为小端字节序。

在博主使用的VS2019编译器上，采用的就是小端字节序：

例：

int main()
{
	int a = 0x0000ff40;

	return 0;
}

调试 - 内存窗口（&a）：

0x001DFEFC就是该代码中a变量的地址，存放情况为40 ff 00 00。

也就是小端存储模式。

‍百度系统工程师笔试题（通过编程判断该编译器为大端存储还是小端存储）

百度2015年系统工程师笔试题：

请简述大端字节序和小端字节序的概念，设计一个小程序来判断当前机器的字节序。（10分）

该题前半部分在上文其实已经解决了，这里博主将分析问题，并实现代码。

问题分析

要判断编译系统到底是大端存储还是小端存储，其实并不复杂。

如0x11223344

如果是在大端存储模式下：
存储方式为：11 22 33 44

如果是在小端存储模式下：
存储方式为：44 33 22 11

所以其实只需要知道第一个字节的内容到底是11还是44就可以判断了。
但这样的数据太过于复杂，不如换简单一点的数字，比如1。

1的高字节位就是00，低字节位就是01，比较好判断。

代码演示

int check_sys(int x)
{
     
	return *(char*)&x;
}

int main()
{
     
	int a = 1;

	//约定：
	//如果是大端，返回0
	//如果是小端，返回1
	int ret = check_sys(a);
	if (ret)
	{
     
		printf("是小端存储模式\n");
	}
	else
	{
     
		printf("是大端存储模式\n");
	}

	return 0;
}

运行结果：

之前也分析了，我的编译器VS2019是小端存储模式，所以代码的结果正确，下面分析代码。

代码分析

想要在4个字节中拿到第一个字节，只需要在取地址时将整型强制类型转换为字符型即可，拿到存放第一个字节的地址后对其解引用便可拿到第一个字节数据。
如果拿到的是01，说明存储方式是01 00 00 00，也就是小端存储模式，反之则为大端存储模式。

这里如果有没有讲清楚的地方，欢迎评论区留言或者私信博主解决嗷。

整型数据在内存中的存储

数据在内存中的存储遵循一定的法则，而整型数据和浮点型数据在内存中所遵循的法则是不同的，这里我们先介绍整型数据在内存中是如何存储的。

介绍整型数据的存储需要先引进一个概念：原反补码。

原码、反码、补码

计算机中的有符号数有三种表示方法，即原码、反码和补码。三种表示方法均有符号位和数值位（或称有效位）两部分，符号位都是用0表示“正”，用1表示“负”，而数值位，三种表示方法各不相同。在计算机系统中，数值一律用补码来表示和存储。原因在于：使用补码，可以将符号位和数值域统一处理；同时，加法和减法也可以统一处理。
而补码其实是针对负数存储设定的，对于无符号数来说，其反码和补码都和原码相等。

原码：

所谓原码，就是将数据直接翻译为二进制序列。

拿32位平台举例，最高位作为符号位，正数的符号位为0，负数的符号位为1，后面的31位称为有效位，以不同的权重计算出不同的数字，最低位的权重为2⁰，其次为2¹，以此类推。

如：

13的原码为：00000000000000000000000000001101

-3的原码为：10000000000000000000000000000011

反码：

反码，顾名思义，就是将原码的二进制序列按位取反，但这里需要注意，并不是将所有的二进制位都按位取反，符号位是特殊独立出来的，他表示一个数的正负，随意取反可能会遭遇意想不到的结果。

所以反码应该通过原码除符号位，其他位按位取反获得。
（注：正数的反码和原码相等。）

如：

13的反码为：00000000000000000000000000001101

-3的反码为：11111111111111111111111111111100

补码：

整数在内存中的存储存的都是补码，所以要通过上面的反码求出补码，补码的获取规则是原码按位取反（除符号位）再加一。
（注：正数的补码和原码相等。）

如：

13的补码为：00000000000000000000000000001101

-3的补码为：11111111111111111111111111111101

因为整数在内存中的存储形式是补码，所以引出原反补的意义就是求出补码，而补码的计算公式为：补码 = 原码按位取反（除符号位）再加一

这里我们通过VS2019编译器进行验证内存中存储的是数据的补码：

int main()
{
     
	int a = 13;
	//原码：00000000 00000000 00000000 00001101
	//反码：01111111 11111111 11111111 11110010
	//补码：01111111 11111111 11111111 11110011

	int b = -3;
	//原码：10000000 00000000 00000000 00000011
	//反码：11111111 11111111 11111111 11111100
	//补码：11111111 11111111 11111111 11111101

	return 0;
}

编译器下调试 - 内存 - &a：

内存中存储的是：0d 00 00 00

为小端存储模式，00001101转换为十六进制就是0d。

编译器下调试 - 内存 - &b：

内存中存储的是：fd ff ff ff

为小端存储模式，1111 1111转换为十六进制就是ff，1111 1101转换为十六进制就是fd。

如此说来，在内存中真的存放的就是补码，所以为了弄清楚整型数据在内存中的存储，必须牢牢掌握原反补的概念。

截断与整型提升

我们知道int类型的变量所占空间大小是4个字节32个bit位（32位平台下），而char类型的变量所占空间大小是1个字节8个bit位，那我要怎么将一个整型的数据存放在一个char类型的变量里呢？这里教大家一个很有用的办法，那就是没办法，32个比特位是不可能放进8个小格子里的，所以就会发生所谓的截断。

我们知道，一个char类型只能存放8个比特位，那如果我要将char类型的数据以%d的形式打印，也就是看做32位数据将其打印，那有要怎么做呢？再教大家一个办法，那依然是没办法，所以编译器只能对char类型的数据进行整型提升。

接下来简单讲解截断和整型提升的原理。

截断

假设我有一个32位二进制序列：
01010011001000110001000100100011

这是一个非常大的数字：

有一个char类型的空间：

在把32位数字往里放的时候会发现放不下，便会发生截断，只保留低八位的数字，其他24位数字直接舍弃，

最终存放的结果为：

这就是截断的过程。

整型提升

当我要将char类型的数据以%d的形式打印时，我们知道，%d是打印有符号整型，打印的是32位0/1序列的最终结果，但我们的char类型里只存放了8位，这个时候就会发生整型提升。

整型提升规则：

如果对无符号数进行整型提升，则在前面补24位0。
如果对有符号数进行整型提升，则判断该数在当前的二进制0/1序列的首元素，相当于符号位。
- 如果是0，则全补0
- 如果是1，则全补1

如：

今有一8位无符号数。

unsigned char a = 148;

首先我们写出该数的二进制序列。

10010100 - 148

由于变量a是无符号类型的，所以不管该二进制序列首元素是0还是1，都将全部补0

获得：

00000000000000000000000010010100

最终打印的结果就是148

整型数据存储练习

对以下代码分析输出结果：

1.
//输出什么？
int main()
{
     
	char a = -1;
	signed char b = -1;
	
	unsigned char c = -1;

	printf("a=%d b=%d c=%d\n", a, b, c);

	return 0;
}

首先VS2019编译器对char类型的处理为默认认为是有符号的char，所以变量a和变量b属于同一类型。

先计算出-1的补码。

int main()
{
     
	//-1
	//原码：10000000000000000000000000000001
	//反码：11111111111111111111111111111110
	//补码：11111111111111111111111111111111
	
	char a = -1;
	signed char b = -1;
	

	unsigned char c = -1;
	

	printf("a=%d b=%d c=%d\n", a, b, c);

	return 0;
}

三个变量都是char类型，所以存储时都将发生截断。

int main()
{
     
	//-1
	//原码：10000000000000000000000000000001
	//反码：11111111111111111111111111111110
	//补码：11111111111111111111111111111111

	char a = -1;
	//存储的补码：11111111
	signed char b = -1;
	//存储的补码：11111111

	unsigned char c = -1;
	//存储的补码：11111111

	printf("a=%d b=%d c=%d\n", a, b, c);

	return 0;
}

现在要将三个变量以%d形式打印，则会发生整型提升。

而对于变量a和变量b来说，存放的是有符号的char，根据第一个二进制位决定提升的数为1，所以

变量a和变量b整型提升后的结果为：

11111111111111111111111111111111

而对于变量c来说，它是无符号的char，直接全部补0，所以

变量c整型提升后的结果为：

00000000000000000000000011111111

因为提升后的c符号位是0，所以原反补码均相等。

而按%d形式打印需要将补码转化为原码后转化为十进制进行打印，

所以：

int main()
{
     
	//-1
	//原码：10000000000000000000000000000001
	//反码：11111111111111111111111111111110
	//补码：11111111111111111111111111111111

	char a = -1;
	//存储的补码：11111111
	//提升后的补码：11111111111111111111111111111111
	//提升后的反码：10000000000000000000000000000000
	//提升后的原码：10000000000000000000000000000001
	signed char b = -1;
	//存储的补码：11111111
	//提升后的补码：11111111111111111111111111111111
	//提升后的反码：10000000000000000000000000000000
	//提升后的原码：10000000000000000000000000000001

	unsigned char c = -1;
	//存储的补码：11111111
	//提升后的补码：00000000000000000000000011111111
	//提升后的反码：00000000000000000000000011111111
	//提升后的原码：00000000000000000000000011111111

	printf("a=%d b=%d c=%d\n", a, b, c);

	return 0;
}

这么一来，打印的结果就应该是-1 -1 255

打印结果：

下面程序输出什么？

2.
int main()
{
     
	char a = -128;

	printf("%u\n", a);

	return 0;
}

这道题的变量a是有符号的char类型的。

首先计算出-128的原反补码。

int main()
{
     
	char a = -128;
	//-128
	//原码：10000000000000000000000010000000
	//反码：11111111111111111111111101111111
	//补码：11111111111111111111111110000000

	printf("%u\n", a);

	return 0;
}

将01111111111111111111111110000000这样一个二进制序列存放进a中将会发生截断。

截断之后a中存放的结果为：10000000

这时以%u的形式打印，也就是以无符号整型的形式打印，要进行整型提升，而变量a是一个有符号的char类型，第一个元素是1，所以整型提升24个1。

int main()
{
     
	char a = -128;
	//-128
	//原码：10000000000000000000000010000000
	//反码：11111111111111111111111101111111
	//补码：11111111111111111111111110000000

	//截断的结果：10000000
	//整型提升后的结果：11111111111111111111111110000000

	printf("%u\n", a);

	return 0;
}

这时要将提升之后的补码转换为原码后以十进制的形式进行打印。

而%u的形式将把补码中的符号位看做是有效位，所以其原反补都是一样的。

int main()
{
     
	char a = -128;
	//-128
	//原码：10000000000000000000000010000000
	//反码：11111111111111111111111101111111
	//补码：11111111111111111111111110000000

	//截断的结果：10000000
	//整型提升后的结果：11111111111111111111111110000000
	
	//补码：11111111111111111111111110000000
	//反码：11111111111111111111111110000000
	//原码：11111111111111111111111110000000

	printf("%u\n", a);

	return 0;
}

而11111111111111111111111110000000的值应该是4,294,967,168

所以输出结果：

3.
int main()
{
     
	char a = 128;

	printf("%u\n", a);

	return 0;
}

还是一样，先求出128的补码，由于128是正数，所以其原反补都是相同的为：

00000000000000000000000010000000

存放进变量a中将发生整型截断：

10000000

而变量a为有符号的char类型，所以整型提升为

11111111111111111111111110000000

变量a以%u形式打印，则把符号位看成有效位，则此时原码反码补码相同，直接进行计算，11111111111111111111111110000000的十进制形式为4,294,967,168

所以打印结果为：

4.
int mian()
{
     
	int i = -20;
	unsigned int j = 10;

	//按照补码的形式进行运算，最后格式化成为有符号整数
	printf("%d\n", i + j);
	
	return 0;
}

还是先把-20和10的补码计算出来，但是这里的i和j都是整型变量，所以不会发生截断和整型提升。

int mian()
{
     
	int i = -20;
	//-20
	//原码：10000000000000000000000000010100
	//反码：11111111111111111111111111101011
	//补码：11111111111111111111111111101100
	unsigned int j = 10;
	//10
	//补码：00000000000000000000000000001010


	//按照补码的形式进行运算，最后格式化成为有符号整数
	printf("%d\n", i + j);
	
	return 0;
}

数据的计算是按照二进制补码的形式进行计算的，最后的结果再根据打印要求或者存储要求进行调整更改。

计算的结果：

int mian()
{
     
	int i = -20;
	//-20
	//原码：10000000000000000000000000010100
	//反码：11111111111111111111111111101011
	//补码：11111111111111111111111111101100
	unsigned int j = 10;
	//10
	//补码：00000000000000000000000000001010

	//计算：
	//11111111111111111111111111101100
	//00000000000000000000000000001010
	//11111111111111111111111111110110 - 补码相加的结果

	//按照补码的形式进行运算，最后格式化成为有符号整数
	printf("%d\n", i + j);
	
	return 0;
}

要求按%d的形式打印，则将计算的结果转化为原码以有符号十进制数打印。

补码：11111111111111111111111111110110
反码：10000000000000000000000000001001
原码：10000000000000000000000000001010

计算结果为-10

int main()
{
     
	unsigned int i;
	for (i = 9; i >= 0; i--)
	{
     
		printf("%u\n", i);
	}

	return 0;
}

程序分析：

变量i从9开始自减到0时，都可以正常进入程序打印的值就是

9 8 7 6 5 4 3 2 1 0

在打印完0之后，变量i再自减1，变成-1，按道理来说应该跳出循环，但我们注意，这里的变量i为无符号整型，而-1的补码为11111111111111111111111111111111，所以会被解析为一个特别大的正整数：4294967295。

那么他也符合循环控制条件（i >= 0），所以循环会继续4294967295次，而一直自减到0的时候，再次自减又变成-1，有被解析为4294967295，所以该程序将无限循环下去。

这里博主随便截两张打印结果的图供大家参考。

6.
#include 

int main()
{
     
	char a[1000];
	int i;
	for (i = 0; i < 1000; i++)
	{
     
		a[i] = -1 - i;
	}
	printf("%d", strlen(a));

	return 0;
}

程序分析：

根据代码可知数组中第一个存放的数应该是-1，第二个是-2，以此类推。

但是这个数组是char类型的，我们知道char类型可存放的数据范围是-128~127，所以这些数据一直自减到-128之后，如果再自减就会放不下了，但是这里有一个小知识点。

通过画图给大家讲解。

这个图中放的是char类型补码对应十进制的全部情况，二进制位从0开始补码加1，即十进制从0开始加1计算，最终计算到127。
11111111为-1的补码，往上减1计算得到-2，再减1就是-3，以此类推可计算到-127。
而10000000这个二进制序列是无法计算的，所以系统直接将其赋为-128。

综合以上三点可知，char类型的补码其实是以从-1，-2，…，-127，-128，127，126，…，2，1这样的方式连续的。

画成图的形式为：

由以上两个图可知，内存中的数据存放为：

其实这又是一个无限循环的存放，一直存放满1000个数据为止。

而打印的是字符串长度，使用的是strlen函数，strlen函数遇到\0就停止计算，所以计算的结果应该为128 + 127 = 255。

7.
unsigned char i = 0;

int main()
{
     
	for (i = 0; i <= 255; i++)
	{
     
		printf("hello world\n");
	}

	return 0;
}

程序分析：

首先定义了一个全局变量：无符号整型i。

无符号的char类型范围是0~255，所以代码前面会打印255个"hello world\n"，这一点肯定没错。

而255作为无符号数在内存中的补码是：

00000000000000000000000011111111

自增1之后的结果是：

00000000000000000000000100000000

将这个数存放于变量i中必然是存不下，所以会发生截断。

只保留低八位存储，所以变量i现在存储的是00000000，也就是0，是一个无符号数，原反补相同，并且符合循环条件，所以循环又开始了。

经过上述分析，该代码的结果应该是一个无限打印的死循环。

浮点型数据在内存中的存储

首先我们先见一下常见的浮点型数据有哪些？

3.14159
1E10

浮点型数据类型：

float
double
long double

long double是在C99标准中引入的，比较老旧的编译器都不支持这种写法。

浮点数表示的范围：在"float.h"文件中可以查看。

在此文档中即可查看浮点型数据的范围大小。

接下来介绍浮点型数据在内存中的存储方式。

证明整数和浮点数的存取方式不同

浮点数存储的例子：

int main()
{
     
	int n = 9;
	float* pFloat = (float*)&n;

	printf("n的值为：%d\n", n);
	printf("*pFloat的值为：%f\n", *pFloat);

	*pFloat = 9.0;

	printf("num的值为：%d\n", n);
	printf("*pFloat的值为：%f\n", *pFloat);

	return 0;
}

打印结果为：

将9存放进int类型的变量i中，所以第一个打印是9，这很容易理解，而用float类型的指针对其解引用得到的值却是0；
用float指针类型将内存中的值覆盖为9.0，以整型的方式打印出来是我们不知道的值，而用float类型指针解引用得到了9.0。

以上例子证明了整型数据和浮点型数据的存储方式是截然不同的，接下来就
开始研究浮点型数据在内存中到底是以怎样的形式进行存储的。

IEEE标准形式

根据国际标准IEEE（电气和电子工程协会）754，任意一个二进制浮点数V可以表示为下面的形式：

(-1)^S ✖ M ✖ 2^E

(-1)^s表示符号位，当s = 0时，V为正数；当s = 1时，V为负数。

M表示有效数字，M必须大于等于1，且小于2。

2^E表示指数位。

举两个例子：

十进制数3.75，先将其转化为二进制数011.11

二进制数011就是十进制数3，小数点后面的第一个1表示1.0 / 2¹，第二个1表示1.0 / 2²
转换为IEEE标准形式为（-1）⁰ ✖ 1.111 ✖ 2¹
此时S = 0，M = 1.111，E = 1

十进制数-0.5，现将其转化为二进制数-0.1

二进制数0就是十进制数0，小数点后面的1表示1.0 / 2¹。
转换为IEEE标准形式为（-1）¹ ✖ 1.0 ✖2^-1。
此时S = 1，M = 1.0，E = -1

==注意：==小数点后面的数都是按照1.0 / 2ⁿ的形式相加得到的，所以很多数其实是得不到准确值的。

IEEE存储标准规定

IEEE 754规定：

对于32位的浮点数，最高的1位是符号位s，接着的8位是指数E，剩下的23位为有效数字M。

对于64位的浮点数，最高的1位是符号位S，接着的11位是指数E，剩下的52位为有效数字M。

画图说明：

对于单精度浮点数：

对于双精度浮点数：

IEEE 754对有效数字M和指数E，还有一些特别规定。

对于M（有效数字）的规定：

前面说过，1 ≤ M < 2 ，也就是说，M可以写成1.xxxxxx的形式，其中xxxxxx表示小数部分。
IEEE 754规定，在计算机内部保存M时，默认这个数的第一位总是1，因此可以被舍去，只保存后面的xxxxxx部分。比如保存1.01的时候，只保存01，等到读取的时候，再自动把第一位的1给加上去。这样做的目的是节省1位有效数字，以增加M的精度。
以32位浮点数为例，留给M的空间只有23位，将第一位的1舍去以后，等于可以保存24位有效数字。

对于E（指数部分）的规定：

至于指数E，情况就比较复杂。

首先，E为一个无符号整数（unsigned int），这意味着，如果E为8位，它的取值范围为0 ~ 255；如果E为11位，它的取值范围为0~2047。但是，我们知道，科学计数法中的E是可以出现负数的，所以IEEE 754规定，存入内存时E的真实值必须再加上一个中间数，对于8位的E，这个中间数是127；对于11位的E，这个中间数是1023。比如，2¹⁰的E是10，所以保存为32位浮点数时，必须保存为10 + 127 = 137，即10001001。

加上127或者1023进行存储的原因是取出该数的时候就需要减去127或者1023，这样E就可以得到负数的情况。

IEEE读取标准规定

指数E从内存中取出还可以再分成三种情况：

E不全为0或不全为1
这时，浮点数就采用下面的规则表示：
即指数E的计算值减去127（或1023），得到真实值，再将有效数字M前加上第一位的1。
比如：
十进制数0.5的二进制形式为0.1，由于规定整数部分必须为1，即将小数点右移1位，则为（-1）⁰ ✖ 1.0 ✖ 2^（-1），其阶码（指数部分）为-1 + 127 = 126，表示为01111110，而有效位部分1.0去掉整数部分为0，补齐0到23
位00000000000000000000000，则其二进制表示形式为:
0 01111110 00000000000000000000000

E全为0
可以理解为E为全0时，该数被解析为0。
因为，当E为全0时，说明以IEEE标准形式写出的式子的指数部分是-127或者-1023，也就是说符号位和有效位要乘以1.0 / 2¹²⁷或者乘以1.0 / 2¹⁰²³的数，而这个数非常小，近乎为0，所以在内存中取出该数时通过一些办法直接将其翻译为0。

E全为1
这时，表示±无穷大（正负取决于符号位S）；
原因是，如果E全为1，则指数位计算的是128,2¹²⁸次方是一个非常大的数字，所以这里我们可以认为他是正负无穷大。

举个简单的例子，如十进制数-12.75，转换为二进制数为：-1100.11，转换为IEEE标准形式为（-1）¹ ✖ 1.10011 ✖ 2 ³，此时的S = -1， M = 1.10011，E = 3

以单精度浮点型为例，将其存入内存的方式为：把S放在第一位作为符号位，E加上127，即3 + 127 = 130转化为二进制数10000010，把M的整数部分去掉，将小数部分存储，E和M不够的位全部补0。

即

1 10000010 10011000000000000000000

在VS2019编译器上测试：

int main()
{
     
	float f = -12.75;

	return 0;
}

调试 - 内存 - &f：

编译器的形式为十六进制

将其翻译为二进制为：

00000000 00000000 01001100 11000001

而我们刚才的计算结果是：

11000001 01001100 00000000 00000000

可以发现，和我们写的正号相反，这说明浮点型数据在内存中存储也遵循大小端字节序规则，且这里遵循的是小端字节序。

最后，我们在来看最开始给出的那道例题：

int main()
{
     
	int n = 9;
	float* pFloat = (float*)&n;

	printf("n的值为：%d\n", n);
	printf("*pFloat的值为：%f\n", *pFloat);

	*pFloat = 9.0;

	printf("num的值为：%d\n", n);
	printf("*pFloat的值为：%f\n", *pFloat);

	return 0;
}

程序分析：

第一次赋值时，将9赋值给n，属于整型数据存储。

其二进制序列为：

000000000000000000000000000001001

第一次打印为整型打印，输出为9
第二次打印为浮点型打印，就要以浮点型数据的方式取出：

0 00000000 000000000000000000001001

第一部分为S（符号位），第二部分为E（指数位（需要减去127/1023）），第三部分为M（有效位（小数部分））

符号位为0，说明是正数，指数位为全0，减去127后得到-127，放在指数部分是2^-127，即1.0 / 2¹²⁷，是一个非常小的数，无论M（有效位）为多少，这里都将翻译为0，所以第二次打印结果输出为0.0。

第二次赋值时，是以浮点型存储方式进行赋值。

十进制数9.0，转换为二进制数为1001.0，转换为IEEE标准格式为（-1）⁰ ✖ 1.001 ✖ 2³。
其中S = 0，M = 1.001，E = 3
进行二进制存储时，第一位放符号位，后8位放E+127的二进制序列，其余位放M的小数部分。

即

0 10000010 00100000000000000000000

第三次打印结果为将这个二进制数翻译为十进制。

即1091567616‬

所以，第三次打印结果为1091567616‬

第四次打印为按浮点数打印，即按浮点数形式取出数据，所以第四次从打印结果为9.0。

打印结果：

总结

本文内容较多，首先介绍了各个数据类型，又介绍了编译器中的大小端存储模式，接着讲解了2015年百度系统工程师的一道笔试题，在整型数据内存存储中介绍了原反补、截断和整型提升的概念，并进行了7道题目的训练，最后根据IEEE协会讲述了浮点型数据在内存中的数据，可谓干货慢慢，建议大家收藏下来慢慢看。

最后我是Aaron，希望今天的博文对各位有帮助，别忘了三连支持哇~

点赞 + 关注 + ✔收藏✔

如果以上内容有任何不懂的地方欢迎评论区留言或者私信博主哦~

你可能感兴趣的:(C重点突破,c语言)

Guns框架基本介绍、下载、部署 liban121 Guns
什么是Guns?1、快速构建后台管理系统的框架（注意：是后台管理系统）2、Guns默认提供诸多业务系统的基本功能3、Guns集成诸多优秀的开源框架基本功能权限管理（用户管理，角色管理，部门管理）菜单管理，字典管理，业务日志，登录日志，监控管理，通知管理，代码生成（核心）Guns的部署第一步：下载Guns：https://gitee.com/stylefeng/guns版本选择:第二步：导入IDEA
软件工程之信息系统集成我叫吴桂鑫计算机基础知识软件工程信息系统集成
现在的软件开发工作大多数是集成，所有部分都从头开发效率会很低，问题也会更多，成本也会更高。系统集成就是将各类资源有机、高效地整合到一起，形成一个完整的系统。信息系统集成包括网络集成、数据集成和应用集成等。网络集成、数据集成和应用集成分别用于解决系统的互连性、互通性和互操作性。（1）网络集成（企业局域网）重点是系统中异构网络的互连。（2）数据集成（大数据）重点是系统中异构数据集的互通使用和统一管理。
yum安装报错“Could not resolve host: mirrorlist.centos.org；未知的错误“ 与太 centos linux 运维
问题：yuminstall-ynginx已加载插件：fastestmirror,langpacksLoadingmirrorspeedsfromcachedhostfileCouldnotretrievemirrorlisthttp://mirrorlist.centos.org/?release=7&arch=x86_64&repo=os&infra=stockerrorwas14:curl#6
golang网络编程之UDP可靠传输协议QUIC SMILY12138 网络 golang
Golang是一种高效、简洁的编程语言，在网络编程中，Golang通过其强大的标准库支持QUIC协议的UDP可靠传输。QUIC（QuickUDPInternetConnections）是一个基于UDP协议的可靠传输协议，它通过使用TLS1.3实现了端到端加密。在Golang中，我们可以使用quic-go包来实现QUIC协议的UDP可靠传输。下面是一个简单的例子：packagemainimport(
Centos7.9 yum kernal 更新 mcharleylei linux centos
Centos7ISO下载：https://vault.centos.org/下载较快https://mirrors.huaweicloud.com/centos/7/isos/x86_64/下载较快centos-7.9.2009-isos-x86_64安装包下载_开源镜像站-阿里云Centosyum源更新下载阿里yum源wgethttp://mirrors.aliyun.com/repo/Cent
报错：Error rendering ‘com.atlassian.jira.jira-project-config-plugin:summary-priorities‘. Lakers2015 Jira知识库 jira bug
项目场景：使用Jira系统自带的创建项目选项创建新项目。问题描述：新创建的项目的优先级方案部分报错：报错信息：Errorrendering'com.atlassian.jira.jira-project-config-plugin:summary-priorities'.PleasecontactyourJiraadministrators.且在新建的项目中新建Issue时，优先级字段没有选项（因
分解质因数，求最大公约数和最小公倍数 2401_86161528 c++linux
3个c++程序分解质因数，求最大公约数和最小公倍数，方便数学计算1.分解质因数##includeusingnamespacestd;intmain(){while(1){longlongx,c=0,count=2;cout>x;cout=2){while((c!=0||countusingnamespacestd;longlonglcm(longlongx,longlongy);intmain()
5.5 行高的取值 2401_83398041 css基础 css
行高的取值line-heightpx、像素值em没有单位Document.container{/*无论怎么设置，最终会转换为px单位*//*line-height:30px;*//*em：行高是字体大小的两倍*//*em：先计算像素值，再继承，那么p1、p2的line-height为container的字体大小的两倍*//*line-height:2em;*//*没有单位：先继承，再计算为像素值*
Windows电脑安装USB Redirector并实现内外网跨网USB共享通信访问春人. 春人闲谈 windows 电脑
文章目录前言1.安装下载软件1.1内网安装使用USBRedirector1.2下载安装cpolar内网穿透2.完成USBRedirector服务端和客户端映射连接3.设置固定的公网地址前言我们每天都在与各种智能设备打交道，从手机到电脑，再到各种外设，它们已经成为了生活中不可或缺的一部分。但你有没有遇到过这样的烦恼：明明有一个重要的文件存储在U盘里，却因为不在身边而无法访问？或者你的打印机只能连接一
jira.issueviews yaoshengting jira jira
jira.issueviews是JIRA提供的一种功能，用于以多种格式（如Excel、XML、RSS、Word等）导出查询结果或单个Issue的详细信息。这一功能特别适用于JIRAServer和JIRADataCenter环境，方便用户将数据导出并进一步分析或分享。以下是对jira.issueviews的详细介绍：1.功能概述jira.issueviews提供了多种数据导出格式，用户可以通过特定的
dockerfile中from命令无法拉取镜像而docker的pull命令能拉取镜像容器云服务 docker 容器运维
问题现象：dockerpullimages拉取镜像正常dockerfile中的from命令拉取镜像就会报出证书错误。报错信息如下：[bjxtb@wj-kvm-test-jenkins-6-243ceshi_dockerfile]$dockerbuild.[+]Building0.4s(3/3)FINISHEDdocker:default=>[internal]loadbuilddefinition
如何实现gitlab和jira连通 Channing Lewis Python gitlab jira
将GitLab和Jira集成起来可以实现开发任务与代码变更的联动，提高团队协作效率。以下是实现两者连通的详细步骤：1.确保必要条件在进行集成之前，确保以下条件满足：你有GitLab和Jira的管理员权限。Jira是JiraCloud或JiraServer（需版本7.2或更高）。GitLab是可以访问Jira的网络环境。2.配置GitLab中的Jira集成2.1进入GitLab项目设置登录GitLa
golang网络编程编程小猹 go学习 go 网络编程
socket编程socket图解Socket是BSDUNIX的进程通信机制，通常也称作”套接字”，用于描述IP地址和端口，是一个通信链的句柄。Socket可以理解为TCP/IP网络的API，它定义了许多函数或例程，程序员可以用它们来开发TCP/IP网络上的应用程序。电脑上运行的应用程序通常通过”套接字”向网络发出请求或者应答网络请求。Socket又称“套接字”，应用程序通常通过“套接字”向网络发出
AirSim python通信环境配置和无人机控制 fegxg 无人机 python
本人学习课程链接【AirSim】无人机踏上飞行的征途——第三课-AirSim&Python通信环境配置以及无人机起飞降落、位置控制&速度控制_哔哩哔哩_bilibili，本系列文章对其代码做一个总结和解读一、起飞降落importairsim#connecttotheAirsimsimulatorclient=airsim.MultirotorClient()client.confirmConnec
深入理解Python的@staticmethod和@classmethod装饰器清水白石008 Python题库 python 开发语言 python 开发语言
深入理解Python的@staticmethod和@classmethod装饰器引言在Python的面向对象编程中，类方法和静态方法是除了实例方法之外的两种重要方法类型。它们允许我们在不创建类实例的情况下调用类的方法，或者在调用时直接引用类本身。Python提供了@staticmethod和@classmethod这两个装饰器，用于定义类方法和静态方法。然而，许多初学者可能会对这两种方法感到困惑，
【树莓派入门系列】opencv安装 ^Mark_Zhang^ python opencv 人工智能
树莓派入门之Opencv库安装提示：本文树莓派4B所搭载的系统是Raspi11本教程不需要任何换源，直接用树莓派自带的源就行文章目录一、树莓派版本查看二、Opencv库安装1.扩大系统文件（常规操作）2.安装aptitude软件包3.CMake工具安装4.基础库安装5.opencv-python库5.注意点一、树莓派版本查看代码如下：uanme-a或lsb_release-a二、Opencv库安装
Mybatis源码学习（七）——ResultSetHandler 结果处理 Laplaces Demon mybatis 学习
通过之前对StatementHandler类（Mybatis源码学习（五）——StatementHandler-CSDN博客）的分析发现在所有StatementHandler接口的实现类，无论是PreparedStatementHandler、CallableStatementHandler还是SimpleStatementHandler都是使用ResultSetHandler对象对结果（包括Li
10-2.Android BuildConfig 之获取版本号与版本名（通过 BuildConfig 类方式获取、通过 PackageInfo 方式获取）我命由我12345 Android -简化编程开发语言 java-ee java android android-studio android studio android runtime
一、版本号与版本名版本号（versionCode）是一个整数，用于内部版本控制，每次发布新版本时，版本号必须递增，Android系统使用版本号来判断应用的更新版本名（versionName）是一个字符串，通常用于向用户展示应用的版本信息，它可以是任意格式，常见的格式是主版本号.次版本号.修订号（例如，1.0.0）二、定义版本号与版本名在模块级build.gradle文件中，定义版本号与版本名and
Oracle查看表空间使用情况假面生 Oracle oracle sql 数据库
--查询表空间使用情况SELECTUPPER(F.TABLESPACE_NAME)"表空间名",D.TOT_GROOTTE_MB"表空间大小(G)",D.TOT_GROOTTE_MB-F.TOTAL_BYTES"已使用空间(G)",TO_CHAR(ROUND((D.TOT_GROOTTE_MB-F.TOTAL_BYTES)/D.TOT_GROOTTE_MB*100,2),'990.99')||'%
在Ubuntu上使用Apache+MariaDB安装部署Nextcloud并修改默认存储路径戴草帽的大z ubuntu linux 经验分享 nextcloud php apache mariadb
一、前言Nextcloud是一款开源的私有云存储解决方案，允许用户轻松搭建自己的云服务。它不仅支持文件存储和共享，还提供了日历、联系人、任务管理、笔记等丰富的功能。本文将详细介绍如何在Ubuntu22.04LTS上使用Apache和MariaDB安装部署Nextcloud，并修改默认存储路径为/home/nextcloud_data。二、环境操作系统：Ubuntu22.04LTSWeb服务器：Ap
android11中删除一些不需要的应用路奇的电脑 java
我们在定制android11的需求的时候，有时候客户不想要一些应用，需要我们移除掉这些应用，为了节省大家的时间，我这边举例了几个删除的例子具体的路径是在build/make下diff--gita/target/product/handheld_product.mkb/target/product/handheld_product.mk---a/target/product/handheld_pro
Kmeans与KMedoids聚类对比以及python实现呵呵爱吃菜 kmeans 聚类 python
在机器学习领域，聚类算法是一种常用的无监督学习方法，用于将数据集中的样本划分为若干个簇，使得同一簇内的样本尽可能相似，而不同簇之间的样本尽可能不同。K-Means和K-Medoids是两种经典的聚类算法，它们都基于划分的思想，但在具体实现和应用场景上存在一些差异。一、算法原理1.K-Means:中心点选择:K-Means算法通过计算簇内所有样本的均值来确定中心点（centroid）。距离度量:通常
ChatGPT是强人工智能吗? 呵呵爱吃菜 chatgpt 人工智能
ChatGPT是强人工智能吗?本文从人工智能发展的三个阶段的角度,分析当前强大的AI大模型所处的阶段,并通过对比各阶段的定义,明确各阶段的特点和未来发展方向;NarrowAI（弱人工智能）、AGI（人工通用智能）和ASI（人工超级智能）代表了人工智能发展的三个不同阶段，它们在智能水平、任务范围和应用场景上存在显著差异。以下是它们的总结与对比：1.定义与特点类型NarrowAI（弱人工智能）AGI（
LE Audio 百态老人 android
LEAudio是一种基于蓝牙5.2协议的全新音频技术标准。2020年，蓝牙技术联盟在CES上发表了蓝牙核心规范5.2版本，同年，新一代蓝牙音讯技术标准LEAudio低功耗音讯传输技术也随之问世。LEAudio有诸多亮点。首先是全新的编解码器LC3，它在低传输速率下仍能保持较高的音频质量，且具有更低的功耗和更短的延迟，其采样率可在8-48KHz浮动自行设置，LEAudio的延迟可以做到低至20ms，
Spring注解09——BeanPostProcessor后置处理器深度剖析大黄奔跑 Spring注解驱动
该系列文章主要学习雷丰阳老师的《Spring注解驱动》课程总结。原课程地址：课程地址包括了自己阅读其他书籍《Spring揭秘》《SpringBoot实战》等课程。该系列文档会不断的完善，欢迎大家留言及提意见。文章目录1.写在之前2.BeanPostProcessor是什么3.xxxBeanPostProcessor源码分析4.Spring框架用该接口干嘛呢？总结1.写在之前本篇会有一些源码的分析，
autosar can协议栈源码解读_AUTOSAR通信篇—CANTP模块 weixin_39560657 autosar can协议栈源码解读
AUTOSAR基础软件中的通讯，前文已经介绍过COM模块和PduR模块：Demu大叔：AUTOSAR通信篇—AUTOSARCOM模块zhuanlan.zhihu.comDemu大叔：AUTOSAR通信篇—PduR模块zhuanlan.zhihu.com今天介绍PduR模块的下层模块—CANTP模块。1CANTP的位置和作用CanTp是PduR和CANIf模块之间的模块，如图1所示。CANTp模块的
mongodb数据库备份迁移 windows -> linux weixin_30597269 数据库操作系统 json
mongodb数据库备份迁移windows->linuxcd到本机mongodb的安装目录如：C:\ProgramFiles\MongoDB\Server\3.4\bin可以发现里面除了可以启动mongodb的mongod.exe还有很多启动程序其中mongodump.exe和mongorestore.exe就分别是用来数据备份迁移的mongodump备份数据库常用命令格mongodump-hIP
c语言指针 pdf,深入理解c指针 PDF扫描版[33MB] origami dance c语言指针 pdf
深入理解C指针内容简介：深入理解C指针和内存管理，提升编程效率！这是一本实战型图书，通过它，读者可以掌握指针动态操控内存的机制、对数据结构的增强支持，以及访问硬件等技术。本书详细阐述了如何在数组、字符串、结构体和函数中使用指针，同时演示了相应的内存模型及其对指针使用的影响。指针为C语言带来了强大的功能和灵活性，却也是C语言中最难啃的一块“骨头”。本书旨在帮读者透彻理解指针，解决这个老大难问题。不论
Python staticmethod weixin_30449239 python
1@staticmethod静态方法whenthismethodiscalled,wedon'tpassaninstanceoftheclasstoit(aswenormallydowithmethods).Thismeansyoucanputafunctioninsideaclassbutyoucan'taccesstheinstanceofthatclass(thisisusefulwheny
Django常用ORM 程序猿_小天 Django django django orm
聚合分组Sum函数将None变为0xx=Coalesce(Sum('number'),0,output_field=CharField())跨表分组去重#B表中有一个外键表是A,即a=models.ForeignKey(A)a_queryset=BigData.objects.filter(pk=OuterRef("a")).annotate(Sum('number',distinct=True)
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_