零基础玩转C语言进阶系列第八章——深度剖析数据在内存中的存储-CFANZ编程社区

一、数据类型介绍

类型的基本归类

整型家族

浮点数家族

构造类型

指针类型

空类型

二、整型在内存中的存储

原码、反码、补码

大小端介绍

练习题（内功）

三、浮点数在内存中的存储

浮点数存储规则

【前言】

现在进入到C语言进阶部分的知识点讲解，写的比较深入，属于程序员的“内功” 哦，切记要Good Good Study 这部分知识，加油啦！

【本章重点】

数据类型详细介绍
整型在内存中的存储：原码、反码、补码
大小端字节序介绍及判断
浮点数在内存中的存储解析

一、数据类型介绍

基本内置数据类型：

char 1个字节

short 2个字节

int 4个字节

long （比较特殊，C语言规定long不小于int即可）

long long 8个字节

float 4个字节

double 8个字节

【敲黑板】：C99之后才支持布尔类型，但是要求编译器支持C99标准才行

类型的基本归类

整型家族

char 
    unsigned char
    signed char
short
    unsigned short int
    signed short int
int 
    unsigned int
    signed int
long 
    unsigned long int
    signed long int

【注意】：char != signed char ，char到底是signed char 还是 unsigned char是取决于编译器实现的，不过，常见的编译器下char 就是 signed char

看一道例题：

#include<stdio.h>

int main()
{
  unsigned int num = -10;
  printf("%d\n", num);
  printf("%u\n", num);
  return 0;
}

输出结果：

零基础玩转C语言进阶系列第八章——深度剖析数据在内存中的存储_职场和发展

是不是很疑惑为什么打印的结果是这样的？别着急，请往后面看...

浮点数家族

float
double

构造类型

数组类型
结构体类型 struct
枚举类型 enum
联合类型 union

指针类型

int* pi;
char* pc;
float* pf;
void* pv;//无具体类型的指针

空类型

void 表示空类型（无类型）
通常应用于函数的返回类型、函数的参数、指针类型

二、整型在内存中的存储

对于整型类型，我们可以在limits.h头文件中查看它们的数据范围。

我们之前讲过一个变量的存储是要在内存中开辟空间的。空间的大小取决于不同的数据类型。接下来我们谈谈数据在所开辟内存中到底是如何存储的？

比如：

int a = 20;
int b = -10;

我们知道为a 分配了4个字节的空间。

那如何存储？请朝下看...

原码、反码、补码

【注意】：原码、反码和补码的概念只针对于整数来说，与浮点数无关！

计算机中的整数有三种表示方法，即原码、反码和补码。而内存中存的是二进制的补码。

三种表示方法均有符号位和数值位两部分，符号位用“0” 表示正，用“1” 表示负，而数值位负整数的三种表示方法各不相同。

下面看看负整数的三种表示方法：

原码：直接将二进制按照正负数的形式翻译成二进制即可；

反码：原码的符号位不变，其它位按位取反；

补码：反码+1得到补码

对于正数和无符号整数来说，原码、反码和补码都相同。

零基础玩转C语言进阶系列第八章——深度剖析数据在内存中的存储_补码_02

对于整型来说：数据存放在内存中其实存放的是补码。

为什么呢？

在计算机系统中，数值一律用补码来表示和存储。原因在于，使用补码，可以将符号位和数值域统一处理；同时，加法和减法也可以统一处理（CPU只有加法器）。此外，补码和原码相互转换，其运算过程是相同的，不需要额外的硬件电路。

为什么说补码和原码相互转换，其运算过程是相同的呢？

比如 -1：

零基础玩转C语言进阶系列第八章——深度剖析数据在内存中的存储_浮点数_03

大小端介绍

看一下下面这段代码：

#include<stdio.h>

int main()
{
  int a = 0x11223344;

  return 0;
}

实际上在内存中存储的是：

零基础玩转C语言进阶系列第八章——深度剖析数据在内存中的存储_浮点数_04

在内存中存储的顺序不对呀，这是为什么？这里就要介绍大小端了。

什么是大端小端？

大端字节序存储：

当一个数据的低位放到高地址处，数据的高位放到低地址处；

小端字节序存储：

当一个数据的低位放到低地址处，数据的高位放到高地址处。

比如：

零基础玩转C语言进阶系列第八章——深度剖析数据在内存中的存储_补码_05

怎么能表示本章讲解的重要性呢？下面看看15年百度的一道价值10分的笔试题！

百度2015年系统工程师笔试题（10分）：

请简述大端字节序和小端字节序的概念，设计一个小程序来判断当前机器的字节序。

概念的话都在上面啦，请看看如何设计小程序来判断...

思路：

可以定义一个整数，并且初始化为1，所以它转换成十六进制表示形式就是0x00 00 00 01

如果当前机器是小端字节序存储，那么从低地址到高地址就是 01 00 00 00；如果当前机器是大端字节序存储，那么从低地址到高地址就是00 00 00 01，所以不同点就在于低地址处一个是00 ，一个是01，那怎么判断呢？这里可以利用指针进行解引用的操作，不过对于整形指针来说一次访问4个字节，不是我们想要的，所以要进行强制类型转换，转换成char* 类型的，这样的话进行解引用操作的时候，一次就只能访问一个字节的内容了。

#include<stdio.h>

int main()
{
  int a = 1;//00 00 00 01
  char* p = (char*)&a;
  if (1 == *p)
  {
    printf("小端\n");
  }
  else
  {
    printf("大端\n");
  }
  return 0;
}

上面这段代码只是方便大家理解，实际上我们交给面试官看的话，这么写代码就显得很low啦，所以下面才是满分答案：

#include<stdio.h>

int check_sys()
{
  int a = 1;//0x00 00 00 01
  return (*(char*)&a);//返回0-大端；返回1-小端
}

int main()
{
  int ret = check_sys();
  if (1 == ret)
  {
    printf("小端\n");
  }
  else
  {
    printf("大端\n");
  }
  return 0;
}

练习题（内功）

练习一：

#include<stdio.h>

int main()
{
  char a = -1;
  signed char b = -1;
  unsigned char c = -1;
  printf("a = %d b = %d c = %d\n", a, b, c);//输出-1 -1 255

  return 0;
}

零基础玩转C语言进阶系列第八章——深度剖析数据在内存中的存储_浮点数_06

插播一条毒鸡汤：达克效应曲线

零基础玩转C语言进阶系列第八章——深度剖析数据在内存中的存储_浮点数_07

当我们觉得自己现阶段学习比较吃力的时候，不要害怕，不要焦虑，说明此时你正在慢慢进步，所以做好自己需要做的事，成为那个笑到最后的人。

练习二：

#include<stdio.h>

int main()
{
  char a = -128;
  printf("%u\n", a);//输出4294967168
  return 0;
}

零基础玩转C语言进阶系列第八章——深度剖析数据在内存中的存储_浮点数_08

练习三：

#include<stdio.h>

int main()
{
  char a = 128;
  printf("%u\n", a);//输出4294967168
  return 0;
}

这里就不做解释咯，跟练习二相似。

练习四：

#include<stdio.h>

int main()
{
  int i = -20;
  unsigned j = 10;
  printf("%d\n", i + j);//输出-10
  return 0;
}

零基础玩转C语言进阶系列第八章——深度剖析数据在内存中的存储_c语言_09

练习五：

#include<stdio.h>


int main()
{
  unsigned int i;//i里面的任何值都是大于等于0的
  for (i = 9; i >= 0; i--)//所以循环条件i大于等于0恒成立
  {
    printf("%u\n", i);
  }
  return 0;
}

零基础玩转C语言进阶系列第八章——深度剖析数据在内存中的存储_后端_10

为什么会出现上面这种情况呢？这里我只要点一下就明白啦。

i == 0 时，此时i--,i 变成了-1，以%u的形式打印-1，结果就是4294967295

练习六：

#include<stdio.h>
#include<string.h>
int main()
{
    char a[1000];
    int i = 0;
    for (i = 0; i < 1000; i++)
    {
        a[i] = -1 - i;
    }
    printf("%d\n", strlen(a));//输出255
    //strlen()关注点在于是否有\0,而\0的ASCII码值是0
    return 0;
}

零基础玩转C语言进阶系列第八章——深度剖析数据在内存中的存储_浮点数_11

零基础玩转C语言进阶系列第八章——深度剖析数据在内存中的存储_浮点数_12

练习七：

#include<stdio.h>

int main()
{
  unsigned char i = 0;//i的范围是0~255
  for (i = 0; i <= 255; i++)//所以循环条件恒成立
  {
    printf("hello world\n");//死循环打印
  }
  return 0;
}

【敲黑板】：以后在使用无符号数的时候一定要格外小心，所以需要谨慎使用！

零基础玩转C语言进阶系列第八章——深度剖析数据在内存中的存储_补码_13

三、浮点数在内存中的存储

对于浮点数来说，我们可以在float.h头文件下查看数据范围

下面简单看一道例子：

#include<stdio.h>

int main()
{
  int n = 9;
  float* pFloat = (float*)&n;
  printf("n的值为:%d\n", n);
  printf("*pFloat的值为:%f\n", *pFloat);

  *pFloat = 9.0;
  printf("n的值为:%d\n", n);
  printf("*pFloat的值为:%f\n", *pFloat);
  return 0;
}

看到上面的代码，想必我们都有了自己的答案，下面看看正确答案长什么样...

零基础玩转C语言进阶系列第八章——深度剖析数据在内存中的存储_后端_14

惊不惊喜意不意外，为毛答案长这个样子？有问题就会有答案，答案在后面啦

浮点数存储规则

n 和 *pFloat在内存中明明是同一个数，为什么浮点数和整数的解读结果会差别这么大？想要理解上面的结果，就一定要搞懂浮点数在计算机内部的表示方法。

详细解读：根据国际标准IEEE（电气与电子工程学会）754，任意一个二进制浮点数V可以表示成下面的形式：

(-1) ^ S * M * 2 ^ E
(-1) ^ S 表示符号位，当S = 0, V为正数；当 S = 1，V为负数
M表示有效数字，大于等于1，小于2
2 ^ E表示指数位

举例来说：

十进制的5.0，写成二进制表示形式是101.0，相当于1.01 * 2 ^ 2，按照上面V的格式，可以得出S = 0，M = 1.01，E = 2

IEEE754规定：

对于32位的浮点数，最高的一位是符号位S，接着的8位是指数E，剩下的23位是有效数字M

零基础玩转C语言进阶系列第八章——深度剖析数据在内存中的存储_c语言_15

对于64位的浮点数，最高的1位是符号位S，接着的11位是指数E，剩下的52位是有效数字M

零基础玩转C语言进阶系列第八章——深度剖析数据在内存中的存储_补码_16

当然，IEEE754对有效数字M 和指数 E，还有一些特别的规定。

前面说过M>= 1 && M<2，M可以写成1.xxxxxxx的形式，其中xxxxxxx表示小数部分，规定在计算机内部保存M时，默认这个数的第一位总是1，因此可以被舍去，只保存后面xxxxxxx部分。比如保存1.01的时候，只保存01，等到读取的时候，再把第一位的1加上去。这样做的目的，是节省一位有效数字。

至于指数E，情况就比较复杂。

首先，E是一个无符号整数，这意味着，如果E为8位，它的取值范围就是0~255，如果E为11位，它的取值范围就是0~2047.但是我们知道，科学计数法中的E是可以出现负数的，所以规定，存入内存时E的真实值必须再加上一个中间数，对于8位的E，这个中间数是127，对于11位的E，这个中间数是1023。

比如，2^10的E是10，所以保存成32位浮点数时，必须保存成10+127 = 137，即10001001。然后，指数E从内存中取出还可以再分成三种情况：

1.E不全为0或不全为1：

指数E的计算值减去127（或是1023），得到真实值，再将有效数字M前加上第一位的1

比如：

0.5的二进制形式为0.1，由于规定整数部分必须为1，所以写成1.0*2^(-1) ， E存入内存中是-1 + 127 = 126，表示为01111110，而尾数1.0去掉整数部分为0，补齐0到23位00000000 00000000 0000000，所以0.5的二进制表示形式为0 01111110 00000000000000000000000

2.E全为0

浮点数的指数E等于1-127（或是1-1023），即为真实值

有效数字M不再加上第一位的1，而是还原为0.xxxxxxx的小数。这样做是为了表示正负0，以及接近于0的很小的数字。

3.E为全1

这时，如果有效数字M全为0，表示正负无穷大，两个极端。

所以此时再来看前面的例题就会柳暗花明了。

#include<stdio.h>

int main()
{
  int n = 9;
  float* pFloat = (float*)&n;
  printf("n的值为:%d\n", n);
  printf("*pFloat的值为:%f\n", *pFloat);

  *pFloat = 9.0;
  printf("n的值为:%d\n", n);
  printf("*pFloat的值为:%f\n", *pFloat);
  return 0;
}