C语言指针,这可能是史上最干最全的讲解啦(附代码)!!!

发布时间:2022-09-07 11:30

点击上方“大鱼机器人”,选择“置顶/星标公众号”

福利干货,第一时间送达!

指针对于C来说太重要。然而,想要全面理解指针,除了要对C语言有熟练的掌握外,还要有计算机硬件以及操作系统等方方面面的基本知识。所以本文尽可能的通过一篇文章完全讲解指针。

为什么需要指针?

指针解决了一些编程中基本的问题。

✅指针的使用使得不同区域的代码可以轻易的共享内存数据。当然小伙伴们也可以通过数据的复制达到相同的效果,但是这样往往效率不太好。

因为诸如结构体等大型数据,占用的字节数多,复制很消耗性能。

但使用指针就可以很好的避免这个问题,因为任何类型的指针占用的字节数都是一样的(根据平台不同,有4字节或者8字节或者其他可能)。

指针使得一些复杂的链接性的数据结构的构建成为可能,比如链表,链式二叉树等等。

有些操作必须使用指针。如操作申请的堆内存。

还有:C语言中的一切函数调用中,值传递都是“按值传递”的。

如果我们要在函数中修改被传递过来的对象,就必须通过这个对象的指针来完成。

计算机是如何从内存中进行取指的?

计算机的总线可以分为3种:数据总线,地址总线和控制总线。这里不对控制总线进行描述。数据总线用于进行数据信息传送。数据总线的位数一般与CPU的字长一致。

一般而言,数据总线的位数跟当前机器int值的长度相等。例如在16位机器上,int的长度是16bit,32位机器则是32bit。这个计算机一条指令最多能够读取或者存取的数据长度。大于这个值,计算机将进行多次访问。这也就是我们说的64位机器进行64位数据运算的效率比32位要高的原因,因为32位机要进行两次取指和运行,而64位机却只需要一次!


地址总线专门用于寻址,CPU通过该地址进行数据的访问,然后把处于该地址处的数据通过数据总线进行传送,传送的长度就是数据总线的位数。地址总线的位数决定了CPU可直接寻址的内存空间大小,比如CPU总线长32位,其最大的直接寻址空间长232KB,也就是4G。

这也就是我们常说的32位CPU最大支持的内存上限为4G(当然,实际上支持不到这个值,因为一部分寻址空间会被映射到外部的一些IO设备和虚拟内存上。现在通过一些新的技术,可以使32位机支持4G以上内存,但这个不在这里的讨论范围内)。

一般而言,计算机的地址总线和数据总线的宽度是一样的,我们说32位的CPU,数据总线和地址总线的宽度都是32位。

计算机访问某个数据的时候,首先要通过地址总线传送数据存储或者读取的位置,然后在通过数据总线传送需要存储或者读取的数据。一般地,int整型的位数等于数据总线的宽度,指针的位数等于地址总线的宽度。

 

计算机的基本访问单元

 

学过C语言的人都知道,C语言的基本数据类型中,就属char的位数最小,是8位。我们可以认为计算机以8位,即1个字节为基本访问单元。小于一个字节的数据,必须通过位操作来进行访问。

 

内存访问方式

如图1所示,计算机在进行数据访问的时候,是以字节为基本单元进行访问的,所以可以认为,计算每次都是从第p个字节开始访问的。访问的长度将由编译器根据实际类型进行计算,这在后面将会进行讲述。

 

C语言指针,这可能是史上最干最全的讲解啦(附代码)!!!_第1张图片

内存访问方式

 

想要了解更多,就去翻阅计算机组成原理和编译原理吧。

 

sizeof关键字

sizeof关键字是编译器用来计算某些类型的数据的长度的,以字节为基本单位。例如:

sizeof(char)=1;         sizeof(int)=4;

sizeof(Type)的值是在编译的时候就计算出来了的,可以认为这是一个常量!

指针是什么?

我们知道:C语言中的数组是指一类类型,数组具体区分为  int 类型数组,double类型数组,char数组 等等。

同样指针这个概念也泛指一类数据类型,int指针类型,double指针类型,char指针类型等等。

通常,我们用int类型保存一些整型的数据,如 int num = 97 , 我们也会用char来存储字符:char ch = 'a'。

我们也必须知道:任何程序数据载入内存后,在内存都有他们的地址,这就是指针。

而为了保存一个数据在内存中的地址,我们就需要指针变量。

因此:指针是程序数据在内存中的地址,而指针变量是用来保存这些地址的变量。

 C语言指针,这可能是史上最干最全的讲解啦(附代码)!!!_第2张图片

在我个人的理解中,可以将指针理解成int整型,只不过它存放的数据是内存地址,而不是普通数据,我们通过这个地址值进行数据的访问,假设它的是p,意思就是该数据存放位置为内存的第p个字节。

当然,我们不能像对int类型的数据那样进行各种加减乘除操作,这是编译器不允许的,因为这样错是非常危险的!

图2就是对指针的描述,指针的值是数据存放地址,因此,我们说,指针指向数据的存放位置。

 

C语言指针,这可能是史上最干最全的讲解啦(附代码)!!!_第3张图片

指针的长度

我们使用这样的方式来定义一个指针:

Type *p;


我们说p是指向type类型的指针,type可以是任意类型,除了可以是char,short, int, long等基本类型外,还可以是指针类型,例如int *, int **, 或者更多级的指针,也可是是结构体,类或者函数等。于是,我们说:


int * 是指向int类型的指针;

int **,也即(int *) *,是指向int *类型的指针,也就是指向指针的指针;

int ***,也即(int **) *,是指向int**类型的指针,也就是指向指针的指针的指针;

…我想你应该懂了


struct xxx *,是指向struct xxx类型的指针;


其实,说这么多,只是希望大家在看到指针的时候,不要被int ***这样的东西吓到,就像前面说的,指针就是指向某种类型的指针,我们只看最后一个*号,前面的只不过是type类型罢了。


细心一点的人应该发现了,在“什么是指针”这一小节当中,已经表明了:指针的长度跟CPU的位数相等,大部分的CPU是32位的,因此我们说,指针的长度是32bit,也就是4个字节!注意:任意指针的长度都是4个字节,不管是什么指针!(当然64位机自己去测一下,应该是8个字节吧。。。)


 于是:

Type *p;


izeof(p)的值是4,Type可以是任意类型,char,int, long, struct, class, int **…


以后大家看到什么sizeof(char*), sizeof(int *),sizeof(xxx *),不要理会,统统写4,只要是指针,长度就是4个字节,绝对不要被type类型迷惑!

 

为什么程序中的数据会有自己的地址?

弄清这个问题我们需要从操作系统的角度去认知内存。

电脑维修师傅眼中的内存是这样的:内存在物理上是由一组DRAM芯片组成的。

C语言指针,这可能是史上最干最全的讲解啦(附代码)!!!_第4张图片

而作为一个程序员,我们不需要了解内存的物理结构,操作系统将RAM等硬件和软件结合起来,给程序员提供的一种对内存使用的抽象。

这种抽象机制使得程序使用的是虚拟存储器,而不是直接操作和使用真实存在的物理存储器。

所有的虚拟地址形成的集合就是虚拟地址空间。

C语言指针,这可能是史上最干最全的讲解啦(附代码)!!!_第5张图片

在程序员眼中的内存应该是下面这样的。

C语言指针,这可能是史上最干最全的讲解啦(附代码)!!!_第6张图片

也就是说,内存是一个很大的,线性的字节数组(平坦寻址)。每一个字节都是固定的大小,由8个二进制位组成。

最关键的是,每一个字节都有一个唯一的编号,编号从0开始,一直到最后一个字节。

如上图中,这是一个256M的内存,他一共有256x1024x1024  = 268435456个字节,那么它的地址范围就是 0 ~268435455  。

由于内存中的每一个字节都有一个唯一的编号。

因此,在程序中使用的变量,常量,甚至数函数等数据,当他们被载入到内存中后,都有自己唯一的一个编号,这个编号就是这个数据的地址。

指针就是这样形成的。

下面用代码说明

#include int main(void){    char ch = 'a';    int  num = 97;    printf("ch 的地址:%p",&ch);   //ch 的地址:0028FF47    printf("num的地址:%p",&num);  //num的地址:0028FF40    return 0;}


指针的值实质是内存单元(即字节)的编号,所以指针单独从数值上看,也是整数,他们一般用16进制表示。

指针的值(虚拟地址值)使用一个机器字的大小来存储。

也就是说,对于一个机器字为w位的电脑而言,它的虚拟地址空间是0~2w - 1 ,程序最多能访问2w个字节。

这就是为什么xp这种32位系统最大支持4GB内存的原因了。

我们可以大致画出变量ch和num在内存模型中的存储。(假设 char占1个字节,int占4字节)

 C语言指针,这可能是史上最干最全的讲解啦(附代码)!!!_第7张图片

变量和内存

为了简单起见,这里就用上面例子中的  int num = 97 这个局部变量来分析变量在内存中的存储模型。

 C语言指针,这可能是史上最干最全的讲解啦(附代码)!!!_第8张图片

已知:num的类型是int,占用了4个字节的内存空间,其值是97,地址是0028FF40。我们从以下几个方面去分析。

1、内存的数据

内存的数据就是变量的值对应的二进制,一切都是二进制。

97的二进制是 : 00000000 00000000 00000000 0110000 , 但使用的小端模式存储时,低位数据存放在低地址,所以图中画的时候是倒过来的。

2、内存数据的类型

内存的数据类型决定了这个数据占用的字节数,以及计算机将如何解释这些字节。

num的类型是int,因此将被解释为 一个整数。

3、内存数据的名称

内存的名称就是变量名。实质上,内存数据都是以地址来标识的,根本没有内存的名称这个说法,这只是高级语言提供的抽象机制 ,方便我们操作内存数据。

而且在C语言中,并不是所有的内存数据都有名称,例如使用malloc申请的堆内存就没有。

4、内存数据的地址

如果一个类型占用的字节数大于1,则其变量的地址就是地址值最小的那个字节的地址。

因此num的地址是 0028FF40。内存的地址用于标识这个内存块。

5、内存数据的生命周期

num是main函数中的局部变量,因此当main函数被启动时,它被分配于栈内存上,当main执行结束时,消亡。

    

如果一个数据一直占用着他的内存,那么我们就说他是“活着的”,如果他占用的内存被回收了,则这个数据就“消亡了”。

C语言中的程序数据会按照他们定义的位置,数据的种类,修饰的关键字等因素,决定他们的生命周期特性。

实质上我们程序使用的内存会被逻辑上划分为:栈区,堆区,静态数据区,方法区。

不同的区域的数据有不同的生命周期。

无论以后计算机硬件如何发展,内存容量都是有限的,因此清楚理解程序中每一个程序数据的生命周期是非常重要的。

指针运算

 N多的面试会考这种东西了:

Type *p; p++;


然后问你p的值变化了多少。


其实,也可以认为这是在考编译器的基本知识。因此p的值并不像表面看到的+1那么简单,编译器实际上对p进行的是加sizeof(Type)的操作。

 

看一个一段代码的测试结果:

C语言指针,这可能是史上最干最全的讲解啦(附代码)!!!_第9张图片


这里注释掉char一行的原因是因为cout<<(char*)会被当成字符串输出,而不是char的地址)

执行结果:

C语言指针,这可能是史上最干最全的讲解啦(附代码)!!!_第10张图片

       

 观察结果,可以看出,他们的增长结果分别是:

2(sizeof(short))         4(sizeof(int))        4(sizeof(long))         8(sizeof(long long))         4(sizeof(float))         8(sizeof(double))         12(sizeof(long double))


喏,增加的值是不是sizeof(Type)呢?别的什么struct,class之类的,就不验证你,有兴趣的自己去验证。

 

我们再对这样的一段代码进行汇编,查看编译器是如何进行指针的加法操作的:

C语言指针,这可能是史上最干最全的讲解啦(附代码)!!!_第11张图片

 汇编结果:

C语言指针,这可能是史上最干最全的讲解啦(附代码)!!!_第12张图片

          

注意看注释部分的结果,我们看到,piv的值显示加了4(sizeof(int)),然后又加了16(4*sizeof(int))。

指针变量和指向关系

用来保存指针的变量,就是指针变量。

如果指针变量p1保存了变量 num的地址,则就说:p1指向了变量num,也可以说p1指向了num所在的内存块 ,这种指向关系,在图中一般用 箭头表示。

 C语言指针,这可能是史上最干最全的讲解啦(附代码)!!!_第13张图片

上图中,指针变量p1指向了num所在的内存块 ,即从地址0028FF40开始的4个byte 的内存块。

定义指针变量

C语言中,定义变量时,在变量名前写一个 * 星号,这个变量就变成了对应变量类型的指针变量。必要时要加( ) 来避免优先级的问题。

引申:C语言中,定义变量时,在定义的最前面写上typedef ,那么这个变量名就成了一种类型,即这个类型的同义词。

int a ; //int类型变量 aint *a ; //int* 变量aint arr[3]; //arr是包含3个int元素的数组int (* arr )[3]; //arr是一个指向包含3个int元素的数组的指针变量

//-----------------各种类型的指针------------------------------
int* p_int; //指向int类型变量的指针 
double* p_double; //指向idouble类型变量的指针 
struct Student *p_struct; //结构体类型的指针
int(*p_func)(int,int); //指向返回类型为int,有2个int形参的函数的指针 
int(*p_arr)[3]; //指向含有3个int元素的数组的指针 
int** p_pointer; //指向 一个整形变量指针的指针

指针的2个重要属性

指针也是一种数据,指针变量也是一种变量,因此指针 这种数据也符合前面变量和内存主题中的特性。

这里要强调2个属性:指针的类型,指针的值。

int main(void){    int num = 97;    int *p1  = #    char* p2 = (char*)(&num);
    printf("%d",*p1);    //输出  97    putchar(*p2);          //输出  a    return 0;}

指针的值:很好理解,如上面的num 变量 ,其地址的值就是0028FF40 ,因此 p1的值就是0028FF40。

数据的地址用于在内存中定位和标识这个数据,因为任何2个内存不重叠的不同数据的地址都是不同的。

指针的类型:指针的类型决定了这个指针指向的内存的字节数并如何解释这些字节信息。

一般指针变量的类型要和它指向的数据的类型匹配。

由于num的地址是0028FF40,因此 p1 和 p2 的值都是0028FF40

*p1  :  将从地址0028FF40 开始解析,因为p1是int类型指针,int占4字节,因此向后连续取4个字节,并将这4个字节的二进制数据解析为一个整数 97。

*p2  :  将从地址0028FF40 开始解析,因为p2是char类型指针,char占1字节,因此向后连续取1个字节,并将这1个字节的二进制数据解析为一个字符,即'a'。

同样的地址,因为指针的类型不同,对它指向的内存的解释就不同,得到的就是不同的数据。

取地址

既然有了指针变量,那就得让他保存其它变量的地址,使用& 运算符取得一个变量的地址。

int add(int a , int b){    return a + b;}
int main(void){    int num = 97;    float score = 10.00F;    int arr[3] = {1,2,3};
    //-----------------------
    int* p_num = #    float* p_score = &score;    int (*p_arr)[3] = &arr;               int (*fp_add)(int ,int )  = add;  //p_add是指向函数add的函数指针    return 0;}

特殊的情况,他们并不一定需要使用&取地址:

  • 数组名的值就是这个数组的第一个元素的地址。

  • 函数名的值就是这个函数的地址。

  • 字符串字面值常量作为右值时,就是这个字符串对应的字符数组的名称,也就是这个字符串在内存中的地址。

ItVuer - 免责声明 - 关于我们 - 联系我们

本网站信息来源于互联网,如有侵权请联系:561261067@qq.com

桂ICP备16001015号