Java教程

指针

本文主要是介绍指针,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

定义指针变量

定义指针变量与定义普通变量非常类似,不过要在变量名前面加星号*,格式为:

datatype *name;

或者

datatype *name = value;

*表示这是一个指针变量,datatype表示该指针变量所指向的数据的类型 。例如:

 int *p1;

p1 是一个指向 int 类型数据的指针变量,至于 p1 究竟指向哪一份数据,应该由赋予它的值决定。再如:

 int a = 100;
 int *p_a = &a;

在定义指针变量 p_a 的同时对它进行初始化,并将变量 a 的地址赋予它,此时 p_a 就指向了 a。值得注意的是,p_a 需要的一个地址,a 前面必须要加取地址符&,否则是不对的。

和普通变量一样,指针变量也可以被多次写入,只要你想,随时都能够改变指针变量的值,请看下面的代码:

 //定义普通变量
 float a = 99.5, b = 10.6;
 char c = '@', d = '#';
 //定义指针变量
 float *p1 = &a;char *p2 = &c;
 //修改指针变量的值
 p1 = &b;
 p2 = &d;

*是一个特殊符号,表明一个变量是指针变量,定义 p1、p2 时必须带*。而给 p1、p2 赋值时,因为已经知道了它是一个指针变量,就没必要多此一举再带上*,后边可以像使用普通变量一样来使用指针变量。也就是说,定义指针变量时必须带*,给指针变量赋值时不能带*

需要强调的是,p1、p2 的类型分别是float*char*,而不是floatchar,它们是完全不同的数据类型,读者要引起注意。

指针变量存储了数据的地址,通过指针变量能够获得该地址上的数据,格式为:

*pointer;

这里的*称为指针运算符,用来取得某个地址上的数据,请看下面的例子:

 纯文本复制
 #include <stdio.h>int main(){    
     int a = 15;  
     int *p = &a;
     printf("%d, %d\n", a, *p);  //两种方式都可以输出a的值    
     return 0;
 }

CPU 读写数据必须要知道数据在内存中的地址,普通变量和指针变量都是地址的助记符,虽然通过 *p 和 a 获取到的数据一样,但它们的运行过程稍有不同:a 只需要一次运算就能够取得数据,而 *p 要经过两次运算,多了一层“间接”。

假设变量 a、p 的地址分别为 0X1000、0XF0A0,它们的指向关系如下图所示:

img

程序被编译和链接后,a、p 被替换成相应的地址。使用 *p 的话,要先通过地址 0XF0A0 取得变量 p 本身的值,这个值是变量 a 的地址,然后再通过这个值取得变量 a 的数据,前后共有两次运算;而使用 a 的话,可以通过地址 0X1000 直接取得它的数据,只需要一步运算。

也就是说,使用指针是间接获取数据,使用变量名是直接获取数据,前者比后者的代价要高。

*在不同的场景下有不同的作用:*可以用在指针变量的定义中,表明这是一个指针变量,以和普通变量区分开;使用指针变量时在前面加*表示获取指针指向的数据,或者说表示的是指针指向的数据本身。

指针除了可以获取内存上的数据,也可以修改内存上的数据,例如:

 #include <stdio.h>int main(){
     int a = 15, b = 99, c = 222;  
     int *p = &a;  //定义指针变量    
     *p = b;  //通过指针变量修改内存上的数据 
     c = *p;  //通过指针变量获取内存上的数据    
     printf("%d, %d, %d, %d\n", a, b, c, *p); 
     return 0;
 }

运行结果: 99, 99, 99, 99

*p 代表的是 a 中的数据,它等价于 a,可以将另外的一份数据赋值给它,也可以将它赋值给另外的一个变量。

也就是说,定义指针变量时的*和使用指针变量时的*意义完全不同。以下面的语句为例:

 int *p = &a;
 *p = 100;

第1行代码中*用来指明 p 是一个指针变量,第2行代码中*用来获取指针指向的数据。

需要注意的是,给指针变量本身赋值时不能加*。修改上面的语句:

 int *p;
 p = &a;
 *p = 100;

第2行代码中的 p 前面就不能加*

指针变量也可以出现在普通变量能出现的任何表达式中,例如:

 纯文本复制
 int x, y, *px = &x, *py = &y;
 y = *px + 5;  //表示把x的内容加5并赋给y,*px+5相当于(*px)+5
 y = ++*px;  //px的内容加上1之后赋给y,++*px相当于++(*px)
 y = *px++;  //相当于y=*(px++)
 py = px;  //把一个指针的值赋给另一个指针

关于 * 和 & 的谜题

假设有一个 int 类型的变量 a,pa 是指向它的指针,那么*&a&*pa分别是什么意思呢?

*&a可以理解为*(&a)&a表示取变量 a 的地址(等价于 pa),*(&a)表示取这个地址上的数据(等价于 *pa),绕来绕去,又回到了原点,*&a仍然等价于 a。

&*pa可以理解为&(*pa)*pa表示取得 pa 指向的数据(等价于 a),&(*pa)表示数据的地址(等价于 &a),所以&*pa等价于 pa。

对星号*的总结

在我们目前所学到的语法中,星号*主要有三种用途:

  • 表示乘法,例如int a = 3, b = 5, c; c = a * b;,这是最容易理解的。

  • 表示定义一个指针变量,以和普通变量区分开,例如int a = 100; int *p = &a;

  • 表示获取指针指向的数据,是一种间接操作,例如int a, b, *p = &a; *p = 100; b = *p;

不能对指针变量进行乘法、除法、取余等其他运算,除了会发生语法错误,也没有实际的含义。

数组(Array)是一系列具有相同类型的数据的集合,每一份数据叫做一个数组元素(Element)。数组中的所有元素在内存中是连续排列的,整个数组占用的是一块内存。以int arr[] = { 99, 15, 100, 888, 252 };为例,该数组在内存中的分布如下图所示:

img

定义数组时,要给出数组名和数组长度,数组名可以认为是一个指针,它指向数组的第 0 个元素。在C语言中,我们将第 0 个元素的地址称为数组的首地址。以上面的数组为例,下图是 arr 的指向:

img

数组名的本意是表示整个数组,也就是表示多份数据的集合,但在使用过程中经常会转换为指向数组第 0 个元素的指针,所以上面使用了“认为”一词,表示数组名和数组首地址并不总是等价。初学者可以暂时忽略这个细节,把数组名当做指向第 0 个元素的指针使用即可

下面的例子演示了如何以指针的方式遍历数组元素:

#include <stdio.h>
int main(){    
    int arr[] = { 99, 15, 100, 888, 252 };    
    int len = sizeof(arr) / sizeof(int);  //求数组长度    
    int i;    
    for(i=0; i<len; i++){        
        printf("%d  ", *(arr+i) );  //*(arr+i)等价于arr[i]    
    }    
        printf("\n");    
    return 0;
}

运行结果: 99 15 100 888 252

第 8 行代码中我们使用了*(arr+i)这个表达式,arr 是数组名,指向数组的第 0 个元素,表示数组首地址, arr+i 指向数组的第 i 个元素,*(arr+i) 表示取第 i 个元素的数据,它等价于 arr[i]。

我们也可以定义一个指向数组的指针,例如:

int arr[] = { 99, 15, 100, 888, 252 };
int *p = arr;

arr 本身就是一个指针,可以直接赋值给指针变量 p。arr 是数组第 0 个元素的地址,所以int *p = arr;也可以写作int *p = &arr[0];。也就是说,arr、p、&arr[0] 这三种写法都是等价的,它们都指向数组第 0 个元素,或者说指向数组的开头。

如果一个指针指向了数组,我们就称它为数组指针(Array Pointer)。

数组指针指向的是数组中的一个具体元素,而不是整个数组,所以数组指针的类型和数组元素的类型有关,上面的例子中,p 指向的数组元素是 int 类型,所以 p 的类型必须也是int *

反过来想,p 并不知道它指向的是一个数组,p 只知道它指向的是一个整数,究竟如何使用 p 取决于程序员的编码。

更改上面的代码,使用数组指针来遍历数组元素:

#include <stdio.h>
int main(){    
    int arr[] = { 99, 15, 100, 888, 252 };    
    int i, *p = arr, len = sizeof(arr) / sizeof(int);    
    for(i=0; i<len; i++){        
        printf("%d  ", *(p+i) );    
    }    
    printf("\n");   
    return 0;
}

数组在内存中只是数组元素的简单排列,没有开始和结束标志,在求数组的长度时不能使用sizeof(p) / sizeof(int),因为 p 只是一个指向 int 类型的指针,编译器并不知道它指向的到底是一个整数还是一系列整数(数组),所以 sizeof(p) 求得的是 p 这个指针变量本身所占用的字节数,而不是整个数组占用的字节数。

C语言字符串指针(指向字符串的指针)

C语言中没有特定的字符串类型,我们通常是将字符串放在一个字符数组中

#include <stdio.h>
#include <string.h>
int main(){   
    char str[] = "http://c.biancheng.net";    
    int len = strlen(str), i;    //直接输出字符串    
    printf("%s\n", str);    //每次输出一个字符    
    for(i=0; i<len; i++){        
        printf("%c", str[i]);    
    }    
    printf("\n");    
    return 0;
}

运行结果: http://c.biancheng.net http://c.biancheng.net

除了字符数组,C语言还支持另外一种表示字符串的方法,就是直接使用一个指针指向字符串,例如:

char *str = "http://c.biancheng.net";

或者:

char *str;
str = "http://c.biancheng.net";

字符串中的所有字符在内存中是连续排列的,str 指向的是字符串的第 0 个字符;我们通常将第 0 个字符的地址称为字符串的首地址。字符串中每个字符的类型都是char,所以 str 的类型也必须是char *

这一切看起来和字符数组是多么地相似,它们都可以使用%s输出整个字符串,都可以使用*[ ]获取单个字符,这两种表示字符串的方式是不是就没有区别了呢?

有!它们最根本的区别是在内存中的存储区域不一样,字符数组存储在全局数据区或栈区,第二种形式的字符串存储在常量区。全局数据区和栈区的字符串(也包括其他数据)有读取和写入的权限,而常量区的字符串(也包括其他数据)只有读取权限,没有写入权限。

内存权限的不同导致的一个明显结果就是,字符数组在定义后可以读取和修改每个字符,而对于第二种形式的字符串,一旦被定义后就只能读取不能修改,任何对它的赋值都是错误的。

我们将第二种形式的字符串称为字符串常量,意思很明显,常量只能读取不能写入。请看下面的演示:

#include <stdio.h>
int main(){    
	char *str = "Hello World!";    
	str = "I love C!";  //正确    
	str[3] = 'P';  //错误    
	return 0;
}

这段代码能够正常编译和链接,但在运行时会出现段错误(Segment Fault)或者写入位置错误。

第4行代码是正确的,可以更改指针变量本身的指向;第5行代码是错误的,不能修改字符串中的字符。

C语言指针变量作为函数参数

在C语言中,函数的参数不仅可以是整数、小数、字符等具体的数据,还可以是指向它们的指针。用指针变量作函数参数可以将函数外部的地址传递到函数内部,使得在函数内部可以操作函数外部的数据,并且这些数据不会随着函数的结束而被销毁。

像数组、字符串、动态分配的内存等都是一系列数据的集合,没有办法通过一个参数全部传入函数内部,只能传递它们的指针,在函数内部通过指针来影响这些数据集合。

有的时候,对于整数、小数、字符等基本类型数据的操作也必须要借助指针,一个典型的例子就是交换两个变量的值

用数组作函数参数

数组是一系列数据的集合,无法通过参数将它们一次性传递到函数内部,如果希望在函数内部操作数组,必须传递数组指针。下面的例子定义了一个函数 max(),用来查找数组中值最大的元素:

#include <stdio.h>
int max(int *intArr, int len){    
    int i, maxValue = intArr[0];  //假设第0个元素是最大值    
    for(i=1; i<len; i++){        
        if(maxValue < intArr[i]){            
            maxValue = intArr[i];        
        }    
    }       
    return maxValue;
}
int main(){    
    int nums[6], i;    
    int len = sizeof(nums)/sizeof(int);    //读取用户输入的数据并赋值给数组元素    
    for(i=0; i<len; i++){        
        scanf("%d", nums+i);    
    }    
    printf("Max value is %d!\n", max(nums, len));    
    return 0;
}

运行结果: 12 55 30 8 93 27↙ Max value is 93!

C语言为什么不允许直接传递数组的所有元素,而必须传递数组指针呢?

参数的传递本质上是一次赋值的过程,赋值就是对内存进行拷贝。所谓内存拷贝,是指将一块内存上的数据复制到另一块内存上。

对于像 int、float、char 等基本类型的数据,它们占用的内存往往只有几个字节,对它们进行内存拷贝非常快速。而数组是一系列数据的集合,数据的数量没有限制,可能很少,也可能成千上万,对它们进行内存拷贝有可能是一个漫长的过程,会严重拖慢程序的效率,为了防止技艺不佳的程序员写出低效的代码,C语言没有从语法上支持数据集合的直接赋值。

C语言指针作为函数返回值

言允许函数的返回值是一个指针(地址),我们将这样的函数称为指针函数。

纯文本复制
#include <stdio.h>
#include <string.h>
char *strlong(char *str1, char *str2){    
    if(strlen(str1) >= strlen(str2)){        
        return str1;    
    }
    else{        
        return str2;    
    }
	}
int main(){    
    char str1[30], str2[30], *str;    
    gets(str1);    
    gets(str2);    
    str = strlong(str1, str2);    
    printf("Longer string: %s\n", str);    
    return 0;
}

用指针作为函数返回值时需要注意的一点是,函数运行结束后会销毁在它内部定义的所有局部数据,包括局部变量、局部数组和形式参数,函数返回的指针请尽量不要指向这些数据,C语言没有任何机制来保证这些数据会一直有效,它们在后续使用过程中可能会引发运行时错误。请看下面的例子:

#include <stdio.h>int *func(){    int n = 100;    return &n;}int main(){    int *p = func(), n;    n = *p;    printf("value = %d\n", n);    return 0;}

运行结果:

value = 100

n 是 func() 内部的局部变量,func() 返回了指向 n 的指针,根据上面的观点,func() 运行结束后 n 将被销毁,使用 *p 应该获取不到 n 的值。但是从运行结果来看,我们的推理好像是错误的,func() 运行结束后 *p 依然可以获取局部变量 n 的值,这个上面的观点不是相悖吗?

为了进一步看清问题的本质,不妨将上面的代码稍作修改,在第9~10行之间增加一个函数调用,看看会有什么效果:

#include <stdio.h>
int *func(){    
    int n = 100;    
    return &n;
}
int main(){    
    int *p = func(), n;    
    printf("c.biancheng.net\n");    
    n = *p;    
    printf("value = %d\n", n);    
    return 0;
}

运行结果:

c.biancheng.net value = -2

可以看到,现在 p 指向的数据已经不是原来 n 的值了,它变成了一个毫无意义的甚至有些怪异的值。与前面的代码相比,该段代码仅仅是在 *p 之前增加了一个函数调用

C语言二级指针(指向指针的指针)详解

指针可以指向一份普通类型的数据,例如 int、double、char 等,也可以指向一份指针类型的数据,例如 int *、double *、char * 等。

如果一个指针指向的是另外一个指针,我们就称它为二级指针,或者指向指针的指针。

假设有一个 int 类型的变量 a,p1是指向 a 的指针变量,p2 又是指向 p1 的指针变量,它们的关系如下图所示: C语言二级指针(指向指针的指针)演示图

将这种关系转换为C语言代码:

int a =100;int *p1 = &a;int **p2 = &p1;

指针变量也是一种变量,也会占用存储空间,也可以使用&获取它的地址。C语言不限制指针的级数,每增加一级指针,在定义指针变量时就得增加一个星号*。p1 是一级指针,指向普通类型的数据,定义时有一个*;p2 是二级指针,指向一级指针 p1,定义时有两个*

C语言指针数组(数组每个元素都是指针)详解

指针数组还可以和字符串数组结合使用,请看下面的例子:

#include <stdio.h>
int main(){    
    char *str[3] = {        
        "c.biancheng.net",        
        "C语言中文网",        
        "C Language"    };    
    printf("%s\n%s\n%s\n", str[0], str[1], str[2]);    
    return 0;
}

运行结果: c.biancheng.net C语言中文网 C Language

需要注意的是,字符数组 str 中存放的是字符串的首地址,不是字符串本身,字符串本身位于其他的内存区域,和字符数组是分开的。

也只有当指针数组中每个元素的类型都是char *时,才能像上面那样给指针数组赋值,其他类型不行。

C语言二维数组指针(指向二维数组的指针)详解

二维数组在概念上是二维的,有行和列,但在内存中所有的数组元素都是连续排列的,它们之间没有“缝隙”。以下面的二维数组 a 为例:

int a3 = { {0, 1, 2, 3}, {4, 5, 6, 7}, {8, 9, 10, 11} };

从概念上理解,a 的分布像一个矩阵:

0   1   2   3
  6   7
 10  11

但在内存中,a 的分布是一维线性的,整个数组占用一块连续的内存: 二维数组在内存中的存储

C语言中的二维数组是按行排列的,也就是先存放 a[0] 行,再存放 a[1] 行,最后存放 a[2] 行;每行中的 4 个元素也是依次存放。数组 a 为 int 类型,每个元素占用 4 个字节,整个数组共占用 4×(3×4) = 48 个字节。

C语言允许把一个二维数组分解成多个一维数组来处理。对于数组 a,它可以分解成三个一维数组,即 a[0]、a[1]、a[2]。每一个一维数组又包含了 4 个元素,例如 a[0] 包含 a0、a0、a0、a0。

假设数组 a 中第 0 个元素的地址为 1000,那么每个一维数组的首地址如下图所示: 把二维数组拆解成一维数组

为了更好的理解指针和二维数组的关系,我们先来定义一个指向 a 的指针变量 p:

int (*p)[4] = a;

括号中的*表明 p 是一个指针,它指向一个数组,数组的类型为int [4],这正是 a 所包含的每个一维数组的类型。

[ ]的优先级高于*( )是必须要加的,如果赤裸裸地写作int *p[4],那么应该理解为int *(p[4]),p 就成了一个指针数组,而不是二维数组指针,这在《C语言指针数组》中已经讲到。

对指针进行加法(减法)运算时,它前进(后退)的步长与它指向的数据类型有关,p 指向的数据类型是int [4],那么p+1就前进 4×4 = 16 个字节,p-1就后退 16 个字节,这正好是数组 a 所包含的每个一维数组的长度。也就是说,p+1会使得指针指向二维数组的下一行,p-1会使得指针指向数组的上一行。

数组名 a 在表达式中也会被转换为和 p 等价的指针!

下面我们就来探索一下如何使用指针 p 来访问二维数组中的每个元素。按照上面的定义: \1) p指向数组 a 的开头,也即第 0 行;p+1前进一行,指向第 1 行。

\2) *(p+1)表示取地址上的数据,也就是整个第 1 行数据。注意是一行数据,是多个数据,不是第 1 行中的第 0 个元素,下面的运行结果有力地证明了这一点:

#include <stdio.h>int main(){    int a[3][4] = { {0, 1, 2, 3}, {4, 5, 6, 7}, {8, 9, 10, 11} };    int (*p)[4] = a;    printf("%d\n", sizeof(*(p+1)));    return 0;}

运行结果: 16

\3) *(p+1)+1表示第 1 行第 1 个元素的地址。如何理解呢?

*(p+1)单独使用时表示的是第 1 行数据,放在表达式中会被转换为第 1 行数据的首地址,也就是第 1 行第 0 个元素的地址,因为使用整行数据没有实际的含义,编译器遇到这种情况都会转换为指向该行第 0 个元素的指针;就像一维数组的名字,在定义时或者和 sizeof、& 一起使用时才表示整个数组,出现在表达式中就会被转换为指向数组第 0 个元素的指针。

\4) *(*(p+1)+1)表示第 1 行第 1 个元素的值。很明显,增加一个 * 表示取地址上的数据。

根据上面的结论,可以很容易推出以下的等价关系:

a+i == p+i a[i] == p[i] == *(a+i) == *(p+i) ai == pi == *(a[i]+j) == *(p[i]+j) == ((a+i)+j) == ((p+i)+j)

【实例】使用指针遍历二维数组。

#include <stdio.h>
int main(){    
	int a[3][4]={0,1,2,3,4,5,6,7,8,9,10,11};    
	int(*p)[4];    
    int i,j;    
    p=a;    
    for(i=0; i<3; i++){        
        for(j=0; j<4; j++) 
            printf("%2d  ",*(*(p+i)+j));       
        printf("\n");    
    }    
    return 0;
}

运行结果:

 0   1   2   3
  6   7
 10  11

指针数组和二维数组指针的区别

指针数组和二维数组指针在定义时非常相似,只是括号的位置不同:

int *(p1[5]);  //指针数组,可以去掉括号直接写作 int *p1[5];int (*p2)[5];  //二维数组指针,不能去掉括号

指针数组和二维数组指针有着本质上的区别:指针数组是一个数组,只是每个元素保存的都是指针,以上面的 p1 为例,在32位环境下它占用 4×5 = 20 个字节的内存。二维数组指针是一个指针,它指向一个二维数组,以上面的 p2 为例,它占用 4 个字节的内存

这篇关于指针的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!