Linux系统采用多道程序设计技术,允许多个进程同时在内核中运行,但同一个系统中的多个进程之间,可能因为进程合作或资源共享,产生制约关系。制约关系分为直接相互制约关系和间接相互制约关系:
(1)直接相互制约关系。利用管道机制实现进程间通信,当管道为空时,读进程由于无法从管道中读取数据而进入阻塞;当管道存满时,写进程由于无法向管道中写入数据而进入阻塞,类似于这种需要进程间协调合作导致的制约关系,称为直接相互制约关系。
(2)间接相互制约关系。若当前系统中只有1台打印机,当进程A占用打印机时,进程B也申请使用打印机,进程B就会进入阻塞,等待打印机释放;同样若B先获取到打印机,A进程申请使用打印机后也会进入阻塞。类似于这种因资源共享导致的制约关系,称为间接相互制约关系。
直接相互制约的进程间有同步关系,间接相互制约的进程间有互斥关系,同步与互斥存在的根源是系统中存在临界资源(Critical Resouce)。计算机中的硬件资源(如内存、打印机、磁盘)以及软件资源(如共享代码段、变量等)都是临界资源,为了避免多进程的并发执行造成的不一致性,临界资源在同一时刻只允许有限个进程对其进行访问或修改。
计算机中的多个进程必须互斥地访问系统中的临界资源,用于访问临界资源的代码称为临界区(Critical Section),临界区也属于临界资源,若能保证进程间互斥地进入自己的临界区,就能实现进程对临界资源的互斥访问。
信号量(Semaphore)是专门用于解决进程同步与互斥问题的一种通信机制,它与信号无关,也不同于管道、FIFO以及消息队列,一般不用来传输数据,信号量包括一个被称为信号量的表示资源数量的非负整型变量、修改信号量的原子操作P和V,以及该信号量下等待资源的进程队列。
在Linux系统中,不同的进程通过获取同一个信号量键值进行通信,实现进程间对资源的互斥访问。使用信号量进行通信时,通常需要以下步骤:
(1)创建信号量/信号量集,或获取系统中已有的信号量/信号量集;
(2)初始化信号量。早期信号量通常被初始为1,但有些进程一次需要多个同类的临界资源,或多个不同类且不唯一的临界资源,因此可能需要初始化的不是信号量,而是一个信号量集;
(3)信号量的P、V操作,根据进程请求,修改信号量的数量。执行P操作会使信号量-1,执行V操作会使信号量+1;
(4)从系统中删除不需要的信号量。
系统中信号量的数量是有限制的,其极限值由宏SEMMSL设定。Linux内核提供了三个系统调用,用于实现以上步骤,这三个系统调用接口分别为:semget()、semctl()和semop(),下面分别对这三个系统调用进行讲解。
① semget()
semget()函数的功能为创建一个新的信号集,或获取一个系统中已经存在的信号量集,该函数存在于函数库sys/sem.h中,其函数声明如下:
int semget(key_t key, int nsems, int semflg);
若该函数调用成功则返回信号量的标识符,否则返回-1,并设置errno,常见errno的值与其含义如下:
● EACCES。表示进程无访问权限;
● ENOENT。表示传入的键值不存在;
● EINVAL。表示nsens小于0,或信号量数已达上限;
● EEXIST。当semflg设置指定了ICP_CREAT和IPC_EXCL时,表示该信号量已经存在。
semget()函数中的参数key表示信号量的键值,通常为一个整数;参数nsems表示创建的信号量数目;参数semflg为标志位,与open()、msgget()函数中的标志位功能相似,都用来设置权限,权限位可与IPC_CREAT以及IPC_EXCL发生位或,另外若该标志位设置为IPC_PRIVATE,表示该信号量为当前进程的私有信号量。
② semctl()
semctl()函数可以对信号量或信号量集进行多种控制,该函数存在于函数库sys/sem.h中,其函数声明如下:
int semctl(int semid, int semnum, int cmd, ...);
若该函数调用成功则根据参数cmd的取值返回相应信息,通常为一个非负整数;否则返回-1并设置errno。
semctl()函数的参数semid表示信号量标识符,通常为semget()的返回值;参数semnum表示信号量在信号量集中的编号,该参数在使用信号量集时才会使用,通常设置为0,表示取第一个信号;参数cmd表示对信号量进行的操作;最后一个参数是一个可选参数,依赖于参数cmd,使用该参数时,用户必须在程序中自定义一个如下所示的共用体:
union semun{ int val; //cmd为SETVAL时,用于指定信号量值 struct semid_ds *buf; //cmd为IPC_STAT时或IPC_SET时生效 unsigned short *array; //cmd为GETALL或SETALL时生效 struct seminfo *_buf; //cmd为IPC_INFO时生效 };
在该共用体中的struct semid_ds是一个由内核维护,记录信号量属性信息的结构体,该结构体的类型定义如下:
struct semid_ds { struct ipc_perm sem_perm; //所有者和标识权限 time_t sem_otime; //最后操作时间 time_t sem_ctime; //最后更改时间 unsigned short sem_nsems; //信号集中的信号数量 };
cmd常用的设置为SETVAL和IPC_RMID,其含义分别如下:
● SETVAL。表示semctl()的功能为初始化信号量的值,信号量值通过可选参数传入,在使用信号量前应先对信号量值进行设置;
● IPC_RMID。表示semctl()的功能为从系统中删除指定信号量。信号量的删除应由其所有者或创建者进行,没有被删除的信号量将会一直存在于系统中。
① semop()
semop()函数的功能为改变信号量的值,该函数存在于函数库sys/sem.h中,函数声明如下:
int semop(int semid, struct sembuf *sops, unsigned nsops);
若该函数调用成功返回0,否则返回-1,并设置errno。
semop()函数的参数semid同样为semget()返回的信号量标识符;参数nsops表示参数sops所指数组中元素的个数。
参数sops为一个struct sembuf类型的数组指针,该数组中的每个元素设置了要对信号量集中的哪个信号做哪种操作,struct sembuf结构体定义如下:
struct sembuf{ short sem_num; //信号量在信号量集中的编号 short sem_op; //信号量操 short sem_flag; //标志位 };
当结构体成员sem_op设置为-1时,表示P操作;设置为+1时,表示V操作。结构体成员sem_flg通常设置为SEM_UNDO,若进程退出前没有删除信号量,信号量将会由系统自动释放。
下面通过案例来展示信号量相关的系统调用接口的使用方法。
案例5:使用信号量实现父子进程同步,防止父子进程抢夺cpu。案例实现如下:
1 #include <stdio.h> 2 #include <stdlib.h> 3 #include <sys/sem.h> 4 //自定义共用体 5 union semu{ 6 int val; 7 struct semid_ds* buf; 8 unsigned short* array; 9 struct seminfo* _buf; 10 }; 11 static int sem_id; 12 //设置信号量值 13 static int set_semvalue() 14 { 15 union semu sem_union; 16 sem_union.val=1; 17 if(semctl(sem_id,0,SETVAL,sem_union)==-1) 18 return 0; 19 return 1; 20 } 21 //p操作,获取信号量 22 static int semaphore_p() 23 { 24 struct sembuf sem_b; 25 sem_b.sem_num = 0; 26 sem_b.sem_op = -1; 27 sem_b.sem_flg = SEM_UNDO; 28 if(semop(sem_id,&sem_b,1)==-1){ 29 perror("sem_p err"); 30 return 0; 31 } 32 return 1; 33 } 34 //V操作,释放信号量 35 static int semaphore_v() 36 { 37 struct sembuf sem_b; 38 sem_b.sem_num=0; 39 sem_b.sem_op=1; 40 sem_b.sem_flg=SEM_UNDO; 41 if(semop(sem_id,&sem_b,1)==-1){ 42 perror("sem_v err"); 43 return 0; 44 } 45 return 1; 46 } 47 //删除信号量 48 static void del_semvalue() 49 { 50 union semu sem_union; 51 if(semctl(sem_id,0,IPC_RMID,sem_union)==-1) 52 perror("del err"); 53 } 54 int main() 55 { 56 int i; 57 pid_t pid; 58 char ch='C'; 59 sem_id=semget((key_t)1000,1,0664|IPC_CREAT);//创建信号量 60 if(sem_id==-1){ 61 perror("sem_c err"); 62 exit(-1); 63 } 64 if(!set_semvalue()){ //设置信号量值 65 perror("init err"); 66 exit(-1); 67 } 68 pid=fork(); //创建子进程 69 if(pid==-1){ //若创建失败 70 del_semvalue(); //删除信号量 71 exit(-1); 72 } 73 else if(pid==0) //设置子进程打印的字符 74 ch='Z'; 75 else //设置父进程打印的字符 76 ch='C'; 77 srand((unsigned int)getpid()); //设置随机数种子 78 for(i=0;i<8;i++) //循环打印字符 79 { 80 semaphore_p(); //获取信号量 81 printf("%c",ch); 82 fflush(stdout); //将字符打印到屏幕 83 sleep(rand()%4); //沉睡 84 printf("%c",ch); 85 fflush(stdout); //再次打印到屏幕 86 sleep(1); 87 semaphore_v(); //释放信号量 88 } 89 if(pid>0){ 90 wait(NULL); //回收子进程 91 del_semvalue(); //删除信号量 92 } 93 printf("\nprocess %d finished.\n",getpid()); 94 return 0; 95 }
编译案例,执行程序,程序的运行结果如下:
CCZZCCZZCCZZCCZZCCZZCCZZCCZZCCZZ process 3657 finished process 3656 finished
观察运行结果,字符C与字符Z总是成对出现,这是因为案例5主函数的for()循环中进行了两次打印操作,且程序使用了一个二值信号量,将这两次打印操作绑定为了一个原子操作:代码第80行调用了semaphore_p()函数获取信号量,若获取信号量的是父进程,那么子进程将无法获取cpu,除非父进程调用semaphore_v()函数将信号量释放,否则子进程无法执行for循环中的核心代码;反之子进程获取信号量之后,父进程也无法获取cpu。
结合程序运行结果,根据以上分析可知,案例5实现成功