进程间通信(IPC)-管道、消息队列、共享内存、信号、信号
量、套接字
多进程:
⾸先,先来讲⼀下fork之后,发⽣了什么事情。
由fork创建的新进程被称为⼦进程(child process)。该函数被调⽤⼀次,但返回两次。两次返回的区别是⼦进程的返回值是0,⽽⽗进程的返回值则是新进程(⼦进程)的进程 id。将⼦进程id返回给⽗进程的理由是:因为⼀个进程的⼦进程可以多于⼀个,没有⼀个函数使⼀个进程可以获得其所有⼦进程的进程id。对⼦进程来说,之所以fork返回0给它,是因为它随时可以调⽤getpid()来获取⾃⼰的pid;也可以调⽤getppid()来获取⽗进程的id。(进程id 0总是由交换进程使⽤,所以⼀个⼦进程的进程id不可能为0 )。
fork之后,操作系统会复制⼀个与⽗进程完全相同的⼦进程,虽说是⽗⼦关系,但是在操作系统看来,他们更像兄弟关系,这2个进程共享代码空间,但是数据空间是互相独⽴的,⼦进程数据空间中的内容是⽗进程的完整拷贝,指令指针也完全相同,⼦进程拥有⽗进程当前运⾏到的位置(两进程的程序计数器pc值相同,也就是说,⼦进程是从fork返回处开始执⾏的),但有⼀点不同,如果fork成功,⼦进程中fork的返回值是0,⽗进程中fork的返回值是⼦进程的进程号,如果fork不成功,⽗进程会返回错误。
可以这样想象,2个进程⼀直同时运⾏,⽽且步调⼀致,在fork之后,他们分别作不同的⼯作,也就是分岔了。这也是fork为什么叫fork的原因
⾄于哪⼀个最先运⾏,可能与操作系统(调度算法)有关,⽽且这个问题在实际应⽤中并不重要,如果需要⽗⼦进程协同,可以通过原语的办法解决。
常见的通信⽅式:
每个进程各⾃有不同的⽤户地址空间,任何⼀个进程的全局变量在另⼀个进程中都看不到,所以进程之间要交换数据必须通过内核,在内核中
开辟⼀块缓冲区,进程A把数据从⽤户空间拷到内核缓冲区,进程B再从内核缓冲区把数据读⾛,内核提供的这种机制称为进程间通信。
不同进程间的通信本质:进程之间可以看到⼀份公共资源;⽽提供这份资源的形式或者提供者不同,造成了通信⽅式不同。
管道是⼀种具有两个端点的通信通道,⼀个管道实际上就是只存在在内存中的⽂件,对这个⽂件操作需要两个已经打开⽂件进⾏,他们代表管道的两端,也叫两个句柄,管道是⼀种特殊的⽂件,不属于⼀种
⽂件系统,⽽是⼀种独⽴的⽂件系统,有⾃⼰的数据结构,根据管道的使⽤范围划分为⽆名管道和命名管道。
1. ⽆名管道pipe:
管道是⼀种半双⼯的通信⽅式,数据只能单向流动,⽽且只能在具有亲缘关系的进程间使⽤。进程的亲缘关系通常是指⽗⼦进程关系。
⽆名管道⽤于⽗进程和⼦进程之间,通常⽗进程创建管道,然后由通信的⼦进程继承⽗进程的读端点句柄和写端点句柄,或者⽗进程有读写句柄的⼦进程,这些⼦进程可以使⽤管道直接通信,不需要通过⽗进程。
2. ⾼级管道popen:
将另⼀个程序当做⼀个新的进程在当前程序进程中启动,则它算是当前程序的⼦进程,这种⽅式我们成为⾼级管道⽅式。
3. 命名管道FIFO:
有名管道也是半双⼯的通信⽅式,但是它允许⽆亲缘关系进程间的通信。
命名管道是为了解决⽆名管道只能在⽗⼦进程间通信⽽设计的,命名管道是建⽴在实际的磁盘介质或⽂件系统(⽽不是只存在内存中),任何进程可以通过⽂件名或路径建⽴与该⽂件的联系,命名管道需要⼀种FIFO⽂件(有先进先出的原则),虽然FIFO⽂件的inode节点在磁盘上,但仅是⼀个节点⽽已,⽂件的数据还是存在于内存缓冲页⾯中,和普通管道相同。
4. 消息队列MessageQueue:
消息队列是由消息的链表,存放在内核中并由消息队列标识符标识。消息队列克服了信号传递信息少、管道只能承载⽆格式字节流以及缓冲区⼤⼩受限等缺点。
消息队列是消息的链表,包括Posix消息队列和system v消息队列(Posix常⽤于线程,system常⽤于进程),有写权限的进程可以向消息队列中添加消息,有读权限的进程可以读⾛消息队列的消息。
5. 共享内存SharedMemory:
共享内存就是映射⼀段能被其他进程所访问的内存,这段共享内存由⼀个进程创建,但多个进程都可以访问(使多个进程可以访问同⼀块内存空间)。共享内存是最快的 IPC ⽅式,它是针对其他进程间通信⽅式运⾏效率低⽽专门设计的。它往往与其他通信机制,如信号量,配合使⽤,来实现进程间的同步和通信。
6. 信号 sinal :
信号是⼀种⽐较复杂的通信⽅式,⽤于通知接收进程某个事件已经发⽣。
除了⽤于进程间通信之外,进程还可以发送信号给进程本⾝。除了系统内核和root之外,只有具备相同id的进程才可以信号进⾏通信。
7. 信号量Semaphore:
信号量是⼀个计数器,可以⽤来控制多个进程对共享资源的访问。它常作为⼀种锁机制,防⽌某进程正在访问共享资源时,其他进程也访问该资源。因此,主要作为进程间以及同⼀进程内不同线程之间的同步⼿段。
8. 套接字Socket:
套接字也是⼀种进程间通信机制,与其他通信机制不同的是,它可⽤于不同机器间的进程通信。
通信过程如下:
  8.1命名socket
  SOCK_STREAM 式本地套接字的通信双⽅均需要具有本地地址,其中服务器端的本地地址需要明确指定,指定⽅法是使⽤ struct sockaddr_in 类型的变量。
  8.2 绑定
进程通信方式  SOCK_STREAM 式本地套接字的通信双⽅均需要具有本地地址,其中服务器端的本地地址需要明确指定,指定⽅法是使⽤ struct sockaddr_in 类型的变量,将相应字段赋值,再将其绑定在创建的服务器套接字上,绑定要使⽤ bind 系统调⽤,其原形如下:
int bind(int socket, const struct sockaddr *address, size_t address_len);
其中 socket表⽰服务器端的套接字描述符,address 表⽰需要绑定的本地地址,是⼀个 struct sockaddr_in 类型的变量,address_len 表⽰该本地地址的字节长度。
  8.3 监听
  服务器端套接字创建完毕并赋予本地地址值(名称,本例中为Server Socket)后,需要进⾏监听,等待客户端连接并处理请求,监听使⽤ listen 系统调⽤,接受客户端连接使⽤accept系统调⽤,它们的原形如下:
int listen(int socket, int backlog);
int accept(int socket, struct sockaddr *address, size_t *address_len);
其中 socket 表⽰服务器端的套接字描述符;backlog 表⽰排队连接队列的长度(若有多个客户端同时连接,则需要进⾏排队);address 表⽰当前连接客户端的本地地址,该参数为输出参数,是客户端传递过来的关于⾃⾝的信息;address_len 表⽰当前连接客户端本地地址的字节长度,这个参数既是输⼊参数,⼜是输出参数。
  8.4 连接服务器
  客户端套接字创建完毕并赋予本地地址值后,需要连接到服务器端进⾏通信,让服务器端为其提供处理服务。
  对于SOCK_STREAM类型的流式套接字,需要客户端与服务器之间进⾏连接⽅可使⽤。连接要使⽤ connect 系统调⽤,其原形为
int connect(int socket, const struct sockaddr *address, size_t address_len);
其中socket为客户端的套接字描述符,address表⽰⽬标服务器端的变量地址,是⼀个 struct sockaddr_in 类型的变量,address_len 表⽰服务器变量地址的字节长度。实现连接的代码如下:
connect(client_sockfd, (struct sockaddr*)&serv_address, sizeof(serv_address));
    8.5 相互发送接收数据
  ⽆论客户端还是服务器,都要和对⽅进⾏数据上的交互,这种交互也正是我们进程通信的主题。⼀个进程扮演客户端的⾓⾊,另外⼀个进程扮演服务器的⾓⾊,两个进程之间相互发送接收数据,这就是基于本地套接字的进程通信。发送和接收数据要使⽤ write 和 read 系统调⽤,它们的原形为:
int read(int socket, char *buffer, size_t len);
int write(int socket, char *buffer, size_t len);
其中 socket 为套接字描述符;len 为需要发送或需要接收的数据长度;
  对于 read 系统调⽤,buffer 是⽤来存放接收数据的缓冲区,即接收来的数据存⼊其中,是⼀个输出参数;
  对于 write 系统调⽤,buffer ⽤来存放需要发送出去的数据,即 buffer 内的数据被发送出去,是⼀个输⼊参数;返回值为已经发送或接收的数据长度。
  8.6 断开连接
  交互完成后,需要将连接断开以节省资源,使⽤close系统调⽤,其原形为:
int close(int socket);
⽆名管道:
管道如何实现进程间的通信
(1)⽗进程创建管道,得到两个⽂件描述符指向管道的两端 int pipe(int fd[2]);//创建管道,fd[0]读端,fd[1]写端
(2)⽗进程fork出⼦进程,⼦进程也有两个⽂件描述符指向同⼀个管道。
(3)⽗进程关闭fd[0],⼦进程关闭fd[1],即⽗进程关闭管道读端,⼦进程关闭管道写端(因为管道只⽀持单向通信)。⽗进程可以往管道写,⼦进程可以从管道读,管道是环形队列实现的,数据从写端流⼊从读端流出,这样就实现了进程间通信。
管道读取数据的四种的情况
(1)读端不读,写端⼀直写
(2)写端不写,但是读端⼀直读
(3)读端⼀直读,且fd[0]保持打开,⽽写端写了⼀部分数据不写了,并且关闭fd[1]。
如果⼀个管道读端⼀直在读数据,⽽管道写端的引⽤计数⼤于0决定管道是否会堵塞,引⽤计数⼤于0,只读不写会导致管道堵塞。(4)读端读了⼀部分数据,不读了且关闭fd[0],写端⼀直在写且f[1]还保持打开状态。
总结: 如果⼀个管道的写端⼀直在写,⽽读端的引⽤计数是否⼤于0决定管道是否会堵塞,引⽤计数⼤于0,只写不读再次调⽤write会导致管道堵塞;
如果⼀个管道的读端⼀直在读,⽽写端的引⽤计数是否⼤于0决定管道是否会堵塞,引⽤计数⼤于0,只读不写再次调⽤read会导致管道堵塞;
⽽当他们的引⽤计数等于0时,只写不读会导致写端的进程收到⼀个SIGPIPE信号,导致进程终⽌,只读不写会导致read返回0,就像读到⽂件末尾⼀样。管道特点
信号:
信号是Linux 系统中⽤于进程之间通信或操作的⼀种机制,信号可以在任何时候发送给某⼀进程,⽽⽆须知道该进程的状态。如果该进程并未处于执⾏状态,则该信号就由内核保存起来,直到该进程恢复执⾏并传递给他为⽌。如果⼀个信号被进程设置为阻塞,则该信号的传递被延迟,直到其阻塞被取消时才被传递给进程。
Linux 提供了⼏⼗种信号,分别代表着不同的意义。信号之间依靠他们的值来区分,但是通常在程序中使⽤信号的名字来表⽰⼀个信号。在Linux 系统中,这些信号和以他们的名称命名的常量被定义在/usr/includebitssignum.h ⽂件中。通常程序中直接包含<signal.h>就好。
信号是在软件层次上对中断机制的⼀种模拟,是⼀种异步通信⽅式,信号可以在⽤户空间进程和内核之间直接交互。内核也可以利⽤信号来通知⽤户空间的进程来通知⽤户空间发⽣了哪些系统事件。信号事件有两个来源:
1)硬件来源,例如按下了cltr+C ,通常产⽣中断信号sigint
2)软件来源,例如使⽤系统调⽤或者命令发出信号。最常⽤的发送信号的系统函数是kill,raise,setitimer,sigation,sigqueue 函数。软件来源还包括⼀些⾮法运算等操作。
⼀旦有信号产⽣,⽤户进程对信号产⽣的响应有三种⽅式:
1)执⾏默认操作,linux 对每种信号都规定了默认操作。
2)捕捉信号,定义信号处理函数,当信号发⽣时,执⾏相应的处理函数。
3)忽略信号,当不希望接收到的信号对进程的执⾏产⽣影响,⽽让进程继续执⾏时,可以忽略该信号,即不对信号进程作任何处理。  有两个信号是应⽤进程⽆法捕捉和忽略的,即SIGKILL 和SEGSTOP ,这是为了使系统管理员能在任何时候中断或结束某⼀特定的进程。  1.管道只允许具有⾎缘关系的进程间通信,如⽗⼦进程间的通信。
2.管道只允许单向通信。
3.管道内部保证同步机制,从⽽保证访问数据的⼀致性。
4.⾯向字节流
5.管道随进程,进程在管道在,进程消失管道对应的端⼝也关闭,两个进程都消失管道也消失。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。