socket通讯原理及例程(⼀看就懂)
⾥⾯有疑问或者不正确的地⽅可以给我留⾔
对TCP/IP、、Socket编程这些词你不会很陌⽣吧?随着⽹络技术的发展,这些词充斥着我们的⽿朵。那么我想问:
1. 什么是TCP/IP、UDP?
2. Socket在哪⾥呢?
3. Socket是什么呢?
4. 你会使⽤它们吗?
什么是TCP/IP、UDP?
TCP/IP(Transmission Control Protocol/Internet Protocol)即传输控制协议/⽹间协议,是⼀个⼯业标准的协议集,它是为⼴域⽹(WANs)设计的。
UDP(User Data Protocol,⽤户数据报协议)是与TCP相对应的协议。它是属于TCP/IP协议族中的⼀种。
这⾥有⼀张图,表明了这些协议的关系。
TCP/IP协议族包括运输层、⽹络层、链路层。现在你知道TCP/IP与UDP的关系了吧。
在哪⾥呢?
在图1中,我们没有看到Socket的影⼦,那么它到底在哪⾥呢?还是⽤图来说话,⼀⽬了然。
原来Socket在这⾥。
Socket是什么呢?
Socket是应⽤层与TCP/IP协议族通信的中间软件抽象层,它是⼀组接⼝。在设计模式中,Socket其实就是⼀个门⾯模式,它把复杂的TCP/IP协议族隐藏在Socket接⼝后⾯,对⽤户来说,⼀组简单的接⼝就是全部,让Socket去组织数据,以符合指定的协议。
你会使⽤它们吗?
前⼈已经给我们做了好多的事了,⽹络间的通信也就简单了许多,但毕竟还是有挺多⼯作要做的。以前听到Socket编程,觉得它是⽐较⾼深的编程知识,但是只要弄清Socket编程的⼯作原理,神秘的⾯纱也就揭开了。
⼀个⽣活中的场景。你要打电话给⼀个朋友,先拨号,朋友听到电话铃声后提起电话,这时你和你的朋友就建⽴起了连接,就可以讲话了。等交流结束,挂断电话结束此次交谈。 ⽣活中的场景就解释了这⼯作原理,也许TCP/IP协议族就是诞⽣于⽣活中,这也不⼀定。
先从服务器端说起。服务器端先初始化Socket,然后与端⼝绑定(bind),对端⼝进⾏监听(listen),调⽤accept阻塞,等待客户端连接。在这时如果有个客户端初始化⼀个Socket,然后连接服务器(connect),
如果连接成功,这时客户端与服务器端的连接就建⽴了。客户端发送数据请求,服务器端接收请求并处理请求,然后把回应数据发送给客户端,客户端读取数据,最后关闭连接,⼀次交互结束。
============================================
我们深谙信息交流的价值,那⽹络中进程之间如何通信,如我们每天打开浏览器浏览⽹页 时,浏览器的进程怎么与web服务器通信的?当你⽤QQ聊天时,QQ进程怎么与服务器或你好友所在的QQ进程通信?这些都得靠socket?那什么是 socket?socket的类型有哪些?还有socket的基本函数,这些都是本⽂想介绍的。本⽂的主要内容如下:
1、⽹络中进程之间如何通信?
2、Socket是什么?
3、socket的基本操作
3.1、socket()函数
3.2、bind()函数
进程通信方式3.3、listen()、connect()函数
3.4、accept()函数
3.5、read()、write()函数等
3.6、close()函数
4、socket中TCP的三次握⼿建⽴连接详解
5、socket中TCP的四次握⼿释放连接详解
6、⼀个例⼦
1、⽹络中进程之间如何通信?
本地的进程间通信(IPC)有很多种⽅式,但可以总结为下⾯4类:
消息传递(管道、FIFO、消息队列)
同步(互斥量、条件变量、读写锁、⽂件和写记录锁、信号量)
共享内存(匿名的和具名的)
远程过程调⽤(Solaris门和Sun RPC)
但这些都不是本⽂的主题!我们要讨论的是⽹络中进程之间如何通信?⾸要解决的问题是如何唯⼀标识⼀个进程,否则通信⽆从谈起!在本地可以通过进程PID来唯⼀标识⼀个进程,但是在⽹络中这是⾏不通的。其实TCP/IP协议族已经帮我们解决了这个问题,⽹络层的“ip地址”可以唯⼀标识⽹络中的主机,⽽传输层的“协议+端⼝”可以唯⼀标识主机中的应⽤程序(进程)。这样利⽤三元组(ip地址,协议,端⼝)就可以标识⽹络的进程了,⽹络中的进程通信就可以利⽤这个标志与其它进程进⾏交互。
使⽤TCP/IP协议的应⽤程序通常采⽤应⽤编程接⼝:UNIX BSD的套接字(socket)和UNIX System V的TLI(已经被淘汰),来实现⽹络进程之间的通信。就⽬前⽽⾔,⼏乎所有的应⽤程序都是采⽤socket,⽽现在⼜是⽹络时代,⽹络中进程通信是⽆处不在,这就是我为什么说“⼀切皆socket”。
2、什么是Socket?
上⾯我们已经知道⽹络中的进程是通过socket来通信的,那什么是socket呢?socket起源于Unix,⽽Unix/Linux基本哲学之⼀就是“⼀切皆⽂件”,都可以⽤“打开open –> 读写write/read –> 关闭close”模式来操作。我的理解就是Socket就是该模式的⼀个实
现,socket即是⼀种特殊的⽂件,⼀些socket函数就是对其进⾏的操作(读/写IO、打开、关闭),这些函数我们在后⾯进⾏介绍。
socket⼀词的起源
在组⽹领域的⾸次使⽤是在1970年2⽉12⽇发布的⽂献IETF RFC33中发现的,撰写者为Stephen Carr、Steve Crocker和Vint Cerf。根据美国计算机历史博物馆的记载,Croker写道:“命名空间的元素都可称为套接字接⼝。⼀个套接字接⼝构成⼀个连接的⼀端,⽽⼀个连接可完全由⼀对套接字接⼝规定。”计算机历史博物馆补充道:“这⽐BSD的套接字接⼝定义早了⼤约12年。”
3、socket的基本操作
既然socket是“open—write/read—close”模式的⼀种实现,那么socket就提供了这些操作对应的函数接⼝。下⾯以TCP为例,介绍⼏个基本的socket接⼝函数。
3.1、socket()函数
int socket(int domain, int type, int protocol);
socket函数对应于普通⽂件的打开操作。普通⽂件的打开操作返回⼀个⽂件描述字,⽽socket()⽤于创建⼀个socket描述符(socket descriptor),它唯⼀标识⼀个socket。这个socket描述字跟⽂件描述字⼀样,后续的操作都有⽤到它,把它作为参数,通过它来进⾏⼀些读写操作。
正如可以给fopen的传⼊不同参数值,以打开不同的⽂件。创建socket的时候,也可以指定不同的参数创建不同的socket描述符,socket 函数的三个参数分别为:
domain:即协议域,⼜称为协议族(family)。常⽤的协议族有,AF_INET、AF_INET6、AF_LOCAL(或称AF_UNIX,Unix域socket)、AF_ROUTE等等。协议族决定了socket的地址类型,在通信中必须采⽤对应的地址,如AF_INET决定了要⽤ipv4地址(32位的)与端⼝号(16位的)的组合、AF_UNIX决定了要⽤⼀个绝对路径名作为地址。
type:指定socket类型。常⽤的socket类型有,SOCK_STREAM、SOCK_DGRAM、SOCK_RAW、SOCK_PACKET、
SOCK_SEQPACKET等等(socket的类型有哪些?)。
protocol:故名思意,就是指定协议。常⽤的协议有,IPPROTO_TCP、IPPTOTO_UDP、IPPROTO_SCTP、IPPROTO_TIPC等,它们分别对应TCP传输协议、UDP传输协议、STCP传输协议、TIPC传输协议(这个协议我将会单独开篇讨论!)。
注意:并不是上⾯的type和protocol可以随意组合的,如SOCK_STREAM不可以跟IPPROTO_UDP组合。当protocol为0时,会⾃动选择type类型对应的默认协议。
当我们调⽤socket创建⼀个socket时,返回的socket描述字它存在于协议族(address family,AF_XXX)空间中,但没有⼀个具体的地址。如果想要给它赋值⼀个地址,就必须调⽤bind()函数,否则就当调⽤connect()、listen()时系统会⾃动随机分配⼀个端⼝。
3.2、bind()函数
正如上⾯所说bind()函数把⼀个地址族中的特定地址赋给socket。例如对应AF_INET、AF_INET6就是把⼀个ipv4或ipv6地址和端⼝号组合赋给socket。
int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
函数的三个参数分别为:
sockfd:即socket描述字,它是通过socket()函数创建了,唯⼀标识⼀个socket。bind()函数就是将给这个描述字绑定⼀个名字。 addr:⼀个const struct sockaddr *指针,指向要绑定给sockfd的协议地址。这个地址结构根据地址创建socket时的地址协议族的不同⽽不同,如ipv4对应的是:
struct sockaddr_in {
sa_family_t sin_family;
in_port_t sin_port;
struct in_addr sin_addr;
};
struct in_addr {
uint32_t s_addr;
};
ipv6对应的是:
struct sockaddr_in6 {
sa_family_t sin6_family;
in_port_t sin6_port;
uint32_t sin6_flowinfo;
struct in6_addr sin6_addr;
uint32_t sin6_scope_id;
};
struct in6_addr {
unsigned char s6_addr[16];
};
Unix域对应的是:
#define UNIX_PATH_MAX 108
struct sockaddr_un {
sa_family_t sun_family;
char sun_path[UNIX_PATH_MAX];
};
addrlen:对应的是地址的长度。
通常服务器在启动的时候都会绑定⼀个众所周知的地址(如ip地址+端⼝号),⽤于提供服务,客户就可以通过它来接连服务器;⽽客户端就不⽤指定,有系统⾃动分配⼀个端⼝号和⾃⾝的ip地址组合。这就是为什么通常服务器端在listen之前会调⽤bind(),⽽客户端就不会调⽤,⽽是在connect()时由系统随机⽣成⼀个。
⽹络字节序与主机字节序
主机字节序就是我们平常说的⼤端和⼩端模式:不同的CPU有不同的字节序类型,这些字节序是指整数在内存中保存的顺序,这个叫做主机序。引⽤标准的Big-Endian和Little-Endian的定义如下:
a) Little-Endian就是低位字节排放在内存的低地址端,⾼位字节排放在内存的⾼地址端。
b) Big-Endian就是⾼位字节排放在内存的低地址端,低位字节排放在内存的⾼地址端。
⽹络字节序:4个字节的32 bit值以下⾯的次序传输:⾸先是0~7bit,其次8~15bit,然后16~23bit,最后是24~31bit。这种传输次序称作⼤端字节序。由于TCP/IP⾸部中所有的⼆进制整数在⽹络中传输时都
要求以这种次序,因此它⼜称作⽹络字节序。字节序,顾名思义字节的顺序,就是⼤于⼀个字节类型的数据在内存中的存放顺序,⼀个字节的数据没有顺序的问题了。
所以: 在将⼀个地址绑定到socket的时候,请先将主机字节序转换成为⽹络字节序,⽽不要假定主机字节序跟⽹络字节序⼀样使⽤的是Big-Endian。由于 这个问题曾引发过⾎案!公司项⽬代码中由于存在这个问题,导致了很多莫名其妙的问题,所以请谨记对主机字节序不要做任何假定,务必将其转化为⽹络字节序再 赋给socket。
3.3、listen()、connect()函数
如果作为⼀个服务器,在调⽤socket()、bind()之后就会调⽤listen()来监听这个socket,如果客户端这时调⽤connect()发出连接请求,服务器端就会接收到这个请求。
int listen(int sockfd, int backlog);
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
listen函数的第⼀个参数即为要监听的socket描述字,第⼆个参数为相应socket可以排队的最⼤连接个数。socket()函数创建的socket默认是⼀个主动类型的,listen函数将socket变为被动类型的,等待客户的连接请求。
connect函数的第⼀个参数即为客户端的socket描述字,第⼆参数为服务器的socket地址,第三个参数为socket地址的长度。客户端通过调⽤connect函数来建⽴与TCP服务器的连接。
3.4、accept()函数
TCP服务器端依次调⽤socket()、bind()、listen()之后,就会监听指定的socket地址了。TCP客户端依次调⽤socket()、connect()之后就想TCP服务器发送了⼀个连接请求。TCP服务器监听到这个请求之后,就会调⽤accept()函数取接收请求,这样连接就建⽴好了。之后就可以开始⽹络I/O操作了,即类同于普通⽂件的读写I/O操作。
int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
accept函数的第⼀个参数为服务器的socket描述字,第⼆个参数为指向struct sockaddr *的指针,⽤于返回客户端的协议地址,第三个参数为协议地址的长度。如果accpet成功,那么其返回值是由内核⾃动⽣成的⼀个全新的描述字,代表与返回客户的TCP连接。
注意:accept的第⼀个参数为服务器的socket描述字,是服务器开始调⽤socket()函数⽣成的,称为监听socket描述字;⽽accept函数返回的是已连接的socket描述字。⼀个服务器通常通常仅仅只创建⼀个监听socket描述字,它在该服务器的⽣命周期内⼀直存在。内核为每个由服务器进程接受的客户连接创建
了⼀个已连接socket描述字,当服务器完成了对某个客户的服务,相应的已连接socket描述字就被关闭。
3.5、read()、write()等函数
万事具备只⽋东风,⾄此服务器与客户已经建⽴好连接了。可以调⽤⽹络I/O进⾏读写操作了,即实现了⽹咯中不同进程之间的通信!⽹络I/O操作有下⾯⼏组:
read()/write()
recv()/send()
readv()/writev()
recvmsg()/sendmsg()
recvfrom()/sendto()
我推荐使⽤recvmsg()/sendmsg()函数,这两个函数是最通⽤的I/O函数,实际上可以把上⾯的其它函数都替换成这两个函数。它们的声明如下:
read函数是负责从fd中读取内容.当读成功时,read返回实际所读的字节数,如果返回的值是0表⽰已经读到⽂件的结束了,⼩于0表⽰出现了错误。如果错误为EINTR说明读是由中断引起的,如果是ECONNREST表⽰⽹络连接出了问题。 #include ssize_t read(int fd, void *buf, size_t count); ssize_t write(int fd, const void *buf, size_t count); #include #include ssize_t send(int sockfd, const void *buf, size_t len, int flags); ssize_t recv(int sockfd, void *buf, size_t len, int flags); ssize_t sendto(int sockfd, const void *buf, size_t len, int flags, const struct sockaddr *dest_addr, socklen_t addrlen); ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags, struct sockaddr *src_addr, socklen_t *addrlen); ssize_t sendmsg(int sockfd, const struct msghdr *msg, int flags); ssize_t recvmsg(int sockfd, struct msghdr *msg, int flags);
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论