最近在做一个服务器端程序,C/S结构。功能方面比较简单就是client端与server端建立连接,然后发送消息给server。我在server端会使用专门的线程处理一条socket连接。这就涉及到一个问题,如果socket连接断开(异常,正常)后,我如何才能感知到?server端这边是绝对被动的,sever端不能主动断开连接。也没有连接链路维持包之类的。client端发送数据的时间也是不定的。在socket连接断开后, server要能够感知到并释放资源。
这个问题在思考测试,询问同事之后,找到了一个方法,可以做到这一点。
当使用 select()函数测试一个socket是否可读时,如果select()函数返回值为1,且使用recv()函数读取的数据长度为0 时,就说明该socket已经断开。
为了更好的判定socket是否断开,我判断当recv()返回值小于等于0时,socket连接断开。但是还需要判断 errno是否等于 EINTR 。如果errno == EINTR 则说明recv函数是由于程序接收到信号后返回的,socket连接还是正常的,不应close掉socket连接。
PS:对于堵塞socket的recv函数会在以下三种情况下返回:
(1)recv到数据时,会返回。
(2)在整个程序接收到信号时,返回-1。errno = EINTR。//在程序的起始阶段,屏蔽掉信号的除外。部分信号还是屏蔽不掉的。
(3)socket出现问题时,返回-1.具体错误码看 man recv()
(4)一定要看 man 说明,很详细,很有帮助。
这种方法经过长时间测试后,是有效的。所以写出来让大家参考一下,请大家发表意见。
我的方法不一样,我用getsockopt来判断,还是蛮准确的
点击(此处)折叠或打开
- int SocketConnected(int sock)
- {
- if(sock <= 0)
- return 0;
- struct tcp_info info;
- intlen= sizeof(info);
- getsockopt(sock, IPPROTO_TCP, TCP_INFO,&info,(socklen_t *)&len);
- if((info.tcpi_state == TCP_ESTABLISHED)){
- //myprintf("socket connected ");
- return 1;
- }else{
- //myprintf("socket disconnected ");
- return 0;
- }
- }
包含
点击(此处)折叠或打开
- #include <linux/types.h>
- #include <asm/byteorder.h>
- #include <linux/config.h>
- #include <linux/skbuff.h>
- #include <linux/ip.h>
- #include <net/sock.h>
- http: //www.cse.scu.edu/~dclark/am_256_graph_theory/linux_2_6_stack/globals.html#index_t
- int SocketConnected(int sock)
- {
- if(sock <= 0)
- return 0;
- struct tcp_info info;
- intlen= sizeof(info);
- getsockopt(sock, IPPROTO_TCP, TCP_INFO,&info,(socklen_t *)&len);
- if((info.tcpi_state == TCP_ESTABLISHED)){
- //myprintf("socket connected ");
- return 1;
- }else{
- //myprintf("socket disconnected ");
- return 0;
- }
- }
下面我就上面的三种方法来做一下介绍。
(1)SO_KEEPALIVE 机制
这是socket库提供的功能,设置接口是setsockopt API:
BOOL bSet=TRUE;
setsockopt(hSocket,SOL_SOCKET,SO_KEEPALIVE,(const char*)&bSet,sizeof(BOOL));
根据MSDN的文档,如果为socket设置了KEEPALIVE选项,TCP/IP栈在检测到对方掉线后,
任何在该socket上进行的调用(发送/接受调用)就会立刻返回,错误号是WSAENETRESET ;
同时,此后的任何在该socket句柄的调用会立刻失败,并返回WSAENOTCONN错误。
该机制的缺点也很明显:
默认设置是空闲2小时才发送一个“保持存活探测分节”,不能保证实时检测!
当然也可以修改时间间隔参数,但是会影响到所有打开此选项的套接口!
关联了完成端口的socket可能会忽略掉该套接字选项。
(2)SIO_KEEPALIVE_VALS 机制
设置接口是WSAIoctl API:
点击(此处)折叠或打开
- DWORD dwError = 0L ;
- tcp_keepalive sKA_Settings ={0}, sReturned ={0};
- sKA_Settings.onoff = 1 ;
- sKA_Settings.keepalivetime = 5500 ;// Keep Alive in 5.5 sec.
- sKA_Settings.keepaliveinterval = 3000 ;// Resend if No-Reply
- if(WSAIoctl(skNewConnection, SIO_KEEPALIVE_VALS,&sKA_Settings,
- sizeof(sKA_Settings),&sReturned, sizeof(sReturned),&dwBytes,
- NULL,NULL)!= 0)
- {
- dwError = WSAGetLastError();
- }
该选项不同于SO_KEEPALIVE 机制的就是它是针对单个连接的,对系统其他的套接
口并不影响。
针对完成端口的socket,设置了SIO_KEEPALIVE_VALS后,激活包由TCP STACK来负责。
当网络连接断开后,TCP STACK并不主动告诉上层的应用程序,但是当下一次RECV或者SEND操作
进行后,马上就会返回错误告诉上层这个连接已经断开了.如果检测到断开的时候,在这个连接
上有正在PENDING的IO操作,则马上会失败返回.
该机制的缺点:
不通用啦。MS的API只能用于Windows拉。不过,优雅一些^_^.
(3)Heart-Beat线程
没说的。自己写一个后台线程,实现Heart-Beat包,客户端受到该包后,立刻返回相应的反馈 包。
该方法的好处是通用,但缺点就是会改变现有的通讯协议!
点击(此处)折叠或打开
- /* Net check Make sure you have not used OUT OF BAND DATA AND YOU CAN use OOB */
- int netcheck(int fd)
- {
- int buf_size = 1024;
- char buf[buf_size];
- //clear OOB DATA
- recv(fd, buf, buf_size);
- if(send(fd,(void *)"