前几天在看apue第16章关于socket的例子,就是一个非常典型的socket服务器,关键代码如下:
void serve (int sockfd)
{
int ret;
int clfd;
int status;
FILE *fp;
pid_t pid;
char buf[BUFLEN];
for (;;) {
clfd = accept (sockfd, NULL, NULL);
if (clfd < 0) {
syslog (LOG_ERR, "accept error: %d, %s", errno, strerror (errno));
//if (errno == EOPNOTSUPP)
//{
// syslog (LOG_INFO, "retry..");
// continue;
//}
exit (1);
}
fp = popen ("/usr/bin/uptime", "r");
if (fp == NULL) {
sprintf (buf, "error: %s\n", strerror (errno));
ret = send (clfd, buf, strlen (buf), 0);
syslog (LOG_ERR, "write back %d for error", ret);
} else {
while (fgets (buf, BUFLEN, fp) != NULL)
{
ret = send (clfd, buf, strlen (buf), 0);
// very amazing, add these log will lead to accept failed with EOPNOTSUPP (95)
// maybe syslog used dgram socket confuse us..
syslog (LOG_ERR, "write back %d", ret);
}
pclose (fp);
}
close (clfd);
}
}
当accept成功返回一个连接clfd后,使用这个serve方法来服务客户端的请求,简单说就是通过popen启动uptime命令返回当前系统运行时长,然后将uptime的输出导出到clfd上返回给客户端。
正常的输出如下:
[yunhai@localhost 16.chapter]$ ./uptime_tcp_clt connect ok 02:02:26 up 6 days, 4:40, 5 users, load average: 0.00, 0.00, 0.00
但是与书上例子不同,为了查看服务端的活动情况,我在serve中加了几句syslog输出,以便通过 tail -f /var/log/messages 来查看服务运行的情况。
正常情况下服务输出如下:
ruptimed: write back 70
但是神奇的事情发生了,我再次启动客户端后,连不上服务器了:
[yunhai@localhost 16.chapter]$ ./uptime_tcp_clt connect failed, retry... connect failed, retry... connect failed, retry...
再看服务器进程,居然已经退出了,回来查看daemon日志,发现这么一句:
ruptimed: accept error: 95, Operation not supported
原来accept出错导致服务器退出了,错误码是95,。
如果我将加入的syslog注释掉,就一切正常,所以我怀疑是使用syslog和syslogd进程在进行UDP通讯传输日志时,干扰了accept从而导致后者失败。
但是这个过程具体是怎样的,目前还不得而知,只知道我用的端口是4201,改用其它端口也是这样。
我尝试过在失败后重启accept操作,结果陷入无穷循环,每次都得相同的错误。