accept方法对应的内核源码为
// net/socket.c SYSCALL_DEFINE3(accept, int, fd, struct sockaddr __user *, upeer_sockaddr, int __user *, upeer_addrlen) { return sys_accept4(fd, upeer_sockaddr, upeer_addrlen, 0); }
该方法调用了名为accept4的系统调用
// net/socket.c SYSCALL_DEFINE4(accept4, int, fd, struct sockaddr __user *, upeer_sockaddr, int __user *, upeer_addrlen, int, flags) { struct socket *sock, *newsock; struct file *newfile; ... sock = sockfd_lookup_light(fd, &err, &fput_needed); ... newsock = sock_alloc(); ... newsock->type = sock->type; newsock->ops = sock->ops; ... newfd = get_unused_fd_flags(flags); ... newfile = sock_alloc_file(newsock, flags, sock->sk->sk_prot_creator->name); ... err = sock->ops->accept(sock, newsock, sock->file->f_flags, false); ... fd_install(newfd, newfile); err = newfd; ... return err; ... }
方法描述
1. 根据fd找到对应的listening socket。
2. 调用sock_alloc方法新分配一个socket实例。
3. 将sock->type赋值给newsock->type,type值为SOCK_STREAM。
4. 将sock->ops赋值给newsock->ops,ops值为&inet_stream_ops。
5. 找一个未使用的文件描述符赋值给newfd。
6. 为newsock创建一个新的struct file实例,并赋值给newfile。
7. 调用sock->ops->accept方法继续执行accept逻辑,将获取到的struct sock赋值到newsock->sk字段。
8. 调用fd_install方法建立newfd到newfile的映射关系。
9. 返回newfd给用户。
在继续看sock->ops->accept方法之前,我们先说下struct socket和struct sock的关系。
1. struct socket是给用户使用的,struct sock是内核内部使用的。
2. struct socket是struct sock的一层wrapper,struct socket通过sk字段持有struct sock实例。
3. 使用逻辑一般是,先通过fd找到struct file, 再通过file->private_data找到struct socket,再通过sock->sk找到struct sock。
4. struct sock存放的是各种sock的通用数据,用面向对象的语言来说,它是一个基类,它的子类很多,比如struct tcp_sock等,当内核要访问子类数据时,先会把struct sock强转成子类类型,比如struct tcp_sock,再访问其内部字段。
我们继续来看上面的sock->ops->accept方法。
由第一篇文章我们可以知道,sock->ops->accept指向的方法为inet_accept。
// net/ipv4/af_inet.c int inet_accept(struct socket *sock, struct socket *newsock, int flags, bool kern) { struct sock *sk1 = sock->sk; ... struct sock *sk2 = sk1->sk_prot->accept(sk1, flags, &err, kern); ... sock_graft(sk2, newsock); newsock->state = SS_CONNECTED; err = 0; ... return err; } EXPORT_SYMBOL(inet_accept);
方法描述
1. 调用sk1->sk_prot->accept方法,从建立连接成功的sock队列中拿出一个sock,赋值给sk2。
2. 调用sock_graft方法,将sk2赋值到newsock->sk字段。
3. 设置newsock->state为SS_CONNECTED。
4. return 0 给上层,表示没有错误。
继续看下sk1->sk_prot->accept方法,由第一篇文章我们可以知道,sk1->sk_prot->accept指向的是inet_csk_accept方法。
// net/ipv4/inet_connection_sock.c struct sock *inet_csk_accept(struct sock *sk, int flags, int *err, bool kern) { struct inet_connection_sock *icsk = inet_csk(sk); struct request_sock_queue *queue = &icsk->icsk_accept_queue; struct request_sock *req; struct sock *newsk; ... /* Find already established connection */ if (reqsk_queue_empty(queue)) { long timeo = sock_rcvtimeo(sk, flags & O_NONBLOCK); /* If this is a non blocking socket don't sleep */ error = -EAGAIN; if (!timeo) goto out_err; error = inet_csk_wait_for_connect(sk, timeo); ... } req = reqsk_queue_remove(queue, sk); newsk = req->sk; ... return newsk; ... } EXPORT_SYMBOL(inet_csk_accept);
方法描述
1. 将icsk->icsk_accept_queue赋值给queue变量。
由上一篇文章我们可以知道,当tcp三次握手完成之后,会将连接建立成功的struct request_sock实例放到icsk->icsk_accept_queue队列中。
2. 判断queue指向的队列是否为空,如果不为空,则移除第一个struct request_sock实例,并赋值给req变量。
3. 将req->sk指向的struct sock实例赋值给newsk,并返回给上层。
4. 当queue指向的队列为空时,则根据flags中是否有O_NONBLOCK标志,设置timeo的值。
如果有O_NONBLOCK标志,timeo被赋值为0,如果没有,则被赋值为一个大于0的值。
5. 当timeo为0时,表示用户设置了socket的状态为nonblocking,返回-EAGAIN错误码。
6. 当timeo不为0时,调用inet_csk_wait_for_connect方法,等待有新的连接建立成功,并加入到icsk->icsk_accept_queue队列中。
看下inet_csk_wait_for_connect方法
// net/ipv4/inet_connection_sock.c static int inet_csk_wait_for_connect(struct sock *sk, long timeo) { struct inet_connection_sock *icsk = inet_csk(sk); DEFINE_WAIT(wait); ... for (;;) { prepare_to_wait_exclusive(sk_sleep(sk), &wait, TASK_INTERRUPTIBLE); ... if (reqsk_queue_empty(&icsk->icsk_accept_queue)) timeo = schedule_timeout(timeo); ... if (!reqsk_queue_empty(&icsk->icsk_accept_queue)) break; ... err = -EAGAIN; if (!timeo) break; } ... return err; }
方法描述
1. 通过宏DEFINE_WAIT,定义一个类型为struct wait_queue_entry的wait变量,用于阻塞时事件通知。
2. 调用prepare_to_wait_exclusive方法,将wait变量加入到事件变动通知队列sk_sleep(sk)中。
3. 调用schedule_timeout方法,堵塞线程timeo时间。
4. 当新连接建立好并放入到icsk->icsk_accept_queue队列,或者timeo超时,线程会从阻塞状态中退出。
5. 检查是否有新连接,如果有则返回。
6. 检查timeo剩余时间是否为0,如果是,则说明已经等待超时,返回错误码-EAGAIN给上层。
完。
本文分享自微信公众号 - Linux内核及JVM底层相关技术研究(ytcode),作者:wangyuntao
原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。
原始发表时间:2019-03-02
本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。
来源:oschina
链接:https://my.oschina.net/newchaos/blog/4339325