【转载】进程间通信之 unix domain socket

一、知识准备
1、在linux中,一切皆为文件,所有不同种类的类型都被抽象成文件(比如:块设备,socket套接字,pipe队列)
2、操作这些不同的类型就像操作文件一样,比如增删改查等

二、环境准备
组件 版本
OS CentOS Linux release 7.5.1804

三、Unix domain socket 文件描述符
● 主要用于:运行在同一台机器上的2个进程相互之间的数据通信
● 它们和网络文件描述符非常相似(比如:TCP socket),但是比网络协议更底层,他们的通信发生在操作系统内核

先准备2个脚本:
server.py主要用于建立客户端的连接请求,并且接收客户端传来的数据,然后将收到的数据回传给客户端
client.py每隔1秒向服务端发送一次’hello world’

server.py:

import socket

server_addr = '/tmp/server.sock'

sock = socket.socket(socket.AF_UNIX, socket.SOCK_STREAM)
sock.bind(server_addr)
sock.listen(0)

while True:
    conn, clientAddr = sock.accept()
    while True:
        data = conn.recv(100)
        conn.sendall(data)

client.py:

import socket
import time

server_addr = '/tmp/server.sock'

sock = socket.socket(socket.AF_UNIX, socket.SOCK_STREAM)
sock.connect(server_addr)

while True:
    message = 'hello world!'
    sock.sendall(message)
    sock.recv(100)
    time.sleep(1)

sock.close()

先看下server.py的状态:

[root@localhost ~]# python /tmp/server.py &
[1] 2554
[root@localhost ~]# ls -l /proc/2554/fd
total 0
lrwx------ 1 root root 64 Nov  5 02:39 0 -> /dev/pts/0
lrwx------ 1 root root 64 Nov  5 02:39 1 -> /dev/pts/0
lrwx------ 1 root root 64 Nov  5 02:39 2 -> /dev/pts/0
lrwx------ 1 root root 64 Nov  5 02:39 3 -> socket:[28724]

[root@localhost ~]# grep 28724 /proc/net/unix
ffff90d8ba564000: 00000002 00000000 00010000 0001 01 28724 /tmp/server.sock

[root@localhost ~]# lsof -n | grep 28724
python    2554         root    3u     unix 0xffff90d8ba564000       0t0      28724 /tmp/server.sock

和TCP socket类似,进程1472也用于19803这个unix domain socket描述符的一个软链接(3 -> socket:[19803]),并且通过3找到了一个/tmp/server.sock的文件描述符

我们运行client.py并观察状态

[root@localhost ~]# python /tmp/client.py &
[2] 2555
[root@localhost ~]# ls -l /proc/2555/fd
total 0
lrwx------ 1 root root 64 Nov  5 02:39 0 -> /dev/pts/0
lrwx------ 1 root root 64 Nov  5 02:39 1 -> /dev/pts/0
lrwx------ 1 root root 64 Nov  5 02:39 2 -> /dev/pts/0
lrwx------ 1 root root 64 Nov  5 02:39 3 -> socket:[28728]

[root@localhost ~]# grep 28728 /proc/net/unix
ffff90d8b95b0400: 00000003 00000000 00000000 0001 03 28728

[root@localhost ~]# lsof -n | grep 28728
python    2555         root    3u     unix 0xffff90d8b95b0400       0t0      28728 socket

与server.py的行为差不多,只有一点差别就是client.py通过socket:[18974],找到的是一条socket

查看server.py发生的变化:

[root@localhost ~]# ls -l /proc/2554/fd
total 0
lrwx------ 1 root root 64 Nov  5 02:39 0 -> /dev/pts/0
lrwx------ 1 root root 64 Nov  5 02:39 1 -> /dev/pts/0
lrwx------ 1 root root 64 Nov  5 02:39 2 -> /dev/pts/0
lrwx------ 1 root root 64 Nov  5 02:39 3 -> socket:[28724]
lrwx------ 1 root root 64 Nov  5 02:39 4 -> socket:[28725]

server.py新增了一个4 -> socket:[28725],这是刚才客户端连接之后新打开的描述符

[root@localhost ~]# lsof -n | grep -E '28728|28724|28725'
python    2554         root    3u     unix 0xffff90d8ba564000       0t0      28724 /tmp/server.sock
python    2554         root    4u     unix 0xffff90d8b95b0000       0t0      28725 /tmp/server.sock
python    2555         root    3u     unix 0xffff90d8b95b0400       0t0      28728 socket
[root@localhost ~]# netstat -anp | grep unix | grep -E '28728|28724|28725'
unix  2      [ ACC ]     STREAM     LISTENING     28724    2554/python          /tmp/server.sock
unix  3      [ ]         STREAM     CONNECTED     28725    2554/python          /tmp/server.sock
unix  3      [ ]         STREAM     CONNECTED     28728    2555/python

到目前为止,整个unix domain socket的通信过程已经比较清晰的展现了:
● server.py启动之后,打开监听的描述符,等待来自客户端的连接请求
● client.py启动之后,与server连接成功,打开一个描述符用于与server.py通信
● server.py会再打开一个描述符用于与client.py进行数据通信

但是目前还有2个问题:
(1)/tmp/server.sock到底作用是什么
(2)server与client是怎么进行数据通信的

问题(1)
● /tmp/server.sock是操作系统的实体文件,拥有一个全局的文件系统描述符,这个描述符在操作系统中是唯一的
● server启动时打开了server.sock,就声名了与server.py建立连接就只能通过server.sock文件
● 这就相当于TCP socket中四元组中的两元(server_ip:server_port)

问题(2)
我们来使用strace命令看看server.py的内核调用

[root@localhost tmp]# strace -p 2554
strace: Process 2554 attached
recvfrom(4, "hello world!", 100, 0, NULL, NULL) = 12
sendto(4, "hello world!", 12, 0, NULL, 0) = 12
recvfrom(4, "hello world!", 100, 0, NULL, NULL) = 12
sendto(4, "hello world!", 12, 0, NULL, 0) = 12
recvfrom(4, "hello world!", 100, 0, NULL, NULL) = 12
sendto(4, "hello world!", 12, 0, NULL, 0) = 12

server.py在接收客户端数据的时候,使用了 4 -> socket:[28725]这个文件描述符

再看client.py的内核调用

[root@localhost tmp]# strace -p 2555
strace: Process 2555 attached
select(0, NULL, NULL, NULL, {0, 996991}) = 0 (Timeout)
sendto(3, "hello world!", 12, 0, NULL, 0) = 12
recvfrom(3, "hello world!", 100, 0, NULL, NULL) = 12
select(0, NULL, NULL, NULL, {1, 0})     = 0 (Timeout)
sendto(3, "hello world!", 12, 0, NULL, 0) = 12
recvfrom(3, "hello world!", 100, 0, NULL, NULL) = 12
sendto(3, "hello world!", 12, 0, NULL, 0) = 12
client.py在与server.py通信的时候使用了 3 -> socket:[28728]

结论:
● server.py与client.py连接建立成功之后,都会各自在自己的进程下创建一个软链接来指向socket描述符,该socket描述符来指向对应的socket内存空间(下面简称s_mem)
● client.py通过打开的文件描述符,找到s_mem,然后写入数据hello world!
● server.py通过打开的文件描述符,找到s_mem,然后读取数据hello world!,并且发送原封不动的发送这串数据给client.py
● client.py通过读取s_mem,获取从server.py传来的数据
● 循环往复

           client.py                         ser^er.py
           +---------------+                 +---------------+
           |pid:2555       |                 |pid:2554       |
           |    +-----+    |                 |    +-----+    |
           |    |fd:3 |    |                 |    |fd:4 |    |
           |    +-----+    |                 |    +-----+    |
           +---------------+                 +---------------+
                   |                                 |
                   |                                 |
                   v                                 v
            +--------------+                  +--------------+
            |socket:[28728]|                  |socket:[28725]|
            +------+-------+                  +------+-------+
                   |                                 |
user space         |                                 |
+---------------------------------------------------------------------+
kernel space       |                                 |
                   |                                 |
                   v                                 v
                 +------------------------------------+
                 |              socket                |
                 +------------------------------------+

四、小结
● /tmp/server.sock作为建立unix domain socket连接的唯一标识符
● unix domain socket连接建立完成之后在内存开辟一块空间,而server与client在这块内存空间中进行数据传输
● 在同一台机器上的进程通信,unix domain socket比tcp socket更快,因为它不需要网络协议栈,不需要打包拆包、计算校验和、维护序号和应答等等过程

五、参考资料
https://en.wikipedia.org/wiki/Unix_domain_socket

至此,本文结束
在下才疏学浅,有撒汤漏水的,请各位不吝赐教…

你可能感兴趣的:(python,ipc,unix,socket,进程间通信,本地,本地scoket)