在同一台宿主机下部署了两个docker,其中一个docker 容器会访问另一个docker 容器提供的的服务。
被访问者docker容器名cnn_model
启动:
sudo docker run -p 8503:8501 --name cnn_model --mount type=bind,source=/4T/home/experiment/model/cnn_model,target=/models/cnn_model -e MODEL_NAME=cnn_model -t tensorflow/serving &
被访问接口:
http://localhost:8503/v1/models/cnn_model:predict
访问者docker容器名test
启动:
sudo docker run -p 3940:3940 --name mytest -d mytest:latest
最开始我想当然的认为既然在同一宿主机下,ip肯定是localhost,可是当我request的时候,却报错了
Traceback (most recent call last):
File "/usr/local/python3/lib/python3.6/site-packages/flask/app.py", line 1988, in wsgi_app
response = self.full_dispatch_request()
......
File "/usr/local/python3/lib/python3.6/site-packages/requests/adapters.py", line 502, in send
raise ConnectionError(e, request=request)
requests.exceptions.ConnectionError: HTTPConnectionPool(host='localhost', port=8503): Max retries exceeded with url: /v1/models/cnn_model:predict (Caused by NewConnectionError(': Failed to establish a new connection: [Errno 111] Connection refused',))
根本就连接不上,docker exec -it test bash 进入test docker内部,telnet localhost 8503不通。事实上这时的localhost 应该指的是test的容器地址,而不是宿主机地址,不通也在情理之中。
那么用cnn_model 容器内部被分配的ip行不行呢?抱着试一试的态度,docker inspect cnn_model, 发现:
"NetworkSettings": {
...
"Ports": {
"8500/tcp": null,
"8501/tcp": [
{
"HostIp": "0.0.0.0",
"HostPort": "8503"
}
]
},
...
"Gateway": "172.17.0.1",
"GlobalIPv6Address": "",
"GlobalIPv6PrefixLen": 0,
"IPAddress": "172.17.0.3",
"IPPrefixLen": 16,
"IPv6Gateway": "",
...
可以看到该容器被分配的ip是:172.17.0.3
在test 容器内ping 172.17.0.3 发现ping得通,但是,telnet 172.17.0.3 8503,却被拒绝,证明自己还是 too simple了:
[root@60a28bde01c0 src]# telnet 172.17.0.3 8503
Trying 172.17.0.3...
telnet: connect to address 172.17.0.3: Connection refused
test 的ip 是172.17.0.4,里面也有个Gateway:172.17.0.1,我想换172.17.0.1试一下呢?
[root@60a28bde01c0 src]# telnet 172.17.0.1 8503
Trying 172.17.0.1...
Connected to 172.17.0.1.
Escape character is '^]'.
如您所见,telnet通了,大功告成!
虽然通了,但不想就这么善罢甘休,我想知道为什么172.17.0.1 8503可以,172.17.0.3 8503却不行,按理说应该是相反的结论才是!
于是我开始在网上找资料,最终在这篇文章里面得到了解答https://www.jianshu.com/p/21d66ca6115e
我照着文章的介绍尝试了一遍, 把cnn_model link一下:
docker run -p 3940:3940 --name mytest --link cnn_model:cnn_model mytest:latest
然后进入容器ping cnn_model,结果显示:
[root@f509aadf640a log]# ping cnn_model
PING cnn_model (172.17.0.3) 56(84) bytes of data.
64 bytes from cnn_model (172.17.0.3): icmp_seq=1 ttl=64 time=0.080 ms
64 bytes from cnn_model (172.17.0.3): icmp_seq=2 ttl=64 time=0.051 ms
64 bytes from cnn_model (172.17.0.3): icmp_seq=3 ttl=64 time=0.048 ms
说明ping 通了,而且ip 指向就是172.17.0.3,但是当我 telnet cnn_model 8503的时候:
[root@f509aadf640a log]# telnet cnn_model 8503
Trying 172.17.0.3...
telnet: connect to address 172.17.0.3: Connection refused
跟之前telnet 172.17.0.3 8503 结果一样,还是不通。
接着文章的内容我继续看环境变量
[root@f509aadf640a log]# env | grep -i cnn_model
CNN_MODEL_PORT_8501_TCP=tcp://172.17.0.3:8501
CNN_MODEL_PORT_8500_TCP=tcp://172.17.0.3:8500
CNN_MODEL_PORT_8501_TCP_PORT=8501
CNN_MODEL_ENV_MODEL_BASE_PATH=/models
CNN_MODEL_PORT=tcp://172.17.0.3:8500
CNN_MODEL_PORT_8501_TCP_PROTO=tcp
CNN_MODEL_NAME=/mytest2/cnn_model
CNN_MODEL_PORT_8500_TCP_PROTO=tcp
CNN_MODEL_PORT_8500_TCP_ADDR=172.17.0.3
CNN_MODEL_ENV_MODEL_NAME=cnn_model
CNN_MODEL_PORT_8500_TCP_PORT=8500
CNN_MODEL_PORT_8501_TCP_ADDR=172.17.0.3
到这个地方终于明白了,原来cnn_model link进的ip是172.17.0.3,但端口却是8501,因为8501是cnn_model容器暴露出来的端口,被我在启动的时候重新映射到8503了,我重新telnet cnn_model 8501:
[root@f509aadf640a log]# telnet cnn_model 8501
Trying 172.17.0.3...
Connected to cnn_model.
Escape character is '^]'.
毫无疑问,成功了!
那为什么172.17.0.1 8503也可以呢?因为172.17.0.1是网关可以通过它进行宿主机的通信,在宿主机里面cnn_model端口被转换成了8503,跟外部访问是一样的。但是如果要通过网关访问8501就不行了,因为8501没有暴露到宿主机里面,只能通过link进行容器之间的直接通信访问。
综上,同一宿主机docker之间的通信方式有两种:
1、通过网关和暴露至宿主机的端口(可能被转换)进行通信,本例中的:172.17.0.1:8503
2、通过被访问容器ip(可以通过link之类的方便获取)和容器暴露端口通信,本例中的:172.17.0.3:8501