Python网络编程之初识TCP,UDP
这篇文章是读了《Python核心编程》第三版(Core Python Applications)的第二章网络编程后的自我总结。 如果有不到位或者错误的地方,还请大家积极指出。
首先谈谈TCP和UDP的不同
这个问题出现在很多次Python面试题中,以下答案是我根据书本来总结出的:
在谈该问题之前,我需要先简单说一下套接字的概念:
套接字是计算机网络数据结构,他体现了“通信端点的”概念。在任何类型的通信开始之前,网络应用程序必须创建套接字。可以将他们比作电话插孔,没有它将无法进行通信。
有两种类型的套接字:基于文件(AF_UNIX)和面向网络(AF_INET)的。总的来说,Python只支持AF_UNIX、AF_NETLINK、AF_TIPC和AF_INET家族。
下面进入正题,不管采用哪种地址家族(AF_INET等),都有两种不同风格的套接字连接。
第一种是面向连接的,这意味着在进行通信之前必须先建立一个连接。这种类型的通信也称为
虚拟电路或流套接字。
虚拟电路或流套接字:实现这类连接类型的主要协议是传输控制协议(即为TCP协议),为了创建TCP套接字,必须使用 SOCK_STREAM作为套接字类型。
除此之外还有一种风格的套接字连接,该类型与虚拟电路形成鲜明的对比,它是一种无连接的套接字。这种类型的通信也称为**数据报类型的套接字
数据报类型的套接字:实现该类连接类型的主要协议是用户数据报协议(即为UDP协议),为了创建UDP套接字,必须使用 SOCK_DGRAM 作为套接字类型。
下面说说两种套接字的不同,除了先前提到的TCP需要在通信前建立连接,UDP不需要外,我们需要只要,有得便有舍。
TCP的传输数据方式提供序列化的、可靠的和不重复的数据交付,而没有记录边界。这基本上意味着每条消息可以拆分成多个片段,并且每一条消息片段都能确保能够到达目的地,然后将它们按顺序组合在一起,最后将完整的消息传递给正在等待的应用程序。
UDP的传输方式,虽不要通信前建立连接,,但是在数据传输过程中,并无法保证他的顺序性、可靠性或重复性。However,数据报确实保存了记录边界,所以这意味着消息是以整体发送的。它的**优势**在于,不需要对虚拟电路那样的维护,所以节省很大一笔开销,成本即更加“低廉”。
简单了解完TCP和UDP,下面进入Python中的网络编程。
首先要了解Python中的 socket()模块函数,这一块支持创建套接字。 接下来的代码全部基于Python3.X
socket的一般语法:
socket(socket_family, socket_type, protect=0)
其中,socket_family是AF_UNIX或者AF_INET, socket_type是SOCK_STREAM或SOCK_DGRAM. protect 一般省略
import socket
# 创建TCP/IP套接字
TcpSock = socket(AF_INET, SOCK_STREAM)
# 创建UDP/IP套接字
UdpSock = socket(AF_INET, SOCK_DGRAM)
下面结合之前所学知识,创建**TCP时间戳服务器和TCP时间戳客户端**,再次申明,以下代码全部基于Python3.X
# TCP时间戳服务器 # encoding = 'utf-8' from socket import * from time import ctime HOST = '127.0.0.1' #或者 localhost PORT = 25677 #该通信端口应该和客户端的通信端口一致,如果测试阶段出现[WinError 10048] 通常每个套接字地址(协议/网络地址/端口)只允许使用一次,可以改变这个数字范围为0~65535,小于1024的预留给了系统,尽量不要使用。 BUFSIZ = 1024 #1kb ADDR = (HOST, PORT) tcpSerSock = socket(AF_INET, SOCK_STREAM) tcpSerSock.bind(ADDR) tcpSerSock.listen(5) while True: print('waiting for connection...') tcpCliSock, addr = tcpSerSock.accept() print('...connected from:', addr) while True: data = tcpCliSock.recv(BUFSIZ) if not data: break tcpCliSock.send(bytes('[%s] %s' % (ctime(), data.decode('utf-8')), 'utf-8')) #这个地方一定要用bytes进行转换成字节,且要主要缩进问题 tcpCliSock.close() tcpSerSock.close() #如果一直有客户端输入,该函数则一直不会调用。
# TCP时间戳客户端 # encoding = 'utf-8' from socket import * HOST = '127.0.0.1' PORT = 25677 BUFSIZ = 1024 ADDR = (HOST, PORT) tcpCliSock = socket(AF_INET, SOCK_STREAM) tcpCliSock.connect(ADDR) while True: data = input('> ') if not data: break tcpCliSock.send(bytes(data, 'utf-8')) #同样要用bytes函数转换成字节 data = tcpCliSock.recv(BUFSIZ) if not data: break print(data.decode('utf-8')) #打印时间戳信息,需要转换成字符串显示在控制台上 tcpCliSock.close()
下面是**UDP时间戳服务器和UDP时间戳客户端**:
#UDP时间戳服务器 # encoding = 'utf-8' from socket import * from time import ctime HOST = '' PORT = 23135 BUFSIZ = 1024 ADDR = (HOST,PORT) udpSerSock = socket(AF_INET, SOCK_DGRAM) udpSerSock.bind(ADDR) while True: print('waiting for message...') data, addr = udpSerSock.recvfrom(BUFSIZ) udpSerSock.sendto(bytes(ctime(), 'utf-8'), addr) print('...received from and returned to:' , addr) udpSerSock.close()
#UDP时间戳客户端 # encoding = 'utf-8' from socket import * HOST = 'localhost' PORT = 23135 BUFSIZ = 1024 ADDR = (HOST,PORT) udpCliSock = socket(AF_INET, SOCK_DGRAM) #与TCP不同的是不用connect while True: data = input('> ') if not data: break udpCliSock.sendto(bytes(data,'utf-8'),ADDR) data, ADDR = udpCliSock.recvfrom(BUFSIZ) if not data: break print(data.decode('utf-8')) udpCliSock.close()
所以,是先运行服务器,还是先运行客户端呢? 毫无疑问,**首先启动服务器(在任何客户端想要试图连接之前)**
UDP时间戳服务器:
后续会继续更改完善文章,包括对代码的注释等,如果有任何问题,欢迎大家在下方留言!~
下一篇将是正则表达式的学习心得...