其实这个问题一直困扰我。我算是一个目的驱动型的人。所以我觉得做一件事情,当你知道为什么要去做,那么你做这件事情的时候就不会迷茫。知道干这件事可以得到什么,那干这件事才会持久。那第一个问题就是:
我们为什么要学习网络编程?️
因为我们现在所有的程序都是在网络中的。很少有单机版的程序了。
计算机网络就是把各个计算机连接到一起,让网络中的计算机可以互相通信。网络编程就是如何在程序中实现两台计算机的通信。
举个例子,当你使用浏览器访问新浪网时,你的计算机就和新浪的某台服务器通过互联网连接起来了,然后,新浪的服务器把网页内容作为数据通过互联网传输到你的电脑上。
由于你的电脑上可能不止浏览器,还有QQ、Skype、Dropbox、邮件客户端等,不同的程序连接的别的计算机也会不同,所以,更确切地说,网络通信是两台计算机上的两个进程之间的通信。比如,浏览器进程和新浪服务器上的某个Web服务进程在通信,而QQ进程是和腾讯的某个服务器上的某个进程在通信。所以
Socket
在网络编程之前,要知道一个概念,叫socket(套接字)。Socket是一个“五元组”。这个五元组包括[(协议,本地IP地址,本地端口号,远程IP地址,远程端口号)]。Socket是网络编程的一个抽象概念。通常我们用一个Socket表示“打开了一个网络链接”,而打开一个Socket需要知道目标计算机的IP地址和端口号,再指定协议类型即可。
网络编程的类型:
在传输层有两种协议:有连接的,可靠的,面向字节流的TCP和无连接的,不可靠的UDP。
TCP编程
大多数连接都是可靠的TCP连接。创建TCP连接时,主动发起连接的叫客户端,被动响应连接的叫服务器。
客户端
举个例子,当我们在浏览器中访问新浪时,我们自己的计算机就是客户端,浏览器会主动向新浪的服务器发起连接。如果一切顺利,新浪的服务器接受了我们的连接,一个TCP连接就建立起来的,后面的通信就是发送网页内容了。
这个程序用作tcp的客户端:
import socket
- 创建一个socket
s = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
创建Socket时,AF_INET指定使用IPv4协议,如果要用更先进的IPv6,就指定为AF_INET6。SOCK_STREAM指定使用面向流的TCP协议,这样,一个Socket对象就创建成功,但是还没有建立连接。
- 建立连接
传入的参数是一个元组,客户端要主动发起TCP连接,必须知道服务器的IP地址和端口号
s.connect(('www.sina.com.cn',80))
建立好连接以后,我们就可以向新浪服务器
- 发送请求
#发送数据
s.send(b'GET / HTTP/1.1\r\nHost: www.sina.com.cn\r\nConnection: close\r\n\r\n')
- 接收数据
buffer = []
while True:
#每次最多接受1K字节
d = s.recv(1024)
if d:
buffer.append(d)
else:
break
data = b''.join(buffer)
- 当数据接收完,调用close()
#关闭连接
s.close()
接收到的数据包括HTTP头和网页本身,我们只需要把HTTP头和网页分离一下,把HTTP头打印出来,网页内容保存到文件:
header, html = data.split(b'\r\n\r\n', 1)
print(header.decode('utf-8'))
# 把接收的数据写入文件:
with open('sina.html', 'wb') as f:
f.write(html)
服务器
和客户端编程相比,服务器编程就要复杂一些。服务器进程首先要绑定一个端口并监听来自其他客户端的连接。如果某个客户端连接过来了,服务器就与该客户端建立Socket连接,随后的通信就靠这个Socket连接了。我们可以把socket函数看作是一个文本类型,即可以对其进行读写操作。
所以,服务器会打开固定端口(比如80)监听,每来一个客户端连接,就创建该Socket连接。由于服务器会有大量来自客户端的连接,所以,服务器要能够区分一个Socket连接是和哪个客户端绑定的。一个Socket依赖4项:服务器地址、服务器端口、客户端地址、客户端端口来唯一确定一个Socket。
但是服务器还需要同时响应多个客户端的请求,所以,每个连接都需要一个新的进程或者新的线程来处理,否则,服务器一次就只能服务一个客户端了。
我们来编写一个简单的服务器程序,它接收客户端连接,把客户端发过来的字符串加上Hello再发回去。
首先,创建一个基于IPv4和TCP协议的Socket:
import socket
import time,threading
#创建一个socket
s = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
然后我们绑定监听的地址和端口。
s.bind(('127.0.0.1',9999))
紧接着,调用listen()方法开始监听端口,传入的参数指定等待连接的最大数量:
s.listen(5)
print('Waiting for connection......')
接下来,服务器程序通过一个永久循环来接受来自客户端的连接,accept()会等待并返回一个客户端的连接:
while True:
#接受一个新连接:
print("Blocking....")
sock,addr = s.accept()
#创建新线程来处理TCP连接
print(sock)
t = threading.Thread(target=tcplink, args=(sock, addr))
t.start()
这里我们需要创建一个线程处理函数来处理事务:
def tcplink(sock, addr):
print('Accept new connection from %s:%s...' % addr)
sock.send(b'Welcome!')
time.sleep(10)
while True:
data = sock.recv(1024)
time.sleep(1)
if not data or data.decode('utf-8') == 'exit':
break
sock.send(('Hello, %s!' % data.decode('utf-8')).encode('utf-8'))
sock.close()
print('Connection from %s:%s closed.' % addr)
这里我们要重点注意accept()函数:
accept函数返回一个二元组,sock是一个新的socket对象,用来接收和发送数据。addr表示另一端的socket地址。接下来我们就可以用sock对象发送和接收数据了。
现在我们可以再整理一下TCP编程的流程,我画了下面这个流程图:
其实,这是网络编程最初级的阶段。接下来还有其他处理并发的方式。继续深入研究。