Python网络编程

其实这个问题一直困扰我。我算是一个目的驱动型的人。所以我觉得做一件事情,当你知道为什么要去做,那么你做这件事情的时候就不会迷茫。知道干这件事可以得到什么,那干这件事才会持久。那第一个问题就是:

我们为什么要学习网络编程?️

因为我们现在所有的程序都是在网络中的。很少有单机版的程序了。
计算机网络就是把各个计算机连接到一起,让网络中的计算机可以互相通信。网络编程就是如何在程序中实现两台计算机的通信。
举个例子,当你使用浏览器访问新浪网时,你的计算机就和新浪的某台服务器通过互联网连接起来了,然后,新浪的服务器把网页内容作为数据通过互联网传输到你的电脑上。
由于你的电脑上可能不止浏览器,还有QQ、Skype、Dropbox、邮件客户端等,不同的程序连接的别的计算机也会不同,所以,更确切地说,网络通信是两台计算机上的两个进程之间的通信。比如,浏览器进程和新浪服务器上的某个Web服务进程在通信,而QQ进程是和腾讯的某个服务器上的某个进程在通信。所以


Python网络编程_第1张图片
Socket

在网络编程之前,要知道一个概念,叫socket(套接字)。Socket是一个“五元组”。这个五元组包括[(协议,本地IP地址,本地端口号,远程IP地址,远程端口号)]。Socket是网络编程的一个抽象概念。通常我们用一个Socket表示“打开了一个网络链接”,而打开一个Socket需要知道目标计算机的IP地址和端口号,再指定协议类型即可。

网络编程的类型:

在传输层有两种协议:有连接的,可靠的,面向字节流的TCP和无连接的,不可靠的UDP。

TCP编程

大多数连接都是可靠的TCP连接。创建TCP连接时,主动发起连接的叫客户端,被动响应连接的叫服务器。

客户端

举个例子,当我们在浏览器中访问新浪时,我们自己的计算机就是客户端,浏览器会主动向新浪的服务器发起连接。如果一切顺利,新浪的服务器接受了我们的连接,一个TCP连接就建立起来的,后面的通信就是发送网页内容了。
这个程序用作tcp的客户端:

import socket
  • 创建一个socket
s = socket.socket(socket.AF_INET,socket.SOCK_STREAM)

创建Socket时,AF_INET指定使用IPv4协议,如果要用更先进的IPv6,就指定为AF_INET6。SOCK_STREAM指定使用面向流的TCP协议,这样,一个Socket对象就创建成功,但是还没有建立连接。

  • 建立连接
    传入的参数是一个元组,客户端要主动发起TCP连接,必须知道服务器的IP地址和端口号
s.connect(('www.sina.com.cn',80))

建立好连接以后,我们就可以向新浪服务器

  • 发送请求
#发送数据
s.send(b'GET / HTTP/1.1\r\nHost: www.sina.com.cn\r\nConnection: close\r\n\r\n')
  • 接收数据
buffer = []
while True:
    #每次最多接受1K字节
    d = s.recv(1024)
    if d:
        buffer.append(d)
    else:
        break
data = b''.join(buffer)
  • 当数据接收完,调用close()
#关闭连接
s.close()

接收到的数据包括HTTP头和网页本身,我们只需要把HTTP头和网页分离一下,把HTTP头打印出来,网页内容保存到文件:

header, html = data.split(b'\r\n\r\n', 1)
print(header.decode('utf-8'))
# 把接收的数据写入文件:
with open('sina.html', 'wb') as f:
    f.write(html)
服务器

和客户端编程相比,服务器编程就要复杂一些。服务器进程首先要绑定一个端口并监听来自其他客户端的连接。如果某个客户端连接过来了,服务器就与该客户端建立Socket连接,随后的通信就靠这个Socket连接了。我们可以把socket函数看作是一个文本类型,即可以对其进行读写操作。
所以,服务器会打开固定端口(比如80)监听,每来一个客户端连接,就创建该Socket连接。由于服务器会有大量来自客户端的连接,所以,服务器要能够区分一个Socket连接是和哪个客户端绑定的。一个Socket依赖4项:服务器地址、服务器端口、客户端地址、客户端端口来唯一确定一个Socket。
但是服务器还需要同时响应多个客户端的请求,所以,每个连接都需要一个新的进程或者新的线程来处理,否则,服务器一次就只能服务一个客户端了。
我们来编写一个简单的服务器程序,它接收客户端连接,把客户端发过来的字符串加上Hello再发回去。
首先,创建一个基于IPv4和TCP协议的Socket:

import socket
import time,threading
#创建一个socket
s = socket.socket(socket.AF_INET,socket.SOCK_STREAM)

然后我们绑定监听的地址和端口。

s.bind(('127.0.0.1',9999))

紧接着,调用listen()方法开始监听端口,传入的参数指定等待连接的最大数量:

s.listen(5)
print('Waiting for connection......')

接下来,服务器程序通过一个永久循环来接受来自客户端的连接,accept()会等待并返回一个客户端的连接:

while True:
    #接受一个新连接:
    print("Blocking....")
    sock,addr = s.accept()
    #创建新线程来处理TCP连接
    print(sock)
    t = threading.Thread(target=tcplink, args=(sock, addr))
    t.start()

这里我们需要创建一个线程处理函数来处理事务:

def tcplink(sock, addr):
    print('Accept new connection from %s:%s...' % addr)
    sock.send(b'Welcome!')
    time.sleep(10)
    while True:
        data = sock.recv(1024)
        time.sleep(1)
        if not data or data.decode('utf-8') == 'exit':
            break
        sock.send(('Hello, %s!' % data.decode('utf-8')).encode('utf-8'))
    sock.close()
    print('Connection from %s:%s closed.' % addr)

这里我们要重点注意accept()函数:
accept函数返回一个二元组,sock是一个新的socket对象,用来接收和发送数据。addr表示另一端的socket地址。接下来我们就可以用sock对象发送和接收数据了。

运行的结果:
屏幕快照

现在我们可以再整理一下TCP编程的流程,我画了下面这个流程图:
TCP编程流程图.JPG

其实,这是网络编程最初级的阶段。接下来还有其他处理并发的方式。继续深入研究。

你可能感兴趣的:(Python网络编程)