Linux网络编程之Socket初探

Socket由来

Socket 的英文原意就是“孔”或“插座”,现在,作为 BSD UNIX 的进程通讯机制,取其后一种意义。一起看下网络编程里说的socket定义:

每一个 Socket 都用一个半相关描述:{协议,本地地址,本地端口}

一个完整的 Socket 则用一个相关描述{协议,本地地址,本地端口,远程地址,远程端口}

每一个 Socket 有一个本地的唯一 Socket 号,由操作系统分配

上面说的“本地地址”就是隔壁王大妈口中的IP(Internet Protocol),请注意这里的本地地址,不专指“LocalHost-127.0.0.1”。好,那么问题来了,那个“本地端口”是嘛玩意儿?

让俺来说上一说。

不同Host主机需要通信,必须依赖网络,我们知道要通讯,需要有一个实体去处理此链接上的数据(称之为进程),既然进程的PID(Process Identity,即进程唯一标示符)在当前系统是唯一的,为何不能把IP和PID绑定一起呢?

展开说说应用进程之间的通信之七大姑八大姨:

两个主机进行通信实际上就是两个主机中的应用进程互相通信。 

应用进程之间的通信又称为端到端的通信。 

运输层的一个很重要的功能就是复用和分用。应用层不同进程的报文通过不同的端口向下交到运输层,再往下就共用网络层提供的服务。

“运输层提供应用进程间的逻辑通信”。“逻辑通信”的意思是:运输层之间的通信好像是沿水平方向传送数据。但事实上这两个运输层之间并没有一条水平方向的物理连接。即没有一条网线真实网线直链在你和服务器之间。

如图所示,

Linux网络编程之Socket初探_第1张图片
客户端与服务器之间的逻辑通信

那么进程维护的链接上的数据怎么发送和接收的呢?这就需要IP(网卡需要先绑定一个IP,也可绑定多个IP)和一根能用的网线搞在一起,再需要一个“第三者”----路由器/交换机,负责把数据转发出去。

运输层的端口

运行在计算机中的进程是用进程标识符来标志的

运行在应用层的各种应用进程却不应当让计算机操作系统指派它的进程标识符。这是因为在因特网上使用的计算机的操作系统种类很多,而不同的操作系统又使用不同格式的进程标识符。为了使运行不同操作系统的计算机的应用进程能够互相通信,就必须用统一的方法对 TCP/IP 体系的应用进程进行标志。 

那么接下来,需要解决的问题如下:

由于进程的创建和撤销都是动态的,发送方几乎无法识别其他机器上的进程。

有时我们会改换接收报文的进程,但并不需要通知所有发送方。

我们往往需要利用目的主机提供的功能来识别终点,而不需要知道实现这个功能的进程。

解决这个问题的方法就是引入一个第三者,对,万能的第三者----议端口号(protocol port number)或通常简称为端口(port)。虽然通信的终点是应用进程,但我们可以把端口想象是通信的终点,因为我们只要把要传送的报文交到目的主机的某一个合适的目的端口,剩下的工作(即最后交付目的进程)就由 TCP 来完成。一句话:把进程和一个socket{主机地址:端口}绑定一起,通过他们的爱情结晶socket_fd(socket file descriptor)就可以愉快地发送“Marry Me?”给你的另一半(服务器,一个地道的高富帅--能同时处理百万个告白者,比如你这样的)了。嗯,如果不想让你的高富帅服务器响应其他人的请求,可以采用下一篇文章介绍的“网络编程之阻塞模型”,实现服务器和客户端的一对一全称处理。

题外话,端口的特性:

端口用一个 16 位端口号进行标志,内核采用unsigned short int 来定义和描述她。

端口号只具有本地意义,即端口号只是为了标志本计算机应用层中的各进程。在因特网中不同计算机的相同端口号是没有联系的。

好,说了这么多废话,用我自己的理解来总一下socket:

当我们想给男友打电话的时候,必须先买一部手机(上面说的socket),此时这个电话不能对外拨打或接听电话,只具有“本地含义”----匿名socket,尚不能对外通信。接着需要买一张电话卡(电话号码就是上面说的IP地址,全球唯一),等待信号(这里信号理解为通道,入口。)即可拨打电话了。此时,一个socket就是一个IP和端口绑定(命名)后的联合体了。我们人类称之为:通信媒介Socket。

注明:这里的联合体不是C语言里的union。


套接字的三种类型

套接字有三种类型:流式套接字(SOCK_STREAM),数据报套接字(SOCK_DGRAM)及(Raw)原始套接字。

1.流式套接字(SOCK_STREAM)

流式的套接字可以提供可靠的、面向连接的通讯流。如果你通过流式套接字发送的数据为:“1”、“2”。那么数据到达远程时候的顺序也是“1”、“2”。

2.数据报套接字(SOCK_DGRAM)

数据报套接字定义了一种无连接的服务,数据通过相互独立的报文进行传输,是无序的,并且不保证可靠,无差错。

3.原始套接字

原始套接字主要用于一些协议的开发,可以进行比较底层的操作。它功能强大,但是没有上面介绍的两种套接字使用方便,一般的程序也涉及不到原始套接字。


同一个名词 socket有多种不同的意思 

应用编程接口 API 称为 socket API, 简称为 socket。

socket API 中使用的一个函数名也叫作 socket。

调用 socket 函数的端点称为 socket。

调用 socket 函数时其返回值称为 socket 描述符,可简称为 socket。

在操作系统内核中连网协议的 Berkeley 实现,称为 socket 实现。   

好,简单总结了一下socket的概念,由来等,下一篇文章一起看看操作系统如何创建一个socket,并用此socket通信。

你可能感兴趣的:(Linux网络编程之Socket初探)