lrping

Proxy源代码分析

Proxy源代码分析--谈谈如何学习linux网络编程

本文出自:http://www.china-pub.com 作者:李培源 (2001-08-10 12:00:00)

Linux是一个可靠性非常高的操作系统，但是所有用过Linux的朋友都会感觉到，Linux和Windows这样的"傻瓜"操作系统（这里丝毫没有贬低Windows的意思，相反这应该是Windows的优点）相比，后者无疑在易操作性上更胜一筹。但是为什么又有那么多的爱好者钟情于Linux呢，当然自由是最吸引人的一点，另外Linux强大的功能也是一个非常重要的原因，尤其是Linux强大的网络功能更是引人注目。放眼今天的WAP业务、银行网络业务和曾经红透半边天的电子商务，都越来越倚重基于Linux的解决方案。因此Linux网络编程是非常重要的，而且当我们一接触到Linux网络编程，我们就会发现这是一件非常有意思的事情，因为以前一些关于网络通信概念似是而非的地方，在这一段段代码面前马上就豁然开朗了。在刚开始学习编程的时候总是让人感觉有点理不清头绪，不过只要多读几段代码，很快我们就能体会到其中的乐趣了。下面我就从一段Proxy源代码开始，谈谈如何进行Linux网络编程。

　　首先声明，这段源代码不是我编写的，让我们感谢这位名叫Carl Harris的大虾，是他编写了这段代码并将其散播到网上供大家学习讨论。这段代码虽然只是描述了最简单的proxy操作，但它的确是经典，它不仅清晰地描述了客户机/服务器系统的概念，而且几乎包括了Linux网络编程的方方面面，非常适合Linux网络编程的初学者学习。
　　这段Proxy程序的用法是这样的，我们可以使用这个proxy登录其它主机的服务端口。假如编译后生成了名为Proxy的可执行文件，那么命令及其参数的描述为：
　　　./Proxy
　　其中参数proxy_port是指由我们指定的代理服务器端口。参数remote_host是指我们希望连接的远程主机的主机名，IP地址也同样有效。这个主机名在网络上应该是唯一的，如果您不确定的话，可以在远程主机上使用uname -n命令查看一下。参数service_port是远程主机可提供的服务名，也可直接键入服务对应的端口号。这个命令的相应操作是将代理服务器的proxy_port端口绑定到remote_host的service_port端口。然后我们就可以通过代理服务器的proxy_port端口访问remote_host了。例如一台计算机，网络主机名是legends，IP地址为10.10.8.221，如果在我的计算机上执行：
　　　[root@lee /root]#./proxy 8000 legends telnet
　　那么我们就可以通过下面这条命令访问legends的telnet端口。
-----------------------------------------------------------------
[root@lee /root]#telnet legends 8000
Trying 10.10.8.221...
Connected to legends(10.10.8.221).
Escape character is '^]'

Red Hat Linux release 6.2(Zoot)
Kernel 2.2.14-5.0 on an i686
Login:
-----------------------------------------------------------------
　　上面的绑定操作也可以使用下面的命令：
　　　[root@lee /root]#./proxy 8000 10.10.8.221 23
　　　23是telnet服务的标准端口号，其它服务的对应端口号我们可以在/etc/services中查看。

　　下面我就从这段代码出发谈谈我对Linux网络编程的一些粗浅的认识，不对的地方还请各位大虾多多批评指正。

◆main()函数
-----------------------------------------------------------------
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#include
#define TCP_PROTO　　 "tcp"
int proxy_port;　　　 /* port to listen for proxy connections on */
struct sockaddr_in hostaddr;　　 /* host addr assembled from gethostbyname() */
extern int errno;　　 /* defined by libc.a */
extern char *sys_myerrlist[];
void parse_args (int argc, char **argv);
void daemonize (int servfd);
void do_proxy (int usersockfd);
void reap_status (void);
void errorout (char *msg);
/*This is my modification.
I'll tell you why we must do this later*/
typedef void Signal(int);
/****************************************************************
function: 　　　main
description: 　 Main level driver. After daemonizing the process, a socket is opened to listen for 　　　　　　　　connections on the proxy port, connections are accepted and children are spawned to 　　　　　　　　handle each new connection.
arguments: 　　 argc,argv you know what those are.
return value: 　none.
calls: 　　　　 parse_args, do_proxy.
globals: 　　　 reads proxy_port.
****************************************************************/
main (argc,argv)
int argc;
char **argv;
{
　　　int clilen;
　　　int childpid;
　　　int sockfd, newsockfd;
　　　struct sockaddr_in servaddr, cliaddr;
　　　parse_args(argc,argv);
　　　/* prepare an address struct to listen for connections */
　　　bzero((char *) &servaddr, sizeof(servaddr));
　　　servaddr.sin_family = AF_INET;
　　　servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
　　　servaddr.sin_port = proxy_port;
　　　/* get a socket... */
　　　if ((sockfd = socket(AF_INET,SOCK_STREAM,0)) < 0) {
　　　　　fputs("failed to create server socket/r/n",stderr);
　　　　　exit(1);
　　　}
　　　/* ...and bind our address and port to it */
　　　if　　 (bind(sockfd,(struct sockaddr_in *) &servaddr,sizeof(servaddr)) < 0) {
　　　　　fputs("faild to bind server socket to specified port/r/n",stderr);
　　　　　exit(1);
　　　　}
　　　/* get ready to accept with at most 5 clients waiting to connect */
　　　listen(sockfd,5);
　　/* turn ourselves into a daemon */
　　daemonize(sockfd);
　　/* fall into a loop to accept new connections and spawn children */
　　while (1) {
　　　　/* accept the next connection */
　　　　clilen = sizeof(cliaddr);
　　　　newsockfd = accept(sockfd, (struct sockaddr_in *) &cliaddr, &clilen);
　　　　if (newsockfd < 0 && errno == EINTR)
　　　　　　continue;
　　　　/* a signal might interrupt our accept() call */
　　　　else if (newsockfd < 0)
　　　　　　/* something quite amiss -- kill the server */
　　　　errorout("failed to accept connection");
　　　　/* fork a child to handle this connection */
　　　　if ((childpid = fork()) == 0) {
　　　　　　close(sockfd);
　　　　　　do_proxy(newsockfd);
　　　　　　exit(0);
　　　　　}
　　　　/* if fork() failed, the connection is silently dropped -- oops! */
　　　　　lose(newsockfd);
　　　　　}
　　　}
-----------------------------------------------------------------
　　上面就是Proxy源代码的主程序部分，也许您在网上也曾经看到过这段代码，不过细心的您会发现在上面这段代码中我修改了两个地方，都是在预编译部分。一个地方是在定义外部字符型指针数组时，我将原代码中的
　　extern char *sys_errlist[];
修改为
　　extern char *sys_myerrlist[];原因是在我的Linux环境下头文件"stdio.h"已经对sys_errlist[]进行了如下定义：
　　extern __const char *__const sys_errlist[];
　　也许Carl Harris在94年编写这段代码时系统还没有定义sys_errlist[]，不过现在我们不修改一下的话，编译时系统就会告诉我们sys_errlist发生了定义冲突。
　　另外我添加了一个函数类型定义：
　　　typedef void Sigfunc(int);
　　具体原因我将在后面向大家解释。

套接字和套接字地址结构定义

　　这段主程序是一段典型的服务器程序。网络通讯最重要的就是套接字的使用，在程序的一开始就对套接字描述符sockfd和newsockfd进行了定义。接下来定义客户机/服务器的套接字地址结构cliaddr和servaddr，存储客户机/服务器的有关通信信息。然后调用parse_args(argc,argv)函数处理命令参数。关于这个parse_args()函数我们待会儿再做介绍。

创建通信套接字

　　下面就是建立一个服务器的详细过程。服务器程序的第一个操作是创建一个套接字。这是通过调用函数socket()来实现的。socket()函数的具体描述为：
-----------------------------------------------------------------
　　#include
　　#include
　　int socket(int domain, int type, int protocol);
-----------------------------------------------------------------
　　参数domain指定套接字使用的协议族，AF_INET表示使用TCP/IP协议族，AF_UNIX表示使用Unix协议族，AF_ISO表示套接字使用ISO协议族。type指定套接字类型，一般的面向连接通信类型（如TCP）设置为SOCK_STREAM，当套接字为数据报类型时，type应设置为SOCK_DGRAM，如果是可以直接访问IP协议的原始套接字则type应设置为SOCK_RAW。参数protocol一般设置为"0"，表示使用默认协议。当socket()函数成功执行时，返回一个标志这个套接字的描述符，如果出错则返回"-1"，并设置errno为相应的错误类型。

设置服务器套接字地址结构

　　在通常情况下，首先要将描述服务器信息的套接字地址结构清零，然后在地址结构中填入相应的内容，准备接受客户机送来的连接建立请求。这个清零操作可以用多种字节处理函数来实现，例如bzero()、bcopy()、memset()、memcpy()等，以字母"b"开始的两个函数是和BSD系统兼容的，而后面两个是ANSI C提供的函数。这段代码中使用的bzero()其描述为：
　　　void bzero(void *s, int n);
　　函数的具体操作是将参数s指定的内存的前n个字节清零。memset()同样也很常用，其描述为：
　　　void *memset(void *s, int c, size_t n);
　　具体操作是将参数s指定的内存区域的前n个字节设置为参数c的内容。
　　下一步就是在已经清零的服务器套接字地址结构中填入相应的内容。Linux系统的套接字是一个通用的网络编程接口，它应该支持多种网络通信协议，每一种协议都使用专门为自己定义的套接字地址结构（例如TCP/IP网络的套接字地址结构就是struct sockaddr_in）。不过为了保持套接字函数调用参数的一致性，Linux系统还定义了一种通用的套接字地址结构：
-----------------------------------------------------------------

struct sockaddr
{
　　unsigned short sa_family; /* address type */
　　char sa_data[14]; /* protocol address */
}
-----------------------------------------------------------------
　　其中sa_family意指套接字使用的协议族地址类型，对于我们的TCP/IP网络，其值应该是AF_INET，sa_data中存储具体的协议地址，不同的协议族有不同的地址格式。这个通用的套接字地址结构一般不用做定义具体的实例，但是常用做套接字地址结构的强制类型转换，如我们经常可以看到这样的用法：
　　　bind(sockfd,(struct sockaddr *) &servaddr,sizeof(servaddr))
　　用于TCP/IP协议族的套接字地址结构是sockaddr_in，其定义为：
-----------------------------------------------------------------

struct in_addr
{
　　__u32 s_addr;
};
　　struct sochaddr_in
{
　　short int sin_family;
　　unsigned short int sin_port;
　　struct in_addr sin_addr;
　　　/*This part has not been taken into use yet*/
　　　nsigned char_ _ pad[_ _ SOCK_SIZE__- sizeof(short int) -sizeof(unsigned short int) - 　　　　　　sizeof(struct in_addr)];
};
#define sin_zero_ - pad
-----------------------------------------------------------------
　　其中sin_zero成员并未使用，它是为了和通用套接字地址struct sockaddr兼容而特意引入的。在编程时，一般都通过bzero()或是memset（）将其置零。其他成员的设置一般是这样的：
　　　servaddr.sin_family = AF_INET;
　　表示套接字使用TCP/IP协议族。
　　　servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
　　设置服务器套接字的IP地址为特殊值INADDR_ANY，这表示服务器愿意接收来自任何网络设备接口的客户机连接。htonl()函数的意思是将主机顺序的字节转换成网络顺序的字节。
　　　servaddr.sin_port = htons(PORT);
　　设置通信端口号，PORT应该是我们已经定义好的。在本例中servaddr.sin_port = proxy_port;这是表示端口号是函数的返回值proxy_port。
　　另外需要说明的一点是，在本例中，我们并没有看到在预编译部分中包含有和这两个头文件，那是因为这两个头文件已经分别被包含在和中了，而且后面这两个头文件是与平台无关的，所以在网络通信中一般都使用这两个头文件。

服务器公开地址

　　如果服务器要接受客户机的连接请求，那么它必须先要在整个网络上公开自己的地址。在设置了服务器的套接字地址结构之后，可以通过调用函数bind()绑定服务器的地址和套接字来完成公开地址的操作。函数bind()的详细描述为：
-----------------------------------------------------------------
#include
#include
　　int bind(int sockfd, struct sockaddr *addr, int addrlen);
-----------------------------------------------------------------
　　参数sockfd是我们通过调用socket()创建的套接字描述符。参数addr是本机地址，参数addrlen是套接字地址结构的长度。函数执行成功时返回"0",否则返回"-1"，并设置errno变量为EADDRINUAER。
　　如果是服务器调用bind()函数，如果设置了套接字的IP地址为某个本地IP地址，那么这表示服务器只接受来自于这个IP地址的特定主机发出的连接请求。不过一般情况下都是将IP地址设置为INADDR_ANY，以便接受所有网络设备接口送来的连接请求。
　　客户机一般是不会调用bind()函数的，因为客户机在连接时不用指定自己的套接字地址端口号，系统会自动为客户机选择一个未用端口号，并且用本地IP地址自动填充客户机套接字地址结构中的相应项。但是在某些特定的情况下客户机需要使用特定的端口号，例如Linux中的rlogin命令就要求使用保留端口号，而系统是不能为客户机自动分配保留端口号的，这就需要调用bind()来绑定一个保留端口号了。不过在一些特殊的环境下，这样绑定特定端口号也会带来一些负面影响，如在HTTP服务器进入TIME_WAIT状态后，客户机如果要求再次与服务器建立连接，则服务器会拒绝这一连接请求。如果客户机最后进入TIME_WAIT状态，则马上再次执行bind（）函数时会返回出错信息"-1"，原因是系统会认为同时有两次连接绑定同一个端口。

转换Listening套接字

　　接下来，服务器需要将我们刚才与IP地址和端口号完成绑定的套接字转换成倾听listening套接字。只有服务器程序才需要执行这一步操作。我们通过调用函数listen()实现这一操作。listen()的详细描述为：
-----------------------------------------------------------------
#include
int listen(int sockfd, int backlog);
-----------------------------------------------------------------
　　参数sockfd指定我们要求转换的套接字描述符，参数backlog设置请求队列的最大长度。函数listen()主要完成以下操作。
　　首先是将套接字转换成倾听套接字。因为函数socket()创建的套接字都是主动套接字，所以客户机可以通过调用函数connect()来使用这样的套接字主动和服务器建立连接。而服务器的情况恰恰相反，服务器需要通过套接字接收客户机的连接请求，这就需要一个"被动"套接字。listen()就可将一个尚未连接的主动套接字转换成为这样的"被动"套接字，也就是倾听套接字。在执行了listen()函数之后，服务器的TCP就由CLOSED变成LISTEN状态了。
另外listen()可以设置连接请求队列的最大长度。虽然参数backlog的用法非常简单，只是一个简单的整数。但搞清楚请求队列的含义对理解TCP协议的通信过程建立非常重要。TCP协议为每个倾听套接字实际上维护两个队列，一个是未完成连接队列，这个队列中的成员都是未完成3次握手的连接；另一个是完成连接队列，这个队列中的成员都是虽然已经完成了3次握手，但是还未被服务器调用accept()接收的连接。参数backlog实际上指定的是这个倾听套接字完成连接队列的最大长度。在本例中我们是这样用的：listen(sockfd,5);表示完成连接队列的最大长度为5。

接收连接

　　接下来我们在主程序中看到通过名为daemonize()的自定义函数创建一个守护进程，关于这个daemonize()以及守护进程的相关概念，我们等一会儿再做详细介绍。然后服务器程序进入一个无条件循环，用于监听接收客户机的连接请求。在此过程中如果有客户机调用connect()请求连接，那么函数accept()可以从倾听套接字的完成连接队列中接受一个连接请求。如果完成连接队列为空，这个进程就睡眠。accept()的详细描述为：
-----------------------------------------------------------------
#include
　　int accept(int sockfd, struct sockaddr *addr, int *addrlen);
-----------------------------------------------------------------
　　参数sockfd是我们转换成功的倾听套接字描述符；参数addr是一个指向套接字地址结构的指针，参数addrlen为一个整型指针。当函数成功执行时，返回3个结果，函数返回一个新的套接字描述符，服务器可以通过这个新的套接字描述符和客户机进行通信。参数addr所指向的套接字地址结构中将存放客户机的相关信息，addrlen指针将描述前述套接字地址结构的长度。在通常情况下服务器对这些信息不是很感兴趣，因此我们经常可以看到一些源代码中将accept()函数的后两个参数都设置为NULL。不过在这段proxy源代码中需要用到有关的客户机信息，因此我们看到通过执行
　　　newsockfd = accept(sockfd, (struct sockaddr_in *) &cliaddr, &clilen);
　　将客户机的详细信息存放在地址结构cliaddr中。而proxy就通过套接字newsockfd与客户机进行通信。值得注意的是这个返回的套接字描述符与我们转换的倾听套接字是不同的。在一段服务器程序中，可以始终只用一个倾听套接字来接收多个客户机的连接请求；而如果我们要和客户机建立一个实际的连接的话，对每一个请求我们都需要调用accept()返回一个新的套接字。当服务器处理完毕客户机的请求后，一定要将相应的套接字关闭；如果整个服务器程序将要结束，那么一定要将倾听套接字关闭。
　　如果accept()函数执行失败，则返回"-1"，如果accept()函数阻塞等待客户机调用connect()建立连接，进程在此时恰好捕捉到信号，那么函数在返回"-1"的同时将变量errno的值设置为EINTR。这和accept()函数执行失败是有区别的。因此我们在代码中可以看到这样的语句：
-----------------------------------------------------------------
if (newsockfd < 0 && errno == EINTR)
continue;
/* a signal might interrupt our accept() call */
else if (newsockfd < 0)
/* something quite amiss -- kill the server */
errorout("failed to accept connection");
-----------------------------------------------------------------
　　可以看出程序在处理这两种情况时操作是完全不同的，同样是accept()返回"-1"，如果有errno == EINTR，那么系统将再次调用accept()接受连接请求，否则服务器进程将直接结束。

处理客户机请求

　　当服务器与客户机建立连接以后，就可以处理客户机的请求了。一般情况下服务器程序都要创建一个子进程用于处理客户机请求；而父进程则继续监听，时刻准备接受其它客户机的连接请求。我们这段proxy程序也不例外。它通过调用fork()创建处理客户机请求的子进程。我想在linux/Unix编程中，fork()的重要性不用我再多说什么了，在大型的服务器程序中，一般都要在子进程里，根据客户机请求的不同而通过exec()系列函数调用不同的处理程序，这也是在学习linux/Unix编程中一个非常重要的地方。不过我们这个proxy程序旨在讲述一些linux网络编程的基本概念，因此在子程序部分就直接调用了一个完成proxy功能的函数do_proxy()，其实际参数newsockfd就是accept()返回的套接字描述符。另外值得注意的一点就是，因为子进程继承了所有父进程中可用的文件描述符，所以我们必须在子进程中关闭倾听套接字（代码中子进程部分的close(sockfd);），同时在父进程中关闭accept()返回的套接字描述符（例如代码中父进程部分的close(newsockfd);）。

◆函数parse_args()

此函数的定义是：void parse_args (int argc, char **argv);
-----------------------------------------------------------------
/****************************************************************
function:　　　 parse_args
description:　　parse the command line args.
arguments: 　　 argc,argv you know what these are.
return value: 　none.
calls: 　　　　 none.
globals: 　　　 writes proxy_port, writes hostaddr.
****************************************************************/
void parse_args (argc,argv)
int argc;
char **argv;
{
　　int i;
　　struct hostent *hostp;
　　struct servent *servp;
　　unsigned long inaddr;
　　struct {
　　　　char proxy_port [16];
　　　　char isolated_host [64];
　　　　char service_name [32];
　　} pargs;
　　if (argc < 4) {
　　　　　printf("usage: %s /r/n", argv[0]);
　　　　　exit(1);
　　}
　　strcpy(pargs.proxy_port,argv[1]);
　　strcpy(pargs.isolated_host,argv[2]);
　　strcpy(pargs.service_name,argv[3]);
　　for (i = 0; i < strlen(pargs.proxy_port); i++)
　　　　if (!isdigit(*(pargs.proxy_port + i)))
　　　　　　break;
　　if (i == strlen(pargs.proxy_port))
　　　　proxy_port = htons(atoi(pargs.proxy_port));
　　else {
　　　　printf("%s: invalid proxy port/r/n",pargs.proxy_port);
　　　　exit(0);
　　}
　　bzero(&hostaddr,sizeof(hostaddr));
　　hostaddr.sin_family = AF_INET;
　　if ((inaddr = inet_addr(pargs.isolated_host)) != INADDR_NONE)
　　　　bcopy(&inaddr,&hostaddr.sin_addr,sizeof(inaddr));
　　else if ((hostp = gethostbyname(pargs.isolated_host)) != NULL)
　　　　bcopy(hostp->h_addr,&hostaddr.sin_addr,hostp->h_length);
　　else {
　　　　printf("%s: unknown host/r/n",pargs.isolated_host);
　　　　exit(1);
　　}
　　if ((servp = getservbyname(pargs.service_name,TCP_PROTO)) != NULL)
　　　　hostaddr.sin_port = servp->s_port;
　　else if (atoi(pargs.service_name) > 0)
　　　　hostaddr.sin_port = htons(atoi(pargs.service_name));
　　else {
　　　　printf("%s: invalid/unknown service name or port number/r/n", pargs.service_name);
　　　　exit(1);
　　}
}
-----------------------------------------------------------------
　　这个函数的作用是传递命令行参数。参数的传递是通过两个全局变量来实现的，这两个变量是int proxy_port和struct sockaddr_in hostaddr。分别用于传递等待连接请求的proxy端口和被绑定的主机网络信息。

检验命令行参数

　　在进行了局部变量定义以后，函数首先要检测命令行参数是否符合程序的要求，即在命令后紧跟代理服务器端口、远程主机名和服务端口号，如果不满足上述要求，则代理服务器程序结束。如果满足上述要求，则将命令行的这三个参数存储进我们自定义的pargs结构之中。注意pargs结构的三个成员都是以字符形式存放命令行参数信息的，后面我们需要调用函数将这些参数信息都转换成为数字形式的。

传递参数

　　接下来就要将命令行的三个参数变换成合适的形式赋值给全局变量proxy_port和hostaddr，以供其它函数调用。首先传送代理服务器端口pargs.proxy_port，在这里程序调用了一个系统函数isdigit()检验用户输入的端口号是否有效。isdigit()的具体描述为：
-----------------------------------------------------------------
#include
　　int isdigit(int c)
-----------------------------------------------------------------
　　isdigit()函数用来检测参数"c"是否是数字1~9中间的一个，如果答案是肯定的，则返回非"0"值，反之，返回"0"。程序中采用了这样的方法来对用户的输入进行逐位检验：
　　　if (!isdigit(*(pargs.proxy_port + i)))
　　　break;
　　在将有效端口号传递给全局变量proxy_port之前，还要将其转换成为网络字节顺序。这是因为网络中存在着多个公司的不同设备，这些设备表示数据的字节顺序是不同的。例如在内存地址0x1000处存储一个16位的整数FF11，不同公司的机器在内存中的存储方式也不相同，有的将FF置于内存指针的起始位置0x1000，11置于0x1001，这称为big-endian顺序；有的却恰恰相反，即little-endian顺序。这种基于主机的数据存储顺序就称为主机字节顺序（host byte order）。为了在不同类型的主机之间进行通信，网络协议就规定了一种统一的网络字节顺序，这种顺序被规定为little-endian顺序。所以数据的网络字节顺序和主机字节顺序有可能是不同的，因此在编写通信程序时一定要注意不同顺序之间的转换。所以，程序中一定要有例程中这样的语句：
　　　proxy_port = htons(atoi(pargs.proxy_port));
　　函数htons()的作用就是将主机字节顺序转换为网络字节顺序。它的具体描述为：
-----------------------------------------------------------------
#include
unsigned short int htons(unsigned short int data)
-----------------------------------------------------------------
　　与htons()相似的函数还有三个，它们分别是htonl()、ntohs()和ntohl()，都用于网络与主机字节顺序之间的转换。如果这几个名字比较容易混淆的话，我们可以这样记忆：函数名中的h代表host，n代表network，s代表unsigned short，l代表unsigned long。所以"hton"即为"host-to-network":变换主机字节为网络字节。接收数据的就要用到"ntoh"（"network-to-host"）函数了。
　　在我们的例程中，由于端口号一般情况下最多不会超过4位数字，所以选用unsigned short型的htons()即可。
注意在例程中htons()的参数是另一个函数atoi()的返回结果。atoi()函数的具体描述为：
-----------------------------------------------------------------
#include
int atoi(const char *nptr)
-----------------------------------------------------------------
　　它的作用是将字符指针nptr指向的字符串转换成相应的整数并将其作为结果返回。这个操作与函数调用strtol(nptr,(char **)NULL,10)的效果几乎完全相同，唯一的区别是atoi()没有出错返回信息。之所以要调用这个函数是因为，系统在读取命令行的时候将所有的参数都作为字符串处理，所以我们必须将其转换为整数形式。
接下来,例程先将全局变量hostaddr的所有成员清零，然后将成员hostaddr.sin_family设置为TCP/IP协议族标志AF_INET。下面就可将命令行的另外两个参数和传递给全局变量hostaddr的两个成员hostaddr.sin_port和hostaddr.sin_addr了。这里我们用到了两个局部变量struct hostent *hostp和struct servent *servp来传递参数信息。struct hostent的详细描述为：
-----------------------------------------------------------------
struct hostent {
　　　char *h_name;
　　　char **h_aliases;
　　　int h_addrtype;
　　　int h_length;
　　　char **h_addr_list;
};
#define h_addr h_addrlist[0]
-----------------------------------------------------------------
　　hostent成员的含义是h_name代表主机在网络上的的正式名称，h_aliases是所有主机别名的列表，h_addrtype是指主机的地址类型，一般设置为TCP/IP协议族AF_INET，h_length是主机的地址长度，一般设置为4个字节。h_addr_list是主机的IP地址列表。
　　我们要用它来传递我们期望绑定的远程主机名或是IP地址。因为命令行中的主机名参数已经被存储进pargs.isolated_host，所以我们就调用inet_addr()函数对主机名或主机的IP地址进行二进制和字节顺序转换。inet_addr()函数的描述为：
-----------------------------------------------------------------
#include
#include
#include
unsigned long int inet_addr(const char *cp)
-----------------------------------------------------------------
　　inet_addr()的作用就是将参数cp指向的Internet主机地址从数字/点的形式转换成二进制形式并同时转换为网络字节顺序，并将转换结果直接返回。如果cp指向的IP地址不可用，则函数返回INADDR_NONE或"-1"。
　　虽然Carl Harris在编写这段程序时使用了这个inet_addr()函数，但是我还是建议大家在编写自己的程序时使用另外一个函数inet_aton()来完成这些功能。原因是inet_addr()在IP地址不可用时返回"-1"，但我们想想，IP地址255.255.255.255绝对是一个有效地址，那么其二进制返回值也将是"-1"，因此inet_addr()无法对这个IP地址进行处理。而函数inet_aton()则采用了一种更好的方法来返回出错信息，它的具体描述为：
-----------------------------------------------------------------
#include
#include
#include
int inet_aton(const char *cp, struct in_addr *inp)
-----------------------------------------------------------------
　　函数执行成功时返回非零，转换结果存入指针inp指向的in_addr结构。这个结构定义我们在前面的文章里已经介绍过了。如果参数cp指向的IP地址不可用，则返回"0"。这就避免发生inet_addr()那样的问题。
　　如果说用户在命令行中键入的是远程主机的IP地址，那么只用inet_addr()就算完成任务了，但如果用户键入的是主机域名那该怎么办呢？所以我们在例程中可以看到这样的语句：
-----------------------------------------------------------------
if ((inaddr = inet_addr(pargs.isolated_host)) != INADDR_NONE)
　　bcopy(&inaddr,&hostaddr.sin_addr,sizeof(inaddr));
　　else if ((hostp = gethostbyname(pargs.isolated_host)) != NULL)
　　bcopy(hostp->h_addr,&hostaddr.sin_addr,hostp->h_length);
　　else {
　　printf("%s: unknown host/r/n",pargs.isolated_host);
　　exit(1);
}
-----------------------------------------------------------------
　　其中gethostbyname()函数就是用来转换主机域名的。它的具体描述为：
-----------------------------------------------------------------
#include
struct hostent *gethostbyname(const char *hostname);
-----------------------------------------------------------------
　　参数hostname指向我们需要转换的域名地址，函数直接返回转换结果，如果函数执行成功，则结果直接返回到一个指向hostent结构的指针中，否则返回空指针NULL。
　　例程就是这样调用inet_addr()和gethostbyname()将命令行参数中的主机域名或是主机IP地址传递给全局变量hostaddr的成员sin_addr以便代理执行函数do_proxy()调用。
　　下面是传递服务名或是服务端口号。这里要用到结构servent做传递中介，struct servent的详细描述为：
-----------------------------------------------------------------
struct servent {
　　char *s_name;
　　char **s_aliases;
　　int s_port;
　　char *s_proto;
};
-----------------------------------------------------------------
　　其各成员的含义是s_name为服务的正式名称，如ftp、http等，s_aliases是服务的别名列表，s_port是服务的端口号，例如在一般情况下ftp的端口号为21，http服务的端口号为80，注意此端口号应该存储为网络字节顺序，s_proto是应用协议的类型。
　　例程中使用getservbyname()函数转换命令行参数中的服务名，此函数的详细描述为：
-----------------------------------------------------------------
#include
struct servent * getservbyname(const char *servname, const char *protoname);
-----------------------------------------------------------------
　　它的作用就是转换指针servname指向的服务名为相应的整数表示的端口号，参数protoname表示服务使用的协议，例程中protoname 参数的值为TCP_PROTO，这表示使用TCP协议。函数成功时就返回一个struct servent型的指针，其中的s_port成员就是我们关心的服务端口号。如果用户在命令中键入的是端口号而不是服务名，那么和处理代理端口信息一样，使用下面的语句进行处理：
　　　hostaddr.sin_port = htons(atoi(pargs.service_name));
　　到这里，命令行的参数已经全部被转换成为网络通信所要求的字节顺序和数字类型，并且存储在三个全局变量中，就等着do_proxy()函数来调用了。

◆daemonize()函数创建守护进程

　　在对main()函数进行介绍的时候我就提到过，一般服务器程序在接收客户机连接请求之前，都要创建一个守护进程。守护进程是linux/Unix编程中一个非常重要的概念，因为在创建一个守护进程的时候，我们要接触到子进程、进程组、会晤期、信号机制以及文件、目录、控制终端等多个概念，因此详细地讨论一下守护进程，对初学者学习进程间关系是非常有帮助的。下面就是例程中的daemonize()函数：
-----------------------------------------------------------------
/****************************************************************
function: 　　daemonize
description:　detach the server process from the current context, creating a pristine, predictable 　　　　　　　environment in which it will execute.
arguments:　　servfd file descriptor in use by server.
return value: none.
calls:　　　　none.
globals:　　　none.
****************************************************************/
void daemonize (servfd)
int servfd;
{
　　int childpid, fd, fdtablesize;
　　/* ignore terminal I/O, stop signals */
　　　signal(SIGTTOU,SIG_IGN);
　　　signal(SIGTTIN,SIG_IGN);
　　　signal(SIGTSTP,SIG_IGN);
　　/* fork to put us in the background (whether or not the user
　　 specified '&' on the command line */
　　if ((childpid = fork()) < 0) {
　　　　fputs("failed to fork first child/r/n",stderr);
　　　　exit(1);
　　　}
　　else if (childpid > 0)
　　　exit(0); /* terminate parent, continue in child */
　　　/* dissociate from process group */
　　if (setpgrp(0,getpid())<0) {
　　　　fputs("failed to become process group leader/r/n",stderr);
　　　　exit(1);
　　}
　　/* lose controlling terminal */
　　if ((fd = open("/dev/tty",O_RDWR)) >= 0) {
　　　　ioctl(fd,TIOCNOTTY,NULL);
　　　　close(fd);
　　}
　　/* close any open file descriptors */
　　for (fd = 0, fdtablesize = getdtablesize(); fd < fdtablesize; fd++)
　　if (fd != servfd)
　　　close(fd);
　　　/* set working directory to allow filesystems to be unmounted */
　　　chdir("/");
　　　/* clear the inherited umask */
　　　umask(0);
　　　/* setup zombie prevention */
　　　signal(SIGCLD,(Sigfunc *)reap_status);
　　}
-----------------------------------------------------------------

　　此函数的作用就是创建一个守护进程。在Linux系统中，如果要将一个普通进程转换成为守护进程，必须要执行下面的步骤：
　　1．调用函数fork()创建子进程，然后父进程终止，保留子进程继续运行。之所以要让父进程终止是因为，当一个进程是以前台进程方式由shell启动时，在父进程终止之后子进程自动转为后台进程。另外，我们在下一步要创建一个新的会晤期，这就要求创建会晤期的进程不是一个进程组的组长进程。当父进程终止，子进程运行，这就保证了进程组的组ID与子进程的进程ID不会相等。
函数fork()的定义为：
-----------------------------------------------------------------
#include
#include
pid_t fork(void);
-----------------------------------------------------------------
　　该函数被调用一次，但是返回两次，这两次返回的区别是子进程的返回值为"0"，而父进程的返回值为子进程的ID。如果出错则返回"-1"。

　　2．保证进程不会获得任何控制终端。通常的做法是调用函数setsid()创建一个新的会晤期。setsid()的详细描述为：
-----------------------------------------------------------------
#include
#include
pid_t setsid(void);
-----------------------------------------------------------------
　　第一步的操作已经保证调用此函数的进程不是进程组的组长，那么此函数将创建一个新的会晤，其结果是：首先，此进程变成该会晤期的首进程(session leader，系统默认会晤期的首进程是创建该会晤期的进程)。而且，此进程是该会晤期中的唯一进程。然后，此进程将成为一个新的进程组的组长进程，新进程组的组ID就是该进程的进程ID。最后，保证此进程没有控制终端，即使在调用setsid()之前此进程拥有控制终端，在创建会晤期后这种联系也将被解除。如果调用该函数的进程为一个进程组的组长，那么函数将返回出错信息"-1"。
当然我们还有其他的办法让进程无法获得控制终端，就象例程中所做的那样，
-----------------------------------------------------------------
if ((fd = open("/dev/tty",O_RDWR)) >= 0) {
ioctl(fd,TIOCNOTTY,NULL);
close(fd);
}
-----------------------------------------------------------------
　　其中/dev/tty是一个流设备，也是我们的终端映射。调用close()函数将终端关闭。

　　3．信号处理。一般是要忽略掉某些信号。这里就涉及到信号的概念了。信号其实相当于软件中断，Linux/Unix下的信号机制提供了一种处理异步事件的方法，终端用户键入印发中断的键，或是系统异常发出信号，这都会通过信号处理机制终止一个或多个程序的运行。
　　不同情况下引发的信号是不同的。不过所有的信号都有自己的名字，所有的名字都是以"SIG"开头的，只是后面有所不同，我们可以通过这些名字了解到系统中到底发生了些什么事。

　　当信号出现时，我们可以要求系统进行以下三种操作：
　　◇忽略信号。大多数信号都是采取这种方式进行处理的，在例程中我们就可以见到这种用法。但值得注意的是有两个例外，那就是对SIGKILL和SIGSTOP信号不能做忽略处理。
　　◇捕捉信号。这是一种最为灵活的操作方式。这种处理方式的意思就是，当某种信号发生时，我们可以调用一个函数对这种情况进行相应的处理。最常见的情况就是，如果捕捉到SIGCHID信号，则表示子进程已经终止，然后可在此信号的捕捉函数中调用waitpid()函数取得该子进程的进程ID以及它的终止状态。在我们这段例程中，就有这种用法的一个实例。还有就是如果进程创建了临时文件，那么就要为进程终止信号SIGTERM编写一个信号捕捉函数来清除这些临时文件。
　　◇执行系统的默认动作。对绝大多数信号而言，系统的默认动作都是终止该进程。
　　在Linux下，信号有很多种，我在这里就不一一介绍了，如果想详细地对这些信号进行了解，可以查看头文件，这些信号都被定义为正整数，也就是它们的信号编号。在对信号进行处理时，必须要用到函数signal()，此函数的详细描述为：
-----------------------------------------------------------------
#include
void (*signal (int signo, void (*func)(int)))(int);
-----------------------------------------------------------------
　　其中参数signo为信号名，参数func的值根据我们的需要可以是以下几种情况：（1）常数SIG_DFL,表示执行系统的默认动作。（2）常数SIG_IGN，表示忽略信号。（3）收到信号后需要调用的处理函数的地址，此信号捕捉程序应该有一个整型参数但是没有返回值。signal()函数返回一个函数指针，而该指针指向的函数应该无返回值（void），这个指针其实指向以前的信号捕捉程序。
　　下面回到我们的daemonize()函数上来。这个函数在创建守护进程时忽略了三个信号：
　　　signal(SIGTTOU,SIG_IGN);
　　　signal(SIGTTIN,SIG_IGN);
　　　signal(SIGTSTP,SIG_IGN);
　　这三个信号的含义分别是：SIGTTOU表示后台进程写控制终端，SIGTTIN表示后台进程读控制终端，SIGTSTP表示终端挂起。

　　4．关闭不再需要的文件描述符，并为标准输入、标准输出和标准错误输出打开新的文件描述符（也可以继承父进程的标准输入、标准输出和标准错误输出文件描述符，这个操作是可选的）。在我们这段例程中，因为是代理服务器程序，而且是在执行了listen()函数之后执行这个daemonize()的，所以要保留已经转换成功的倾听套接字，所以我们可以见到这样的语句：
if (fd != servfd)
close(fd);

　　5．调用函数chdir("/")将当前工作目录更改为根目录。这是为了保证我们的进程不使用任何目录。否则我们的守护进程将一直占用某个目录，这可能会造成超级用户不能卸载一个文件系统。

　　6．调用函数umask(0)将文件方式创建屏蔽字设置为"0"。这是因为由继承得来的文件创建方式屏蔽字可能会禁止某些许可权。例如我们的守护进程需要创建一组可读可写的文件，而此守护进程从父进程那里继承来的文件创建方式屏蔽字却有可能屏蔽掉了这两种许可权，则新创建的一组文件其读或写操作就不能生效。因此要将文件方式创建屏蔽字设置为"0"。
　　在daemonize()函数的最后，我们可以看到这样的信号捕捉处理语句：
　　　signal(SIGCLD,(Sigfunc *)reap_status);
　　这不是创建守护进程过程中必须的一步，它的作用是调用我们自定义的reap_status()函数来处理僵死进程。reap_status()在例程中的定义为：
-----------------------------------------------------------------
/****************************************************************
function: 　　　reap_status
description: 　 handle a SIGCLD signal by reaping the exit status of the perished child, and 　　　　　　　　　　　discarding it.
arguments: 　　 none.
return value: 　none.
calls: 　　　　 none.
globals: 　　　 none.
****************************************************************/
void reap_status()
{
　　int pid;
　　union wait status;
　　while ((pid = wait3(&status,WNOHANG,NULL)) > 0)
　　; /* loop while there are more dead children */
}
-----------------------------------------------------------------
　　上面信号捕捉语句的原文为：
　　　signal(SIGCLD, reap_status);
　　我们刚才说过，signal()函数的第二个参数一定要有有一个整型参数但是没有返回值。而reap_status()是没有参数的，所以原来的语句在编译时无法通过。所以我在预编译部分加入了对Sigfunc()的类型定义，在这里用做对reap_status进行强制类型转换。而且在BSD系统中通常都使用SIGCHLD信号来处理子进程终止的有关信息，SIGCLD是System V中定义的一个信号名，如果将SIGCLD信号的处理方式设定为捕捉，那么内核将马上检查系统中是否存在已经终止等待处理的子进程，如果有，则立即调用信号捕捉处理程序。
　　一般在信号捕捉处理程序中都要调用wait()、waitpid()、wait3()或是wait4()来返回子进程的终止状态。这些"等待"函数的区别是，当要求函数"等待"的子进程还没有终止时，wait()将使其调用者阻塞；而在waitpid()的参数中可以设定使调用者不发生阻塞，wait()函数不被设置为等待哪个具体的子进程，它等待调用者所有子进程中首先终止的那个，而在调用waitpid()时却必须在参数中设定被等待的子进程ID。而wait3()和wait4()的参数分别比wait()和waitpid()还要多一个"rusage"。例程中的reap_status()就调用了函数wait3()，这个函数是BSD系统支持的，我们把它和wait4()的定义一起列出来：
-----------------------------------------------------------------
#include
#include
#include
#include
pid_t wait3(int *statloc, int options, struct rusage *rusage);
pid_t wait4(pid_t pid, int *statloc, int options, struct rusage *rusage);
-----------------------------------------------------------------
　　其中指针statloc如果不为"NULL"，那么它将指向返回的子进程终止状态。参数pid是我们指定的被等待的子进程的进程ID。参数options是我们的控制选择项，一般为WNOHANG或是WUNTRACED。例程中使用了选项WNOHANG，意即如果不能立即返回子进程的终止状态（譬如由于子进程还未结束），那么等待函数不阻塞，此时返回"0"。　　　　　WUNTRACED选项的意思是如果系统支持作业控制，如果要等待的子进程的状态已经暂停，而且其状态自从暂停以来还从未报告过，则返回其状态。参数rusage如果不为"NULL"，则它将指向内核返回的由终止进程及其所有子进程使用的资源摘要，该摘要包括用户CPU时间总量、缺页次数、接收到信号的次数等。

◆代理服务程序do_proxy()

　　在例程main()函数快要结束时，我们看到，在服务器接受了客户机的连接请求后，将为其创建子进程，并在子进程中执行代理服务程序do_proxy()。
-----------------------------------------------------------------/****************************************************************
function: 　　 do_proxy
description: 　does the actual work of virtually connecting a client to the telnet service on the 　　　　　　　　 isolated host.
arguments: 　　usersockfd socket to which the client is connected. return value: none.
calls: 　　　　none.
globals: 　　　　reads hostaddr.
****************************************************************/
void do_proxy (usersockfd)
int usersockfd;
{
　　int isosockfd;
　　fd_set rdfdset;
　　int connstat;
　　int iolen;
　　char buf[2048];
　　/* open a socket to connect to the isolated host */
　　if ((isosockfd = socket(AF_INET,SOCK_STREAM,0)) < 0)
　　errorout("failed to create socket to host");
　　/* attempt a connection */
　　connstat = connect(isosockfd,(struct sockaddr *) &hostaddr, sizeof(hostaddr));
　　switch (connstat) {
　　case 0:
　　break;
　　case ETIMEDOUT:
　　case ECONNREFUSED:
　　case ENETUNREACH:
　　strcpy(buf,sys_myerrlist[errno]);
　　strcat(buf,"/r/n");
　　write(usersockfd,buf,strlen(buf));
　　close(usersockfd);
　　exit(1);
　　/* die peacefully if we can't establish a connection */
　　break;
　　default:
　　errorout("failed to connect to host");
　　}
　　/* now we're connected, serve fall into the data echo loop */
　　while (1) {
　　　　/* Select for readability on either of our two sockets */
　　　　FD_ZERO(&rdfdset);
　　　　FD_SET(usersockfd,&rdfdset);
　　　　FD_SET(isosockfd,&rdfdset);
　　if (select(FD_SETSIZE,&rdfdset,NULL,NULL,NULL) < 0)
　　　errorout("select failed");
　　　/* is the client sending data? */
　　if (FD_ISSET(usersockfd,&rdfdset)) {
　　　　if ((iolen = read(usersockfd,buf,sizeof(buf))) <= 0)
　　　　　break; /* zero length means the client disconnected */
　　　　　rite(isosockfd,buf,iolen);
　　　　　/* copy to host -- blocking semantics */
　　　}
　　/* is the host sending data? */
　　if (FD_ISSET(isosockfd,&rdfdset)) {
　　　　f ((iolen = read(isosockfd,buf,sizeof(buf))) <= 0)
　　　　　　break; /* zero length means the host disconnected */
　　　　　　rite(usersockfd,buf,iolen);
　　　　　　/* copy to client -- blocking semantics */
　　　　}
　　　}
　　　/* we're done with the sockets */
　　　close(isosockfd);
　　　lose(usersockfd);
　　}
-----------------------------------------------------------------
　　在我们这段代理服务器例程中，真正连接用户主机和远端主机的一段操作，就是由这个do_proxy()函数来完成的。回想一下我们一开始对这段proxy程序用法的介绍。先将我们的proxy与远端主机绑定，然后用户通过proxy的绑定端口与远端主机建立连接。而在main()函数中，我们的proxy由一段服务器程序与用户主机建立了连接，而在这个do_proxy()函数中，proxy将与远端主机的相应服务端口（由用户在命令行参数中指定）建立连接，并负责传递用户主机和远端主机之间交换的数据。
　　由于要和远端主机建立连接，所以我们看到do_proxy()函数的前半部分实际上相当于一段标准的客户机程序。首先创建一个新的套接字描述符isosockfd，然后调用函数connect()与远端主机之间建立连接。函数connect()的定义为：
-----------------------------------------------------------------
#include
#include
int connect(int sockfd, struct sockaddr *servaddr, int addrlen);
-----------------------------------------------------------------
　　参数sockfd是调用函数socket()返回的套接字描述符，参数servaddr指向远程服务器的套接字地址结构，参数addrlen指定这个套接字地址结构的长度。函数connect()执行成功时返回"0"，如果执行失败则返回"-1"，并将全局变量errno设置为相应的错误类型。在例程中的switch()函数调用中对以下三种出错类型进行了处理： ETIMEDOUT、ECONNREFUSED和ENETUNREACH。这三个出错类型的意思分别为：ETIMEDOUT代表超时，产生这种情况的原因有很多，最常见的是服务器忙，无法应答客户机的连接请求；ECONNREFUSED代表连接拒绝，即服务器端没有准备好的倾听套接字，或是没有对倾听套接字的状态进行监听；ENETUNREACH表示网络不可达。
　　在本例中，connect()函数的第二个参数servaddr是全局变量hostaddr，其中存储着函数parse_args()转换好的命令行参数。如果连接建立失败，在例程中就调用我们自定义的函数errorout()输出信息"failed to connect to host"。errorout()函数的定义为：
-----------------------------------------------------------------
/****************************************************************
function:　　errorout
description: displays an error message on the console and kills the current process.
arguments: 　msg -- message to be displayed.
return value: none -- does not return.
calls: 　　　none.
globals:　　 none.
****************************************************************/
void errorout (msg)
char *msg;
{
　　FILE *console;
　　console = fopen("/dev/console","a");
　　fprintf(console,"proxyd: %s/r/n",msg);
　　fclose(console);
　　exit(1);
}
-----------------------------------------------------------------
　　do_proxy()函数的后半部分是通过proxy建立用户主机与远端主机之间的连接。我们既有proxy与用户主机连接的套接字（do_proxy()函数的参数usersockfd），又有proxy与远端主机连接的套接字isosockfd，那么最简单直接的通信建立方式就是从一个套接字读，然后直接写到另一个套接字去。如：
-----------------------------------------------------------------
int n;
char buf[2048];
while((n=read(usersockfd, buf, sizeof(buf))>0)
if(write(isosockfd, buf, n)!=n)
err_sys("write wrror/n");
-----------------------------------------------------------------
　　这种形式的阻塞I/O在单向数据传递的时候是非常有效的，但是在我们的proxy操作中是要求用户主机和远端主机双向通信的，这样就要求我们对两个套接字描述符既能够读由能够写。如果还是采用这种方式的阻塞I/O的话，很有可能长时间阻塞在一个描述符上。因此例程在处理这个问题的时候调用了select()函数，这个函数允许我们执行I/O多路转接。其具体含义就是select()函数可以构造一个表，在这个表中包含了我们所有要用到的文件描述符。然后我们可以调用一个函数，这个函数可以检测这些文件描述符的状态，当某个（我们指定的）文件描述符准备好进行I/O操作时，此函数就返回，告知进程哪个文件描述符已经可以执行I/O操作了。这样就避免了长时间的阻塞。
　　还有一个函数poll()可以实现I/O多路转接，由于在例程中调用的是select()，我们就只对select()进行一下比较详细的介绍。select()系列函数的详细描述为：
-----------------------------------------------------------------
#include
#include
#include
int select(int n, fd_set *readfds, fd_set *writefds, fd_est *exceptfds, struct timeval *timeout);
FD_CLR(int fd, fd_set *set);
FD_ISSET(int fd, fd_set *set);
FD_SET(int fd, fd_set *set);
FD_ZERO(fd_set *set);
-----------------------------------------------------------------
　　select()函数将创建一个我们所关心的文件描述符表，它的参数将在内核中为这些文件描述符设置我们所关心的条件，例如是否是可读、是否可写以及是否异常，而且在参数中还可以设置我们希望等待的最大时间。在select()成功执行时，它将返回目前已经准备好的描述符数量，同时内核可以告诉我们各个描述符的状态信息。如果超时，则返回"0"，如果出错，则函数返回"-1"，并同时设置errno为相应的值。
　　select()的最后一个参数timeout将设置等待时间。其中结构timeval是在文件中定义的。
-----------------------------------------------------------------
struct timeval
{
　　__time_t tv_sec; /* Seconds */
　　__time_t tv_usec; /* Microseconds */
};
-----------------------------------------------------------------
　　参数timeout的设置有三种情况。象例程中这样timeout==NULL时，这表示用户希望永远等待，直到我们指定的文件描述符中的一个已准备好，或者是捕捉到一个信号。如果是由于捕捉到信号而中断了这个无限期的等待过程的话，select()将返回"-1"，同时设置errno的值为EINTR。
　　如果timeout->tv_sec==0&&timeout->tv_usec==0，那么这表示完全不等待。Select()测试了所有指定文件描述符后立即返回。这是得到多个描述符状态而不阻塞select()函数的轮询方法。
　　如果timeout->tv_sec！=0||timeout->tv_usec！=0，那么这两个参数的值即为我们希望函数等待的时间。其中tv_sec设置时间单位为秒，tv_usec设置时间单位为微秒。如果在超时的时候，在我们指定的所有文件描述符里面仍然没有任何一个准备好的话，则select()将返回"0"。
　　中间三个参数的数据类型是fd_set，它的意思是文件描述符集，而readfds, writefds和exceptfds则分别是指向文件描述符集的指针，他们分别描述了我们所关心的可读、可写以及状态异常的各个文件描述符。之所以我们称select()可以创建一个文件描述符"表"，那个所谓的表就是由这三个参数指向的数据结构组成的。其具体结构如图1所示。其中在每个set_fd数据类型中都为我们关心的所有文件描述符保留了一位。所以在监测文件描述符状态的时候，就在这些set_fd数据结构中查询相关的位。
　　第一个参数n用来说明到底需要遍历多少个描述符位。n的值一般是这样设置的，从我们关心的所有文件描述符中选出最大值再加1。例如我们设置的所有文件描述符中最大的为6，那么将n设置为7，则系统在检测描述符状态的时候，就只用遍历前7位（fd0~fd6）的状态。不过如果不想这样麻烦的话，我们可以象例程中那样将n的值直接设置为FD_SETSIZE。这是系统中设定的最大文件描述符个数，不同的系统这个值也不相同，一般是256或是1024。这样在检测描述符状态的时候，函数将遍历所有的描述符位。
　　在调用select()函数实现多路I/O转接时，首先我们要声明一个新的文件描述符集，就象例程中这样：
　　　fd_set rdfdset;
　　然后调用FD_ZERO()清空此文件描述符集的所有位，以免下面检测描述符位的时候返回错误结果：
　　　FD_ZERO(&rdfdset);
　　然后调用FD_SET()在文件描述符集中设置我们关心的位。在本例中，我们关心的就是分别与用户主机和远端主机连接的两个套接字描述符，所以执行这样的语句：
　　　FD_SET(usersockfd,&rdfdset);
　　　FD_SET(isosockfd,&rdfdset);
　　然后调用select()返回描述符状态，此时描述符状态被存储进描述符集，也就是set_fd数据结构中。在图1中我们看到所有的描述符位状态都是"0"，在select()返回后，例如fd0可读，则在readfds描述符集中fd0对应的位上将状态标志设置为"1"，如果fd1可写，则writefds描述符集中fd1对应的位上将状态标志设置为"1"，状态异常的情况也也与此相同。在本例中，我们只关心两个套接字描述符是否可写，因此执行这样的select()函数：
　　　select(FD_SETSIZE,&rdfdset,NULL,NULL,NULL)
　　那么在select()返回后怎样检测set_fd数据结构中描述符位的状态呢？这就要调用函数FD_ISSET()，如果对应文件描述符的状态为"已准备好"（即描述符位为"1"），则FD_ISSET()返回"1"，否则返回"0"。
-----------------------------------------------------------------
if (FD_ISSET(usersockfd,&rdfdset)) {
　　if ((iolen = read(usersockfd,buf,sizeof(buf))) <= 0)
　　break; /* zero length means the host disconnected */
　　write(isosockfd,buf,iolen);
-----------------------------------------------------------------
　　这一段代码就实现从套接字usersockfd（用户主机）到套接字isosockfd（远端主机）的无阻塞传输。而下一段代码实现反方向的无阻塞传输：
-----------------------------------------------------------------
if (FD_ISSET(isosockfd,&rdfdset)) {
　　if ((iolen = read(isosockfd,buf,sizeof(buf))) <= 0)
　　　break; /* zero length means the host disconnected */
　　　write(usersockfd,buf,iolen);
-----------------------------------------------------------------
　　这样就通过proxy实现了用户主机与远端主机之间的通信。
　　对这段proxy代码我只是写了一些自己的理解，大多数是一些函数的用法，这些都是linux网络编程中一些最基础的知识，如果有不对的地方，还请各位大虾批评指正。

你可能感兴趣的:(Proxy源代码分析)

批量获取虾皮shopee商品详情信息爬虫 a6229203 爬虫数据库前端
每天100万详情联系736131417v:IpAnt_Proxy在当今的电子商务环境中，数据是至关重要的。对于电商平台的商家和开发者来说，获取商品详情信息是他们日常工作的关键部分。虾皮Shopee作为东南亚最大的电商平台，其商品信息对于商家和开发者来说具有极高的价值。本文将分享如何通过API批量获取虾皮Shopee的商品详情信息，并提供测试代码，让您轻松上手。一、了解虾皮ShopeeAPI虾皮Sh
java面试题,什么是动态代理？、动态代理和静态代理有什么区别？说一下反射机制？JDK Proxy 和 CGLib 有什么区别？动态代理的底层述雾学java java 开发语言 java面试题反射 java核心基础
什么是动态代理？动态代理是在程序运行期，动态的创建目标对象的代理对象，并对目标对象中的方法进行功能性增强的一种技术。在生成代理对象的过程中，目标对象不变，代理对象中的方法是目标对象方法的增强方法。可以理解为运行期间，对象中方法的动态拦截，在拦截方法的前后执行功能操作。动态代理的常见使用场景有：统计每个api的请求耗时；统一的日志输出；校验被调用的api是否已经登录和权限鉴定；SpringAOP。动
响应式数据和 Pinia 状态肉肉不吃肉前端 vue.js pinia
响应式数据和Pinia状态是Vue.js应用中用于管理数据的两种重要机制，它们之间有密切的关系。以下是它们的定义、特点以及关系：1.响应式数据定义响应式数据是Vue.js的核心特性之一，指的是当数据发生变化时，视图会自动更新。Vue.js通过Proxy或Object.defineProperty实现数据的响应式。特点自动更新：当数据变化时，依赖该数据的视图会自动更新。声明式：开发者只需关注数据本身
亿级分布式系统架构演进实战（一）- 总体概要 power-辰南 java技术架构师成长专栏高并发分布式系统微服务架构设计 springcloud
前言不说废话，这次分享是某500强企业真实亿级流量业务中台技术架构演进过程实战。核心目标构建一个兼具高性能、高可用、强一致性的分布式系统，支撑亿级流量场景下的稳定运行。演进路线大纲阶段一：横向扩展（应对万级QPS）核心目标：突破单机性能瓶颈，建立弹性基础[Nginx]/|\[App1][App2][App3]←无状态服务集群\|/[DBProxy]←读写分离中间件/\[Master]←写节点[Sl
一个比Fiddler/Charles更好用的免费抓包神器金丝猴也是猿 http udp https websocket 网络安全网络协议 tcp/ip
Proxyman与Sniffmaster：抓包工具的双剑合璧在当今的网络开发与调试中，抓包工具是不可或缺的利器。无论是前端开发者、后端工程师，还是安全研究人员，都需要通过抓包工具来分析网络请求、调试接口、排查问题。今天，我们将介绍两款强大的抓包工具：Proxyman和Sniffmaster，它们各自拥有独特的功能，能够帮助你在不同的场景下高效完成工作。Proxyman简介Slogan：只是简单地点
k8s服务中userspace，iptables，和ipvs的比较小刘爱喇石( ˝ᗢ̈˝ ) kubernetes 云原生
在Kubernetes中，kube-proxy是负责实现服务负载均衡的组件。它支持三种代理模式：userspace、iptables和ipvs。这三种模式在性能、功能和复杂性上有所不同。以下是它们的详细比较：1.Userspace模式Userspace是Kubernetes最早支持的代理模式，kube-proxy在用户空间监听服务的IP和端口，并将流量转发到后端Pod。工作原理kube-proxy
前端解决跨域的几种方案爱分享的程序员前端前端
以下是前端解决跨域问题的7种主流方案，根据应用场景和实现难度排序，附详细实现示例：一、开发环境解决方案1.WebpackDevServer代理（推荐）//vue.config.js/webpack.config.jsmodule.exports={devServer:{proxy:{'/api':{target:'http://backend-domain.com',//后端地址changeOri
145.HarmonyOS NEXT系列教程之3D立方体旋转轮播案例讲解之自定义过渡效果 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT系列教程之3D立方体旋转轮播案例讲解之自定义过渡效果效果演示1.自定义过渡效果概述1.1基本结构customContentTransition({timeout:1000,//超时时间transition:(proxy:SwiperCo
Java动态代理模式深度解析 Vic10101 Java性能优化开发实战项目总结 java 代理模式开发语言
1.动态代理基础1.1核心组件Proxy类：动态生成代理对象的工厂类，核心方法为newProxyInstance()。InvocationHandler接口：代理逻辑的处理器，所有方法调用会转发到其invoke()方法。1.2实现步骤定义接口：代理基于接口实现。publicinterfaceUserService{voidaddUser(Stringusername);}实现类（真实对象）：pub
HAProxy的ACL Hurry6 网络服务器运维
访问控制列表（ACL，AccessControlLists）是一种基于包过滤的访问控制技术，它可以根据设定的条件对经过服务器传输的数据包进行过滤(条件匹配)，即对接收到的报文进行匹配和过滤，基于请求报文头部中的源地址、源端口、目标地址、目标端口、请求方法、URL、文件后缀等信息内容进行匹配并执行进一步操作，比如允许其通过或丢弃。定义ACL匹配规范，即：判断条件hdrstring，提取在一个HTTP
SAP-ABAP：SAP外网接口调用技术全景指南爱喝水的鱼丶 VIP详情查看专栏 SAP业务学习捷径 SAP-ABAP开发基础详解 SAP ABAP ERP 开发运维运维 HTTP 接口调用
SAP外网接口调用技术全景指南1.核心调用方式对比矩阵方法类型协议支持适用场景开发复杂度维护成本典型应用案例HTTPClientREST/HTTP通用API集成★★☆低调用第三方支付接口SOAPProxySOAP/WSDL标准化Web服务★★★中银行系统对接ODataClientODataSAP生态集成★★☆低Fiori应用数据扩展PI/PO中间件多协议转换企业级复杂集成★★★★高跨系统业务流程编
Debezium系列之：使用Debezium采集oceanbase数据库快乐骑行^_^ debezium Debezium系列采集oceanbase数据库
Debezium系列之：使用Debezium采集oceanbase数据库一、oceanbase数据库二、安装OceanBase三、安装oblogproxy四、基于Docker的简单采集案例五、生产实际应用案例Debezium是一个开源的分布式平台，用于监控数据库变化和捕捉数据变动事件，并以事件流的形式导出到各种消费者。Debezium基于ApacheKafka实现，并支持多种数据库系统。一、oce
鸿蒙（HarmonyOS）性能优化—Web开发常见问题码牛程序猿 HarmonyOS 鸿蒙工程师鸿蒙 harmonyos 华为 HarmonyOS 鸿蒙应用开发鸿蒙系统鸿蒙鸿蒙开发
H5页面如何与ArkTS交互(API10)问题现象目前javaScriptProxy仅支持同步调用，异步调用无法获取执行结果。解决措施对javaScriptProxy和runJavaScript封装，实现JSBridge通信方案。适用于H5调用原生侧函数。使用Web组件javaScriptProxy将原生侧接口注入到H5的window对象上，通过runJavaScript接口执行JS脚本到H5中，
selenium加代理ip __淡墨青衫__ selenium selenium
fromseleniumimportwebdriver#导入webdriver#加入代理ipchrome_options=webdriver.ChromeOptions()chrome_options.add_argument('--proxy-server=http://’+ip:端口)driver=webdriver.Chrome(chrome_options=chrome_options)#
Ubuntu中为curl和Docker配置代理黑风风网络运维 ubuntu docker linux
Ubuntu中为curl和Docker配置代理在Ubuntu环境下工作时，经常需要使用代理来访问网络资源，尤其在网络受限或需要访问时。本文介绍如何分别为curl命令和Docker配置代理192.168.100.11:8000。一、curl命令代理配置方法1：临时设置代理（仅当前命令有效）直接使用--proxy参数：curl--proxyhttp://192.168.100.11:8000http:
k8s-dashboard 勤则弊除 kubernetes 容器云原生
一、windows可以通过端口转发将流量转发至dashboardssh-L9000:192.168.1.50:8001192.168.1.50-lroot二、暴露dashboard端口kubectlproxy--address='192.168.1.50'--accept-hosts='^*$'三、创建服务账户后，可能没有secret，此时要自己生成，然后再获取token四、将token放到das
常见设计模式解读（二）苏雨流丰计算机面经设计模式开发语言 java spring boot
文章目录4.策略模式（StrategyPattern）4-1.定义4-2.实现示例4-3.应用场景5.代理模式（ProxyPattern）5-1.定义5-2.实现示例5-3.应用场景5-4.注意事项6.装饰器模式（DecoratorPattern）6-1.定义6-2.实现示例6-3.应用场景7.适配器模式（AdapterPattern）7-1.定义7-2.实现示例4.策略模式（StrategyPa
JAVA AOP 带参数实现（简版） xiaoyustudiowww java 开发语言
=======Java代码packageorg.rain.aop;importjava.lang.reflect.InvocationHandler;importjava.lang.reflect.Method;importjava.lang.reflect.Proxy;interfaceSmallRainTargetInterface{voiddoThing();voiddoThingArgs(
nginx中proxy_pass和root的区别 LeonNo11 nginx nginx 运维
在location配置中，proxy_pass和root是完全不同的指令，它们的作用和适用场景不同。1.proxy_pass：代理请求到后端服务器location/api/{proxy_passhttp://http_backend;}作用把请求转发到后端服务器http_backend，即Nginx作为反向代理。适用于Nginx作为API网关或负载均衡的情况。示例如果http_backend是ht
Vue 3 vs Vue 2：深入解析从性能优化到源码层面的进化银之夏雪 vue.js 性能优化前端
Vue.js是当今前端开发中最受欢迎的框架之一。随着Vue3的发布，它在性能优化、开发体验、响应式系统、构建工具和热更新等多个方面都带来了巨大提升。本文将深入剖析Vue3的进化，包括其源码实现方面的优化，如diff算法、静态标记、编译优化，以及Vue3在热更新、构建工具上的改进。1.性能提升：底层优化的革命1.1响应式系统的改进：从Object.defineProperty到ProxyVue2的响
kubernetes(K8S)学习（七）：K8S之系统核心组件 ꯭ 瞎꯭扯꯭蛋꯭ Kubernetes kubernetes 学习容器
K8S之系统核心组件K8s系统核心组件1.1Master和Node1.2kubeadm1.3先把核心组件总体过一遍1.4Kubernetes源码查看方式1.5kubectl1.6APIServer1.7集群安全机制之APIServer1.8Scheduler1.9kubelet1.10kube-proxyK8s系统核心组件1.1Master和Node官网：https://kubernetes.io
FASM源代码分析01 VOgai
全汇编操作系统Kolibri0.7.7基于MenuetOS使用fasm汇编编译器第2个光盘安装的，肯定不用下的第1个软盘镜像是我们需要的第3个是源代码第4个是APP开发包在其官网http://kolibrios.org/可以下到的文件有kolibri_0.7.7.0_img_en.7z------------软盘镜像文件kolibri_0.7.7.0_sdk.7z-----------------
Ubuntu14.04设置网络代理得一录 Linux
buntu下apt-get的网络代理设置（终端命令行的网络代理设置）新立得软件管理器这种图形化的代理设置很明了，这里介绍下终端命令行的网络代理设置，这样大家就可以通过代理进行apt-get了。方法一：如果只是想临时使用http代理，可以在使用apt-get之前于终端下输入：exporthttp_proxy="http://用户名:密码@代理IP:代理端口"方法二：（方法一的持久化）如果希望apt-
vue项目提示 WebSocketClient.js:49 WebSocket connection to ‘ws://xxxx/ws‘ failed: Invalid frame header Beamon__ vue vue.js 前端
项目信息vue-cli创建的vue3+webpack5项目；问题现状配置proxy代理后，控制台报错，不影响使用，但是不美观，并且不利于在控制台调试代码；原因定位代理问题，新配置的接口代理，影响到了项目内置的本地服务代理配置，参考Websocketconnectionfailed,Invalidframeheader·Issue#1850·vuejs/vue-cli·GitHub解决方案方案一一刀
Conda报错解决：ProxyError: Conda cannot proceed due to an error in your proxy configuration. 三采 Linux Conda 代理
目录原因一：源配置有误原因二：代理配置有误原因三：路由配置有误在需要使用代理的服务器下，创建新conda环境时报错：condacreate-nopencompasspython=3.8/usr/lib/python3/dist-packages/requests/__init__.py:89:RequestsDependencyWarning:urllib3(1.26.9)orchardet(3.
从底层到实践：深度解析 Vue Composition API 与 React Hooks 的异同
一、设计哲学与底层原理差异1.1响应式系统的基因差异Vue3的CompositionAPI建立在Proxy-based响应式系统之上，通过劫持对象的getter/setter实现依赖收集。当访问响应式对象时，Vue会自动建立组件与数据的依赖关系。//Vue响应式原理简版实现functionreactive(obj){returnnewProxy(obj,{get(target,key){track
Nginx、LVS、HAProxy 的区别和优缺点青年夏日科技 nginx 运维
Nginx、LVS、HAProxy是目前使用最广泛的三种负载均衡软件，本人都在多个项目中实施过，通常会结合Keepalive做健康检查，实现故障转移的高可用功能。1）在四层（tcp）实现负载均衡的软件：lvs------>重量级nginx------>轻量级，带缓存功能，正则表达式较灵活haproxy------>模拟四层转发，较灵活2）在七层（http）实现反向代理的软件：haproxy----
LVS、Haproxy、Nginx区别 SHISHIZHIZHI nginx 负载均衡服务器
LVS、Haproxy、Nginx区别一、Haproxy调度算法1.常见的web集群调度器2.Haproxy应用分析3.Haproxy调度算法原理4.Haproxy的主要特性5.Haproxy的优点6、LVS.Haproxy、Nginx区别二、Haproxy优化三、Haproxy日志1.修改主配置文件2.修改rsyslog配置一、Haproxy调度算法1.常见的web集群调度器目前常见的web集群
lvs、nginx、haproxy区别和使用场景？企鹅侠客 linux 聊聊运维 lvs nginx 运维
0.运维干货分享软考系统架构设计师三科备考经验附学习资料信息安全管理体系（ISMS）制度模板分享免费文档翻译工具(支持word、pdf、ppt、excel)PuTTY中文版安装包MobaXterm中文版安装包pinginfoview网络诊断工具中文版LVS（LinuxVirtualServer）、Nginx和HAProxy都是常见的负载均衡工具，它们在不同的场景中各有优势。以下是它们的区别、特点及
Docker拉取镜像 - 代理纳兰雨天 docker 容器代理模式
docker配置代理创建或编辑Docker配置文件sudomkdir-p/etc/systemd/system/docker.service.dsudonano/etc/systemd/system/docker.service.d/http-proxy.conf在文件中添加代理配置：[Service]Environment="HTTP_PROXY=127.0.0.1:7897"Environme
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S