WWW和CGI的工作原理

3 CGI程序设计技术

CGI(Common Gateway Interface)是外部应用扩展应用程序与WWW服务器交互的一个标准接口。按照CGI标准编写的外部扩展应用程序可以处理客户端浏览器输入的数据,从而完成客户端与服务器的交互操作。而CGI规范就定义了Web服务器如何向扩展应用程序发送消息,在收到扩展应用程序的信息后又如何进行处理等内容。通过CGI可以提供许多静态的HTML网页无法实现的功能,比如搜索引擎、基于Web的数据库访问等等。

3.1 工作原理

(1)WWW和CGI的工作原理

HTTP协议是WWW的基础,它基于客户/服务器模型,一个服务器可以为分布在网络中处的客户提供服务;它是建立在 TCP/IP协议之上的“无连接”协议,每次连接只处理一个请求。在服务器上,运行产着一个守护进程对端口进行监听,等待来自客户的请求。当一个请求到来时,将创建一个子进程为用户的连接服务。根据请求的不同,服务器返回HTML文件或者通过CGI调用外部应用程序,返回处理结果。服务器通过CGI与外部程序和脚本之间进行交互,根据客户端在进行请求时所采取的方法,服务器会收集客户所提供的信息,并将该部分信息发送给指定的 CGI扩展程序。CGI扩展程序进行信息处理并将结果返回服务器,然后服务器对信息进行分析,并将结果发送回客户端。

外部CGI程序与WWW服务器进行通信、传递有关参数和处理结果是通过环境变量、命令行参数和标准输入来进行的。服务器提供了客户端(浏览器)与CGI扩展程序之间的信息交换的通道。CGI的标准输入是服务器的标准输出,而CGI的标准输出是服务器的标准输入。客户的请求通过服务器的标准输出传送给CGI的标准输入,CGI对信息进行处理后,将结果发送到它的标准输入,然后由服务器将处理结果发送给客户端。

(2)URL编码

客户端浏览器向服务器发送数据采用编码的形式进行。该编码就是CRL编码。编码的主要工作是表单域的名字和值的转义,具体的做法为:每一对域和值里的空格都会被替换为一个加号(+)字符,不是字母或数字的字符将被替换为它们的十六进制数字形式,格式为%HH。HH是该字符的 ASCII十六进制值。
标签将被替换为“%0D%0A”。

信息是按它们在表单里出现的顺序排列的。数据域的名字和数据域的值通过等号(=)字符连在一起。各对名/值再通过“&”字符连接在一起。经过这些编码处理之后,表单信号就整个成为一个连续的字符流,里面包含着将被送往服务器的全部信息。

因为表单输入信息都是经过编码后传递给脚本程序的,所以CGI扩展程序在使用这些参数之前必须对它们进行解码。

3.2 CGI外部扩展程序编制

服务器程序可以通过三种途径接收信息:环境变量、命令行和标准输入。具体使用哪一种方法要由<form>标签的METHOD属性来决定。

在“METHOD=GET”时,向CGI程序传递表单编码信息的正常做法是通过命令来进行的。大多数表单编码信息都是通过 QUERY_STRING的环境变量来传递的。如果“METHOD=POST”,表单信息将通过标准输入来读取。还有一种不使用表单就可以向CGI传送信息的方法,那就是把信息直接追回在URL地址后面,信息和URL之间用问号(?)来分隔。

下面结合Web远程监控ARM芯片的GPIO(通用输入/输出)的应用实例详细介绍。

(1)GET方法

GET方法是对数据的一个请求,被用于获得静态文档。当使用GET方法时,CGI程序将会从环境变量 QUERY_STRING获取数据。为了处理客户端的请求,CGI必须对QUERY_STRING中的字符串进行分析。当需要从服务器获取数据并且不改变服务器上的数据时,应该选用GET方法;但是如果请求中包含的字符串超过了一定长度,一般是1024字节,那么就只能选用POST方法。GET 方法通过附加在URL后面的参数发送请求信息。这些参数将被放在环境变量QUERY_STRING中传给CGI程序。GET方法的表单格式和CGI解码程序可以参考POST方法的实现。

(2)POST方法

当浏览器将数据从一个填写的表单传给服务器时一般采用POST方法,而且在发送的数据超过 1024字节时也必须采用POST方法。当使用POST方法时,Web服务器向CGI程序的标准输入STDIN传送数据。发送的数据长度存在环境变量 CONTENT_LENGTH中,并且,POST方法的数据格式为:

variable1=value1&variable2=value2&etc

CGI程序必须检查REQUEST_METHOD环境变量以确定是否采用了POST方法,并决定是否要读取STDIN。POST方法在HTML文档中定义的表单如下:

<form METHOD=POST ACTION="/cgi-bin/cgi_gpio.cgi">

Operate P0

Operate P1

Operate P2

 

NAME="cancel"TYPE=reset value="RESET">

它调用的服务器脚本程序是/cgi/bin/cgi_gpio.cgi。CGI扩展程序中form表单的解码可参考如下程序:

/*function getPOSTvars*/

char **getPOSTvars(){

int i;

int content_length;

char **postvars;

char *postinput;

char **pairlist;

int paircount=0;

chr *nvpair;

char *eqpos;

postinput=getenv("CONTENT_LENGTH");//获取传送给程序数据的字节数

if(!postinput)

exit();

if(!content_length=atoi(postinput))) //获取信息长度

exit(1);

if(!(postinput=(char*)malloc(content_length+1)))

exit(1);

if(!fread(postinput,content_length,1,stadin))

exit(1);

postinput[content_length]='0';

for(i=0;postinput[i];i++)

if(postinput[i]=='+')

postinput[i]=''; //对加易进行处理

pairlist=(char **)malloc(256*sizeof(char **));

paircount=0;

nvpair=strtok(postinput,"&");//从出现“&”字符的位置把信息分段,然后对结果依次处理

while (nvpair){

pairlist[paircount++]=strdup(nvpair);

if(!(paircount%256))

pairlist=(char**)realloc(pairlist,(paircount+256)*sizeof(char**));

nvpair=strtok(NULL,"&");

}

pairlist[paircount]=0;

postvars=(char**)malloc((paircount*2+1)*sizeof(char **));

for(i=0;i

if(eqpos=strchr(pairlist[i],'=')){

*eqpos='0';

unescape_url(postvars[i*2+1]=strdup(eqpos+1));//调用unescape_url函数继续解码

}else{

unescape_url(postvars[i*2+1])=strdup(""));

}

postvars[paircount*2]=0;

for(i=0;pairlist[i];i++)

free(pairlist[i]);

free(pairlist);

free(postinput);

return postvars;

}

其中,unescape_url函数再调用x2c函数,把(不是字节或数字的)特殊字符从其%HH表示方式解码为文本字符。

/*unescape_url function*/

static void unescape_url(char *url){

int x,y;

for(x=0,y=0;url[y];++x,++y){

if((url[x]=url[y])=='%'){

url[x]=x2c(&url[y+1]);

y+=2;

}

}

url[x]='0';

}

(3)直接URL加参数传递方法

这是一种不使用表单就可以向CGI传送信息的方法。它把信息直接追加在URL地址后面,信息和URL之间用号号(?)来分隔。例如,对于一个cgi_gpio.cgi的脚本,可以从如下的链接启动:

<A HREF=/cgi-gpio.cgi!?flag=0 Operate P0</A>

<A HREF>/*cgi-bin/cgi_gpio.cgi?flag=1 Operate P1</A>

<A HREF=/cgi-bin_gpio.cgi?flag=2 Operate P2</A>

.

.

.

CGI扩展程序中可使用如下代码接收信息:char *get_input;//用于接收环境变量

.

.

.

get_input=getenv(“QUERY_STRING”);

if(get_input){

get_input=strdup(get_input);

printf("QUERY_STRING if %s",get_input);

}

/*判断flag=x信息*/

if(!strcmp(get_input,"flag=0")

...//Operate p0

else if(!strcmp(get_input,"flag=1")

...//Operate P1

else

...//Operate P2

对于上述三种方法,可以根据不同的应用场合和应用要求进行选取。

结语

嵌入式Web Server系统方案可以广泛应用在许多领域,如自动化设备的远程监控、嵌入式GSM短消息 平台以及远程家庭医疗等。并且,随着互联网应用领域的不断深入,嵌入式Internet技术将得到更为广泛的应用和发展。

你可能感兴趣的:(职场,休闲,WWW和CGI的工作原理)