动网论坛,站长建站首选,国内使用量最多的论坛软件 动网论坛官方技术讨论区 站长工具 申请属于您自己的免费论坛
首页 | 新闻资讯 | 网站运营 | 网络编程 | 数据库 | 服务器 | 网页设计 | 图像媒体 | 网络应用 | 搜索优化 | 资源下载 | 动网主机 | DVBOX
    本站内  互联网 ASP论坛  ASP.Net论坛  PHP论坛
  
   Cgi/Perl → 阅读文章

 CGI技术及其开发

作者来源: 
阅读 1367 人次 , 2006-3-29 4:05:00 


作为internet上最主要的信息管理和组织手段,www由一系列相应的技术及应用构 成,其组成技术包括http、html、url以及cgi等。www服务器本身提供一些基本功 能,以完成客户端的请求和自身的管理。但不同的用户有不同的功能要求,其中许 多功能是www服务器本身 不能提供的(比如在线查询等),它必须提供一种扩展手 段,以允许用户编写扩展应用程序来扩展服务器的功能。cgi(commongatewayinterface, 即通用网关接口)就是这样的一种标准扩展技术。下面就cgi的基本技术及其开发 进行讨论。

一、cgi技术
1.1cgi的提出
cgi是外部扩展应用程序与www服务器交互的一个标准接口。按照cgi标准编写的外 部扩展应用程序可以处理客户端(一般是www浏览器)输入的协同工作数据,完成 客户端与服务器的交互操作。这在实际应用中非常有用,如可以编写cgi外部扩展 程序来访问外部数据库,客户端用户可以通过它和www服务器来进行数据查询。cgi 一般分两种:标准cgi和缓冲cgi。所有的www服务器均应支持标准cgi,按标准cgi 编写的程序与具体的www服务器无关。而按缓冲cgi编写的程序与www服务器有关。 1.2cgi的工作原理
1.标准cgi
客户端、服务器、cgi接口与外部程序间的关系可用图1-1表示:如上图所示,服 务器是客户端(如浏览器)与扩展程序之间的通道。当客户端的用户完成了一定 输入工作(比如填充完html文档中的form表)之后向服务器发出http请求(称为cgi 请求),服务器守护进程接收到该请求后,就创建一个子进程(称为cgi进程)。 该cgi子进程将cgi请求的有关数据设置成环境变量,在外部cgi程序与服务器间建 立两条数据通道(标准i/o),然后启动url指定的cgi程序,并与该子进程保持同 步,以监测cgi程序的执行状态。子进程通过标准输出流将处理结果传递给服务器 守护进程,守护进程再将处理结果作为应答消息回送到客户端。外部cgi程序通过 环境变量、命令行参数、标准输入输出与www服务器进行通讯,传递有关参数和处 理结果。*环境变量:当服务器守护进程创建子进程运行cgi程序时,设置相应的 环境变量和命令行参数,以传递客户端和服务器的有关信息给该子进程。*命令行 参数:命令行参数仅在有html文档中有isindex查询的情况下使用。*标准输入输 出:当http请求模式采用post方式时,cgi程序通过标准输入流和有关环境变量来 获取客户端传输数据;如采用get方式时,cgi程序直接通过环境变量获取客户端传 输数据。当cgi程序要返回处理结果(一般为html文档)给客户端时,它通过标准 输出流将该结果数据传递给服务器守护进程。
2.缓冲cgi
标准cgi使用stdin/stdout来进行数据通讯,这是由其最初开发环境(unix操作 系统)所决定的。但是许多windows环境下的编程工具(如vb和delphi等)是不支 持这种i/o方式的,这时就不能用它们来开发基于标准cgi的应用程序。于是有些 服务器提出了缓冲cgi的概念。缓冲cgi亦称为wincgi。此时cgi扩展程序与服务器 间通过缓冲cgi而不是标准cgi进行通讯,而缓冲cgi与服务器间的通讯还是通过标 准cgi接口。后者由www服务器的内置缓冲处理程序实现。这几部分的关系可用图 1-2表示:缓冲cgi的工作原理与标准cgi相似,不同的是当服务器守护进程接收 到客户端的cgi请求时,所建立的cgi子进程将cgi请求的有关数据设置成环境变量 外,还将它们保存在输入缓冲区中;通过缓冲处理程序在外部cgi程序与服务器间 建立两条数据通道(输入/输出缓冲区)。cgi子进程通过输出缓冲区将处理结果 传递给服务器守护进程。此处外部cgi程序通过环境变量和输入/输出缓冲区与www 服务器进行通讯,传递有关参数和处理结果。此处环境变量的意义同上,不过这 些环境变量及其相应值保存在输入缓冲区中。此外,输入缓冲区中还存放客户端 的传输数据(如采用post模式的话)。输出缓冲区用来存放扩展程序的处理结果。
3.标准cgi与缓冲cgi的区别
对cgi扩展程序而言,最主要差别在于数据的i/o不同:对缓冲cgi,服务器与cgi 扩展程序间的数据交换是通过缓冲区;而标准cgi是通过标准i/o。使用缓冲cgi可 选择更多的开发工具,可以开发windows95和windowsnt下的gui扩展程序;而使用 标准cgi所选用的开发工具必须支持标准i/o。只有少数几种www服务器支持缓冲cgi, 因此基于它的扩展程序兼容性不如标准cgi好。
1.3cgi与其他www技术的关系
cgi作为www服务器的标准扩展技术,由上面cgi的基本原理可知,它和许多其它的 www技术密切相关,如http、html、mime和url等,下面主要就它与前两种技术的关 系进行研究。
1.cgi与http协议
cgi通过http协议在客户端和服务端进行通讯:*客户端用户代理向服务器发送的 请求是http请求消息。该消息中含有处理用户输入的cgi扩展程序的url值。*cgi 扩展程序在处理结束后,返回给客户端的应答是http应答消息。因此cgi程序的输 出数据必须符合http应答消息的语法格式,这在基于cgi标准的开发中非常重要。
2.cgi与html语言
cgi扩展程序的输出数据(http应答消息)一般有两种:符合mime类型的文档(最 普遍的是html文档,表示为text/html);指向其它文档的url链接。这两种方式 都与html语言有关,数据的组织须符合html语法格式。
1.4cgi开发的几个问题
基于www的人机交互一般有两种情况:本地交互和通过网络传输的交互。前者是指 客户端用户的输入数据在客户端本地进行处理,然后将处理结果返回给用户,常 见的开发工具有javascript(netscape开发)和vbscript(microsoft开发);后 者是指客户端用户输入的数据通过网络传输到www服务器,服务器处理结束后将处 理结果返回给客户端用户,常见的开发技术是www服务器扩展技术(如cgi,api等)。 此处主要讨论基于标准cgi技术的通过网络进行数据传输的交互实现。对这种人机 交互的实现,主要有三个环节需要解决:如何获取客户端传输的数据,如何提取有 效数据并处理这些数据,如何向客户端返回应答。下面分别结合有关技术,谈谈这 三方面问题的解决。
1.客户端传输数据的获取
由第三章cgi的原理可知,当服务端守护进程接收到客户端用户代理(如浏览器) 提交的cgi请求时,所创建的cgi子进程会设置与cgi请求内容有关的环境变量,并 建立服务器与外部cgi程序之间通讯的通道(即标准i/o)。cgi程序可以通过环境 变量,标准i/o或命令行参数获取客户端用户输入的数据。数据的获取与请求所采 用的http方法(method)和用户所使用的请求方式有关。用户通过cgi请求数据一 般有三种方式:htmlform表,isindex,可点击图片(ismap或imagemaps)。后两 种方式是通过命令行参数传递用户的输入数据;在c语言中(下面的举例亦然), cgi程序可以用argc和argv[int]获得这些参数值。而前一种方式则取决于http请 求方法;但不管采用何种方法,都将用到环境变量来传递有关请求内容。
●获取环境变量
环境变量的类别很多,包含客户端和服务端的详细信息。在一般cgi程序开发中, 下述几个环境变量在数据传递中起着重要作用。
*gateway—interface
cgi程序所使用的cgi标准接口的版本号。如使用的cgi1.1版,该变量表示为
“cgi/1.1”
*request—method
http请求方法。根据该变量值可判断cgi请求所采用的请求方法,以决定是通过stdin 还是通过环境变量query—string获取客户端传输数据。
*query—string
query—string是cgi程序url中″?″之后的数据。当使用isindex查询或form表使 用get方法时,客户端传输数据可以通过读取该变量而获得。
*content—length
content—length表示客户端传输数据的字节数。
*content—type
content—type表示客户端传输数据的数据编码类型。
利用—environ(int)函数可以获得所有的环境变量及其值;
利用getenv(constchar*)函数可以获得指定环境变量的相应值。
●http请求方法
客户端用户代理提交的cgi请求是http请求,其中包括http请求方法。http协议定义
的请求方法中常用的主要有get和post。
客户端form表的method属性用来设置请求方法,其缺省值为get。如果在form中使用 get方法,cgi程序通过环境变量query—string获取客户端传输数据。如果在form中 使用post方法,cgi程序通过通过content—length获取客户端传输数据的字节数, 通过stdin读取客户端传输数据。
2.有效数据的提取和处理
通过上述方式获取的客户端传输数据的一般格式为:
name[1]=value[1]&name[2]=value[2]&...name[i]
=value[i]...name[n]=value[n]
(1ι=iι=n)
其中name[i]表示变量名,它是在form表中某输入域的名字;value[i]表示变量 值,它是用户在form表中某输入域中输入的值。客户端传输数据的每对″name=value″ 串由′&′字符分隔,其数据编码类型可以从环境变量content—type获取。cgi/1.1 版仅支持“application/x-www-form-urlencoded”编码方式。这种编码方式和 url的编码方式一样,遵循两个规则:数据中的空格(ascii码值32)编码成′+′号; 保留字符编码成″%xx″形式,″xx″是该字符ascii值的十六进制表示,比如″$″ 的编码为″%24″,″?″的编码为″%3f″。因此,要获取客户端用户的输入数据, 必须对上述获取的数据进行分离和解码等处理。利用函数strtok()、strchr()等 可以实现数据分离处理,而数据的解码则需要对整个数据串进行扫描,将数据串中的 ″%xx″复原为对应的ascii码。在提取到有效数据后,还可能进行许多其他的处理, 如数据库查询等。这种处理与普通编程相同。
3.向客户端返回应答
cgi程序处理结束后,通过标准输出流将应答信息传递给服务器,再由服务器返回给发 出请求的客户端。其输出的应答信息是http应答消息,它一般由两部分组成:应答头 和应答数据。常见的应答头包括三种头域:content—type(数据编码类型,用mime类 型表示),location(特定文档的url,这种情况不直接向客户端输出内容而输出该url) 和status(处理结果的状态码和状态描述)。http应答头由几行格式相同的文本构成, 每行的基本格式为:″头域名:该域内容″。应答头和应答体之间用一空行加lf(或 cr/lf)分隔。应答体为cgi扩展程序的输出数据,其数据类型应该与content—type 值相一致。cgi程序的输出可以用printf()、puts()等标准i/o函数来实现。
4.cgi程序的开发及其一般流程
在开发cgi程序过程中,可根据实际情况(服务器提供的接口、实际需求和程序员经验 等)选择编程语言,如c/c++,perl,tcl,anyunixshell,vb,applescript。如 果选用c/c++等语言,必须编译成可执行文件;如果选用perl等解释语言,服务器 必须安装相应的解释器。

 
 收藏本文  打印本文  论坛讨论  关闭窗口
· 上一篇:CGI扫描器的原理和实现过程
· 下一篇:Server Push详解
· PERL与MySQL(DBI接口)
· CGI教学:第四章 设置Web Server以运行CGI
· server push具体实现
· 如何创建 Atom
· 用Perl语言进行Socket编程之四


关于本站 | 联系我们 | 业务合作 | 客户案例 | 诚聘英才 | 广告合作 | 收藏本站
海口动网先锋网络科技有限公司版权所有
Copyright © 2000 - 2006 Cndw.Com
中华人民共和国电信与信息服务业务经营许可证编号 琼 ICP 020077