1、CGI定义:
CGI全称是“通用网关接口”(Common Gateway Interface),HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具,其程序须运行在网络服务器上。
2、CGI功能:
利用通用网关接口,Web服务器可以执行一些外部的小程序,可以将这些外部小程序所产生的输出结果和Web服务器所管理的静态文件、图像和声音整合在一起传给相应的Web浏览器,Web服务器可以收集Web页面中表单内的信息,可以对特定的Web网页进行访问计数,可以根据浏览器的请求以数据库进行检索和更新。Web服务器和CGI程序的结合大大增强了整个万维网的信息提供和交互能力。
3、CGI运行环境:
CGI程序最初在UNIX操作系统上CERN或NCSA格式的服务器上运行。在其它操作系统(如:windows NT及windows95等)的服务器上也广泛地使用CGI程序,同时它也适用于各种类型机器。
4、CGI工作流程:
(1)、用户在浏览器表单内输入数据并提交。
(2)、浏览器通过Internet把用户数据送到服务器端触发一个请求。
(3)、服务器接收用户请求,激活CGI程序并为该CGI程序设置一些传递信息所需的环境变量。
(4)、CGI程序获取服务器传递过来的数据进行处理并把处理结果反馈给服务器。
(5)、服务器把结果传递到客户端浏览器。
(6)、Web服务喊叫中断和客户端浏览器的连接。
(7)、Web浏览器将CGI程序的输出显示在浏览器的窗体上。
5、CGI编程特点:
CGI程序的运行环境和普通程序的运行环境有很大的不同,和普通编程相比,CGI编程有着自身的特点:
(1)、CGI程序必须考虑程序运行时的安全性。因为我们的CGI程序是准备放在Web服务器上供大家使用的,很多人在使用这个程序,这样就会导致一些软件工作者查找出安全漏洞并对我们的系统进行攻击,我们唯一能做的就是在CGI程序中消除这些漏洞。
(2)、CGI程序获取信息和输出信息的方式和普通程序不一样。在编写CGI程序前,你必须了解Web页面中的超文本链接或表单中的数据是如何被传递给CGI程序的,在设计CGI时首先要设计好Web页面上的客户端界面,并需要你对数据传递的两种方法及其优点有所了解。
(3)、CGI程序工作在无状态的运行环境中,这种无状态的运行环境有两个特征:a、不提供永久的上下文信息,即在会话连接期间不保存上下文信息;b、系统可能会拥有同一个CGI程序的多个进程,这样一旦Web服务器响应了客户端一个运行CGI程序 的请求,运行结束后譔连接立刻被切断,当新的请求到来时会重建连接,并且上一次连接的状态信息彻底清除。
6、CGI服务器配置:
CGI程序不是放在服务器上就能顺利运行的,如果要想使其在服务器上顺利的运行并准确的处理用户的请求,则须对所使用的服务器进行必要的设置。
配置:根据所使用的服务器类型以及它的设置把CGI程序放在某一特定的目录中或使其带有特定的扩展名。
(1)、REN格式服务器的配置:
编辑CREN格式服务器的配置文件(通常为/etc/httpd.conf)
在文件中加入:Execcgi-bin/*/home/www/cgi-bin/*.exec命令中出现的第一个参数cgi-bin/*指出了在URL中出现的目录名字,并表示它出现在系统主机后的第一个目录中,如:http://192.168.1.123/cgi-bin/
命令中的第二个参数表示CGI程序目录放在系统中的真实路径。
CGI目录除了可以与网络文件放在同一目录中,也可以放在系统的其它目录中,但必须保证在你的系统中也具有同样的目录。在对服务器完成设置后,须重新启动服务器(除非HTTP服务器是用inetd启动的)。
(2)、NCSA格式服务器的配置
在NCSA格式服务器上有两种方法进行设置:
a、 在srm.conf文件(通常在conf目录下)中加入:Script Alias /cgi-bin /cgi-bin/
Script Alias命令指出某一目录下的文件是可执行程序,且这个命令是用来执行这些程序的;此命令的两个参数与CERN格式服务器中的Exec命令的参数的含意一样。
b、 在srm.conf文件加入:Add typeapplication/x-httpd-cgi.cgi
此命令表示在服务器上增加了一种新的文件类型,其后第一个参数为CGI程序的MIME类型,第二个参数是文件的扩展名,表示以这一扩展名为扩展名的文件是CGI程序。
在用上述方法之一设置服务器后,都得重新启动服务器(除非HTTP服务器是用inetd启动的)。
7、CGI的编写语言
CGI可以用任何一种语言编写,只要这种语言具有标准输入、输出和环境变量。CGI只是规定了一个标准的接口规范,只要遵守这个标准规范,程序开发人员就可以利用各种编程语言,如:Perl、C、Fortran、VisualBasic等进行CGI程序设计。对初学者来说,最好选用易于归档和能有效表示大量数据结构的语言。
8、CGI常用环境变量
SERVER-NAME:运行CGI序为机器名或IP地址。
SEUVER-INTERFACE:WWW服务器的类型,如:CERN型或NCSA型。
SERVER-PROTOCOL:通信协议,应当是HTTP/1.0。
SERVER-PORT:TCP端口,一般说来web端口是80。
HTTP-ACCEPT:HTTP定义的浏览器能够接受的数据类型。
HTTP-REFERER: 发送表单的文件URL。(并非所有的浏览器都传送这一变量)
HTTP-USER-AGENT:发送表单的浏览器的有关信息。
GETWAY-INTERFACE:CGI程序的版本,在UNIX下为CGI/1.1。
PATH-TRANSLATED: PATH-INFO中包含的实际路径名。
PATH-INFO:浏览器用GET方式发送数据时的附加路径。
SCRIPT-NAME: CGI程序的路径名。
REQUEST_METHOD:数据传递的方法,有GET和POST两种。
QUERY-STRING:表单输入的数据,URL中间号后的内容,GET方式时它保存的是用户的表单数据。
REMOTE-HOST:发送程序的主机名,不能确定该值。
REMOTE-ADDR:发送程序的机器的IP地址。
REMOTE-USBR:发送程序的人名。
CONTENT-TYPE:POST发送,一般为applioation/xwww-form-urlencoded。如果是上传文件,则为applioation/form-data。
CONTENT-LENGTH:POST方法输入的数据的字节数。
HTTP_ACCEPT:客户端浏览器所接收到的数据类型。