搜索引擎发展历程回顾:WWW之前的信息检索方式(1)——Archie
(编辑:jimmy 日期: 2024/11/5 浏览:3 次 )
搜索引擎发展历程回顾:WWW之前的信息检索方式(1)——Archie
我们现在所说的搜索引擎都是基于WWW的,也就是基于网页的检索,如我们熟知的yahoo!、google等,不过这些并不是互联网上最早的信息检索服务,如早在1990年出现的Archie就是一种文档查询索引服务之一(1993年6月网络机器手程序“WWW
Wanderer”的诞生是基于玩维网搜索引擎的雏形)。本文所要介绍Archie和下一篇文章要介绍的WAIS就是互联网早期两种常用的文档查询服务。
Archie是Internet上用来查找其标题满足特定条件的所有文档的自动搜索服务的工具。为了从匿名FTP服务器上下载一个文件,必须知道这个文件的所在地,即必须知道这个匿名FTP服务器的地址及文件所在的目录名。Archie就是帮助用户在遍及全世界的千余个FTP服务器中寻找文件的工具。Archie
Server又被称作文档查询服务器。用户只要给出所要查找文件的全名或部分名字,文档查询服务器就会指出在哪些FTP服务器上存放着这样的文件。
使用Archie进行查询前提:要查找的文件名或部分文件名,知道某个或几个Archie服务器的地址。
在整个Internet,有一些称为Archie服务器的计算机,这些服务器提供很重要的服务——帮助你找到有特殊文件或目录的匿名FTP主机的名字。为什么使用Archie这个名字?是因为它听起来象“archive(文件、档案)这个单词。我们倾向于将Archie说成是一个人,至少是一个智能化的机器人。
当你想要检索一个匿名 FTP 文件或目录时, 你所要做的事情是告诉
Archie你要检索什么。Archie将进行检索,然后显示每一个包含有那份文件或目录的匿名FTP主机的名字。Archie还将详细地告诉你目录路径。
这样,你就可以轻易地从相应的FTP主机中取得你所需要的FTP文件。
使用Archie服务器有三种方法。首先,你可以远程登录到Archie服务器,用Archie用户标识登录,一旦登录,一个Archie程序将自动启动。你可每一次录入一个命令,告诉Archie你要检索什么,Archie就将检索其数据库然后显示结果。如果你不能确定要检索什么,Archie将提供另外一种称为“
whatis 的服务, whatis对上千个不同的程序、数据文件和档案资料进行了描述。
使用Archie的第二种方法是使用一个称为Archie客户机的程序,你告诉Archie
客户机程序你检索什么,客户机将自动连接一个Archie服务器,要求它完成检索,根据你的指示输出,并显示结果。一旦你懂得如何使用
Archie,使用Archie客户机就很容易并且很快。你不必象第一种方法那样进行远程通讯,也没必要记住该用什么Archie命令。
最后一种方法,你可以给任一个 Archie 服务器发送一个电子邮件,
Archie将执行你的请求,并将结果邮回来。
Archie如何工作
从概念上讲,Archie的工作十分简单,每隔一段时间,特殊的程序连到每一个已知的匿名FTP
主机,然后下传所有公共文件完整的目录表。这些表存贮于称为Internet Archives Database(Internet档案数据库)中。当你要求Archie检索一个文件时,所要进行的全部工作就是对该数据库进行检索。
世界各地的各种Archie服务器都各自保持着对Internet上各匿名FTP
主机的跟踪。例如,Australian(澳大利亚)的Archie服务器就保持着对澳大利亚的匿名FTP 主机的跟踪。由于信息是共享的,所有Archie服务器都将尽可能保持最多数据。平均说来,大约一周检查一次各个匿名
FTP主机。
Archie原先是作为加拿大蒙特利尔的McGill大学计算机学院的学生和教师自愿者开发的项目,软件是Alan
Emtage和 Bill Heelan 在 Peter Deutsch的帮助下编写的。今天,Archie由加拿大蒙特利尔的
Bunyip Information System 公司经营。你可以发邮件到info@bunyip.com
与他们取得联系。
Archie服务器的使用
为了使用某个 Archie 服务器, 先对它进行远程登录, 然后使用“
Archie”用户标识登录(不需口令)。例如,下面的命令将对位于Rutgers大学的服务器进行远程登录:
telnet archie.rutgers.edu
你可以使用任何一个Archie服务器,但显然使用最靠近你的一个服务器会更快一些。
通常,对一个Archie服务器而言,能够对其同时进行远程登录的人数是有限的。如果最近的一个Archie服务器正繁忙,可以用远的一个,或等一会再试。
一旦用"archie"登录到服务器,你会看到一些欢迎使用方面的信息,然后出现下面的提示:
archie>
这时Archie服务器就为接受命令作好了准备。要停用Archie,可录入
quit命令。用help命令可显示帮助信息(后面将详细讨论有关 help命令的内容,因为有些细微差别。)
使用Archie工具时分三步:首先按你喜欢的方式把问题提出来,然后进行实际的工作,最后退出。
【如果有兴趣了解关于Archie的更多介绍,请参考相关文章。如 http://www.lnu.edu.cn/inter/internet_dc_13.html
(本文部分内容选自该网页内容)。】
下一篇:搜索引擎发展历程回顾:WWW之前的信息检索方式(2)——WAIS