[!--temp.sitename--] - 网站首页―中恒远策―工业品渠道调研专家 | topo100.com
繁体中文 | 关于我们 | About Us

常用Internet服务

时间:2007-12-24 13:09:28  推荐指数 关注度: 报告业务: 010-65667912

WWW基础

 1)WWW工作原理

WWW(World Wide Web)的含义是“环球网”、“布满世界的蜘蛛网”,俗称“万维网”或3W或Web。WWW是一个基于超文本(Hypertext)方式的信息检索服务工具。它是由欧洲粒子物理实验室(CERN)研制的,将位于全世界Internet网上不同地点的相关数据信息有机地编织在一起。WWW提供友好的信息查询接口,用户仅需要提出查询要求,而到什么地方查询及如何查询则由WWW自动完成。因此,WWW为你带来的是世界范围的超级文本服务:只要操纵电脑的鼠标器,你就可以通过Internet从全世界任何地方调来你所希望得到的文本、图像(包括活动影像)和声音等信息。另外,WWW还可为你提供“传统的”Internet服务:Telnet、FTP、Gopher和Usenet News(Internet的电子公告牌服务)。通过使用WWW,一个不熟悉网络使用的人也可以很快成为Internet行家。

WWW与传统的Internet信息查询工具Gopher、WAIS最大的区别是它展示给用户的是一篇篇文章,而不是那种令人时常费解的菜单说明。因此,用它查询信息具有很强的直观性。

WWW的成功在于它制定了一套标准的、易为人们掌握的超文本开发语言HTML、信息资源的统一定位格式URL和超文本传送通信协议HTTP。

 2)超文本标记语言(HTML)

HTML(Hyper Text Mark-up Language)即超文本标记语言,是WWW的描述语言,由Tim Berners-lee提出。设计HTML语言的目的是为了能把存放在一台电脑中的文本或图形与另一台电脑中的文本或图形方便地联系在一起,形成有机的整体,人们不用考虑具体信息是在当前电脑上还是在网络的其它电脑上。这样你只要使用鼠标在某一文档中点取一个图标,Internet就会马上转到与此图标相关的内容上去,而这些信息可能存放在网络的另一台电脑中。

HTML文本是由HTML命令组成的描述性文本,HTML命令可以说明文字、图形、动画、声音、表格、链接等。HTML的结构包括头部(Head)、主体(Body)两大部分。头部描述浏览器所需的信息,主体包含所要说明的具体内容。

 3)统一资源定位器(URL)

URL(Uniform Resource Locator,统一资源定位器)是WWW页的地址,它从左到右由下述部分组成:

Internet资源类型(scheme):指出WWW客户程序用来操作的工具。如“http://”表示WWW服务器,“ftp://”表示FTP服务器,“gopher://”表示Gopher服务器。

服务器地址(host):指出WWW页所在的服务器域名。

端口(port):有时(并非总是这样)对某些资源的访问,需给出相应的服务器提供端口号。

路径(path):指明服务器上某资源的位置(其格式与DOS系统中的格式一样,通常有目录/子目录/文件名这样结构组成)。与端口一样,路径并非总是需要的。

URL地址格式排列为:

scheme://host:port/path例如http://www.cnd.org/pub/HXWZ就是一个典型的URL地址。

客户程序首先看到http(超文本传送协议),便知道处理的是HTML链接。接下来的www.cnd.org是站点地址,最后是目录pub/HXWZ。

而ftp://ftp.cnd.org/pub/HXWZ/cm9612a.GB,WWW客户程序需要用FTP进行文件传送,站点是ftp.cnd.org,然后去目录pub/HXWZ下,下载文件cm9612a.GB。

如果上面的URL是ftp://ftp.cnd.org:8001/pub/HXWZ/cm9612a.GB,则FTP客户程序将从站点frp.cnd.org的8001端口连入。

必须注意,WWW上的服务器都是区分大小写字母的,所以,千万要注意正确的URL大小写表达形式。

 4)主页(Homepage)

Homepage直译为主页。确切地说Homepage是一种用超文本标记语言(描述性语言)将信息组织好,再经过相应的解释器或浏览器翻译出的文字、图像、声音、动画等多种信息组织方式。用户可以把它同报纸、杂志、电视、广播等同等对待。Homepage的传播方式是将原代码和与Homepage有关的图形文件、声音文件放在一台服务器(称WWW)查询。比如你想了解IBM公司的情况,你就可以浏览IBM公司的Homepage,它应该放在IBM的WWW服务器上,那么在浏览器URL输入的地方输入:

http://www.ibm.com

2信息搜索方法
  Internet上的信息资源很太丰富,丰富得让人有点儿无所适从,尤其是对那些刚刚踏入Internet这具网络世界里来的生手,更是令人扑朔迷离,难以理出头绪。有人比喻Internet上的信息就如同许多堆杂乱无章的书籍,只是在每堆书籍上列出此堆书籍中涉及的内容及书名,但要找到具体书籍则需自己不辞劳苦地一一查找了。

无需置疑,Internet上众多的信息资源中肯定有你所需的信息,若清楚信息的存放地址,通过在线获取这些信息是快捷而便利的,但是主要问题是如何找到这些信息。

 1)查找信息的途径

在Internet上查找信息的途径有很多种,可大致分为以下几种:

① 偶然发现。这是在Internet中发现信息的原始方法。当你在Internet上遨游之时,也许会意外发现一些很有用的信息。由于这种方法的不可预见性,所以它也很有乐趣,但也许会一无所获。

② 浏览(Browsing)。浏览就如同走进图书馆的书库,然后在书架上直接翻看一样。目前Internet上提供的Gopher服务就是这种方法的电子等价物。WWW提供的超文本方式可以看作是浏览的一种特殊形式。

③ 搜索(Searching)。搜索就像通过索引或分类卡片来帮助查找一样。在Internet中有许多不同类型的搜索工具,如WAIS、Archie、Veronia、Jughead等它们都有各自不同的搜索目的。还有许多网点则提供给用户一种组合式的搜索界面。

④ 通过资源指南(Resource Guide)来查找相应的信息。目前Internet上有许多资源指南。如
http://www.rpi.edu/Internet/Guides/decemj
/icmc/toc3.htm1
就是一个资源指南,它搜索了关于Internet各种技术、文化、组织、应用等大量的信息指针。用户可利用这些指针进行资源引导。但是应注意Internet上的信息变化极快,几乎每六个月就需对这些信息进行更新,参照的资源指南可能已经过时。

Internet上提供了成千上万个信息源和各种各样的信息服务,而且信息源和服务种类、数量还在不断、快速地增长。对这些信息源和服务,由于时间、精力和财力限制,不可能一一亲身尝试。上面提到的偶然发现和浏览两种方法虽然在某些场合下十分有效,但有时花费时间、效益比可能不会令人太满意,而使用搜索方法则可缩小查找范围,达到事半功倍的效果。

 2)具体信息搜索步骤

(1) 制定信息搜索策略

在Internet上进行信息搜索时,建议采取以下几个策略:

① 首先确定提供相关信息的优秀信息源。

② 检查信息源所提供的信息粒度是否适中,所提供的信息量是否合适。信息量太多,冗而杂,搜索不便,信息量太少,则搜索不到足够的信息。

③ 研究信息源所提供的搜索命令及搜索方法,制定搜索计划,然后开始进行搜索。

(2) 确定信息源

确定信息源是很关键的一步。良好的开端是成功的一半。若起点没有找准,搜索结果可能会一无所获。下面介绍几个优秀的搜索网点。

① http://www.altavista.digital.com

该网点是数字设备公司(Digital Equipment Corp)无偿提供的Altavista服务。该网点对上百万个Web主页建立了索引。并且包含了13000多个实时更新的Usenet新闻组的全文索引。它的优势在于:它允许把搜索对象的范围限制在一个时间段内,而且可以使用“AND”、“OR”、“NOT”及“NEAR”等关键字把词与短句结合起来,组成搜索条件。

② http://www.infoseek.com

该网点是WWW上的一个商业服务。它提供了100多个电脑出版物,13000个Internet新闻组(分两个新闻集合:本周发布的新闻和前四周发布的新闻)20万个WWW及邮件清单目录,这个网点所提供的Web搜索服务是免费的。数据库中包括一些公司简介、电影及录像评述、书讯、音乐唱片评述和技术支持信息(其中包括100多家电脑杂志多年出版的文章及摘要信息)。对这些信息的查询可用自然英语,也可通过输入关键字或短语来进行查找。

(3) 信息搜索方法及搜索机制

对于各个服务网点,具体搜索起来还有许多实际问题。因为不同网点提供搜索服务的实现方法不同,目前没有一个对所有在线服务都是行之有效的简单的搜索规则。对某一服务来说是很好的方法,也许对另一个服务来说则是完全无用的。

许多服务在线提供完全的搜索命令文档。当用户使用某一网点进行搜索时,应该先研究一下此服务提供的搜索命令、搜索方法及它的特色,这样才能明确如何在其上进行搜索并充分利用该网点的优势。例如有些搜索网点允许用户在新一轮的搜索中利用上一次的搜索条件。当第一次搜索结果中满足条件的记录很多时,就可以通过增加条件进行第二次搜索,这样能够节省大量的时间和金钱。

在搜索过程中,输入搜索条件是最关键的一步。若用户对自己输入条件所期望的含义与搜索网点“理解”的含义不同,则所得到的搜索结果就会与自己希望得到的相差甚远。当刚开始涉足某一服务搜索信息时,建议搜索者用不同单词进行试验性搜索,然后研究搜索结果的前5~10个记录,注意它们的信息头及索引,通过这种方式就可大致了解这种服务的索引项是如何组织的,下一步就清楚该用什么关键词来搜索自己想要的信息了。

不同网点所提供的搜索机制不同。布尔搜索是较普遍的一种机制。它使用AND、OR、NOT三个布尔操作符来组合搜索项。使用AND操作符组合的搜索项,每个项都必须出现在搜索结果中。使用OR操作符组合的搜索项,任一项出现在文档中,都是符合条件的。使用NOT操作符时一定要注意,它也许会把你所希望查到的结果给筛选出去。

除了布尔搜索机制外,许多在线服务提供了一些其它搜索机制。如自然语言搜索、相关等级搜索、概念搜索等。相关等级搜索与AND搜索类似,但同时它利用了OR搜索的一些优点。在搜索串出现的所有项不需要同时出现在某一搜索结果中。如前面提到的Altavista服务就提供了增强型的相关等级搜索机制。

有些服务还提供了对特殊型信息的搜索。如Altavista向用户提供了对URL或超链(hyperlink)进行搜索。例如,若输入查询条件“+link:eunet.no/-presno/-url:enuet.no/-presno/”,就会查出位于其它Web服务器上包含指向此主页指针的主页,并排除此主页本身所位于的URL。“-”操作符的作用类似于“NOT”,“link:”意指Web服务器上的指针,“url:”是指URL地址。

1.3 Netscape使用方法简介

1.4著名搜索引擎简介

 1)Yahoo

Yahoo 是Internet引擎的“元老”,是WWW上最流行的搜索工具。Yahoo是有斯坦福大学的两位博士研究生David Filo和Jerry Yang(杨致远)于1994年4月创建的。短短两三年时间,Yahoo不但成为网上最热门的搜索工具,而且还造就了新的亿万富翁杨致远。Yahoo由65000个数据库组成,HTML文献和其他Internet资源共20多万个条目。Yahoo有三种信息查询方式:

归类信息方式:如最新消息、当前热点信息等;

专题浏览方式:将所有普通信息分为十二大类:艺术、商业和经济、计算机和互联网、教育、娱乐、政府、健康、新闻、休闲和运动、参考消息、区域、科学和社会科学。每一大类又分多个小类。可用鼠标点击链接词进入相关专题,非常方便。

关键词检索方式:这是最快速、方便的检索方式,只需在Yahoo主页的搜索框内键入要查找的信息主题词,然后点击Search按钮即可查找列出结果。

2) Altavista

Altavista检索服务是1995年12月开始的,是目前最优秀的搜索引擎,每天访问它的次数超过1亿次。Altavista检索非常之快,一般只需数秒钟,它维护了一个含时间变量的数据库,能保证所查询的资料是最新的和最全面的。

Altavista的查询分为简单查询和高级查询。简单查询通过输入一个或几个关键词后提交查询任务即可。这与其它引擎的查询方法差别不大。

Altavista高级查询必须使用AND、OR、NOT、NEAR以及( )等操作符来连接词和词组,如internet OR intranet查询包括internet或者intranet的资料。

Altavista支持过滤查询,如host:digital.com查询来自主机为digital的文章。

3)Excite

Excite是由Architext Software公司开发,最近才加入Internet的一个网上查询系统。Excite收集了5000万网页数据,它的检索方式由Excite search(主题词检索)、Excite city-net(城市网络)、Excite live(生活信息)、Excite reference(黄页)等组成。

Excite的最大特点是采用一个称为“智能概念抽取”的专用查询软件,允许用户使用自然语言提问。

4)Lycos

Lycos是卡耐基 ? 梅龙大学的著名查询工具。它对1900万URL(包括FTP和Gopher)进行索引,覆盖95%的Web地址其中仅360万URL有比较完整的全文索引。索引的内容为页名、URL、子标题、文本的前20行和100个加权的词。Lycos提供多种服务,包括关键词、热点新闻、主题网址、城市导游、股市、找人、在线公司、道路地图、关于Lycos、帮助共12类。

Lycos的最大特点是采用了一种可以大大加快数据搜寻速度的技术,称为CentiSpeed,它每秒可处理4000个查询要求。另一个特点是建立了一个叫“A2Z”的Lycos数据库,含有最常用主页的主题目录。

5)WebCrawler

WebCrawler是第一个在Internet上提供全文检索的引擎,后来Lycos、Infoseek、OpenText等加入了全文检索的行列。目前WebCrawler归属America。

Online公司。它以350000个关键词搜索建立索引,全文索引10万HTML文献。WebCrawler提供分类服务,包括文学和艺术、商业和财政、交谈、计算机、每日新闻、教育、娱乐、游戏、政府、健康和医疗、Internet、儿童和家庭、生活和文化、康复、参考台、科学、体育、旅游共18类。

WebCrawler功能强大,一次可以检索世界各地25万个服务器上的160万条文档,每天平均被访问300万次。它的检索结果按相关性排序,分简单和详细两种格式显示。支持自然语言查询和布尔算符查询,用户输入一串词语时可指定任何一词匹配或全部词语匹配。

6)Infoseek

Infoseek于1995年由Infoseek公司推出,对2500万WWW、FTP、Gopher、Newsgroups网点进行全文索引,是Web上的第一家收费的查询系统。它只免费向你提供它查到的前100条记录(不过这对于我们一般的用户已是绰绰有余)。

Infoseek服务的特点是采用词频统计方法来确定词语的重要性和相关性,可按词序检索,词汇大小写有区别,采用双引号、连字符、加号、减号、括号来表示词语的句法。

另外,Infoseek提供下载免费软件的功能。PC Week Labs将Infoseek评为功能最完美的搜索网点。

相关文章
无相关信息
用户评论
验证码: 智囊风云榜 匿名发表(无需注册)
如果还没加入中国智囊风云榜,欢迎加入
    ※ 评论注意事项: 您的评论将在管理员审核后才会显示。 不是智囊风云榜会员或未登陆发表评论,评论人名字显示为匿名。 尊重网上道德,遵守中华人民共和国的各项有关法律法规 承担一切因您的行为而直接或间接导致的民事或刑事法律责任 本站管理人员有权保留或删除评论中的任意内容 参与本评论即表明您已经阅读并接受上述条款。
年鉴光盘
推荐信息
    关于我们 | 网站声明 | 网站地图 | | 中国智囊网版权所有 京ICP证 12002540号-7