搜索引擎可分为哪两种类型,各有什么特点 什么是目录索引

编辑:
发布时间: 2023-10-31 17:35:46
分享:

目录导航:

搜索引擎可分为哪两种类型,各有什么特点什么是目录索引搜索引擎的分类搜索引擎可分为哪两种类型,各有什么特点

搜索引擎分三类:全文搜索引擎,目录搜索引擎和元搜索引擎。 全文搜索引擎是目前使用最广泛的搜索引擎。它的工作原理是计算机索引程序,通过扫描文章中的每一个字,对每一个词建立索引,著名该词在文章中出现的次数和位置,并对它进行预排名处理。 目录索引是搜素引擎按照各个网站的性质把网址分门别类手机起来,既可以是网站自己提交,也可以是搜索引擎自己提取。 目录索引和全文搜索引擎有着很大的区别 1,目录索引通常是用户提交,或者网站自己进行人工添加。 2.目录搜索收录的内容通常只有网站的名称,网址,简介等网站主体外的内容,而网站内各网页的内容是没有的 3.目录索引收录对网站要求更高,评价标准十分严格,一般要求网站质量高的大网站才能被收录。 元搜索引擎 元搜索引擎是建立在独立搜索引擎之上的搜素引擎。它利用下层的若干个独立搜索引擎提供的服务集中提供统一的检索服务。

分为四种:全文搜索引擎、元搜索引擎、垂直搜索引擎和目录搜索引擎。特点如下:

1、全文搜索引擎

这种搜索方式方便、简捷,并容易获得所有相关信息;利用爬虫程序抓取互联网上所有相关文章予以索引;但搜索到的信息过于庞杂,因此用户需要逐一浏览并甄别出所需信息。

2、元搜索引擎

基于多个搜索引擎结果并对之整合处理的二次搜索方式;元搜索引擎适用于广泛、准确地收集信息;有利于各基本搜索引擎间的优势互补;有利于对基本搜索方式进行全局控制,引导全文搜索引擎的持续改善。

3、垂直搜索引擎

对某一特定行业内数据进行快速检索的一种专业搜索方式;适用于有明确搜索意图情况下进行检索,以准确、迅速获得相关信息。

4、目录搜索引擎

依赖人工收集处理数据并置于分类目录链接下的搜索方式;对网站内信息整合处理并分目录呈现给用户;目录搜索方式的适应范围非常有限,且需要较高的人工成本来支持维护。

什么是目录索引

就是目录索引搜索引擎(Search Index/ Directory) 目录索引搜索引擎中的数据是各个网站自己提交的, 它就像一个电话号码薄一样,按照各个网站的性质, 把其网址分门别类排在一起,大类下面套着小类, 一直到各个网站的详细地址,一般还会提供各个网站的内容简介。

用户不使用关键字也可进行查询,只要找到相关目录, 就完全可以找到相关的网站(注意:是相关的网站, 而不是这个网站上某个网页的内容)。这类搜索引擎往往也提供关键字查询功能,但在查询时, 它只能够按照网站的名称、网址、简介等内容进行查询, 所以它的查询结果也只是网站的URL地址,不能查到具体的页面。由于这类搜索引擎的数据一般由网站提供, 因此它的搜索结果并不完全准确,并不是严格意义上的搜索引擎。( 如, YAHOO.com.cn ,新浪,搜狐等)

目录索引也称为:分类检索,是因特网上最早提供WWW资源查询的服务,主要通过搜集和整理因特网的资源,根据搜索到网页的内容,将其网址分配到相关分类主题目录的不同层次的类目之下,形成像图书馆目录一样的分类树形结构索引。

目录索引无需输入任何文字,只要根据网站提供的主题分类目录,层层点击进入,便可查到所需的网络信息资源。虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。

与全文搜索引擎相比,目录索引有许多不同之处。首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。

搜索引擎的分类

搜索引擎有两种基本类型:一类是纯技术型的全文检索搜索引擎,如google、AltaVista、Inktomi等,其原理是通过机器手(即Spider程序)到各个网站收集、存储信息,并建立索引数据库供用户查询。需要说明的是,这些信息并不是搜索引擎即时从互联网上检索得到的,通常所说的搜索引擎,其实是一个收集了大量网站/网页资料并按照一定规则建立索引的在线数据库,如2004年3月底google收录的网页数量已经超过42亿个,这样,当用户检索时才可以在很短的时间内反馈大量的结果。

另一类称为分类目录,这种“搜索引擎”并不采集网站的任何信息,而是利用各网站向“搜索引擎”提交网站信息时填写的关键词和网站描述等资料,经过人工审核编辑后,如果符合网站登录的条件,则输入数据库以供查询。yahoo是分类目录的典型代表,国内的搜狐、新浪等搜索引擎也是从分类目录发展起来的。分类目录的好处是,用户可以根据目录有针对性地逐级查询自己需要的信息,而不是像技术性搜索引擎一样同时反馈大量的信息,而这些信息之间的关联性并不一定符合用户的期望。

相关阅读
热门精选
孩子 皮肤