📜  什么是元搜索引擎?

📅  最后修改于: 2021-04-17 03:31:31             🧑  作者: Mango

Metasearch Engine是一种搜索引擎,它将各种搜索引擎的结果组合为一个并给出一个结果。它也可以说是一种在线信息检索工具。
之所以开发Metasearch Engine,是因为由于人们试图在线提高其网站排名,因此单个搜索引擎容易出现垃圾邮件。搜索引擎访问多个网站并创建这些网站的数据库。这也称为索引。任何搜索引擎每秒都会回答几个查询。
元搜索引擎在大多数其他搜索引擎上运行查询,然后以这些站点的摘要形式反映结果。

历史

  • 它是由科罗拉多州立大学的Daniel Dreilinger开发的。他开发了Search Savvy,它搜索了20个网站并返回了一个结果。
  • MetaCrawler由华盛顿大学的一名名叫Erik Selberg的学生开发。它是Search Savvy的高级和更新版本。它不如单个搜索引擎好。
  • 在1996年,HotBot诞生了,它比以前的版本要快,并且可以在引擎的搜索结果中进行搜索。后来简化为充当Lycos官方网站上的搜索界面。
  • 2000年,HumHaiIndia.com成为Sumeet Lamba开发的印度第一个元搜索引擎。后来称为Taaza.com

需要元搜索引擎

与大多数搜索引擎不同,元搜索引擎是为覆盖整个网络而开发的。各个搜索引擎试图向用户发送垃圾邮件,以提高他们的网页排名。这是一种非法的推广方式。各个搜索引擎无法从其他搜索引擎中找到结果。这是Metasearch Engine派上用场的时候。与单个引擎不同,这也支持多种格式。元搜索引擎似乎毫不费力。

元搜索引擎架构

  1. 用户界面: Metasearch Engine的用户界面类似于单个搜索引擎(如Google和Yahoo)的外观。它甚至可以根据类型和类别进行搜索,还可以选择必须使用哪些搜索引擎来写回结果。
  2. 调度程序:调度程序负责查询生成。
  3. 显示:显示使用查询将结果写回到屏幕上。它使用诸如页面等级,解析技术,簇形成和拼接之类的方法来给出所需的结果。
  4. 个性化:换句话说,个性化是针对特定用户的。这涉及相互比较结果。

元搜索引擎的操作

元搜索引擎不会自行创建数据库,而是会创建一个联邦数据库,该数据库实际上是各种其他搜索引擎的数据库的集成。
涉及的两种主要操作方式是:

  1. 排名的体系结构:各种搜索引擎都有自己的排名算法。元搜索引擎开发了自己的算法,该算法消除了重复的结果并计算了网站的新排名。这是因为它了解到在主要站点上排名较高的网站更加相关,从而可以提供更好的结果。
  2. 融合:融合用于创建更好,更有效的结果。 Fusion分为集合融合和数据融合。 Fusion集合处理包含不相关数据的搜索引擎。然后根据数据源的内容和提供相关数据的可能性对数据源进行排名。然后将其记录在列表中。数据融合处理具有通用数据集索引的搜索引擎。将数据的初始等级与原始等级进行比较。使用诸如CombSum算法之类的技术应用规范化过程。

元搜索引擎的示例

  • Dogpile是由InfoSpace LLC开发的元搜索引擎。它回写来自Google和Yahoo的各个搜索引擎的结果。它结合了文本,图像,新内容等的搜索结果。
  • 相比之下,Sputtr是最好的元搜索引擎之一,它结合了来自各种流行的搜索引擎(例如Google,Yahoo,Bing,Ask.com,Twitter,Facebook,YouTube,LinkedIn,IMDb,Slashdot,Dictionary.com,About.com,纽约时报等
  • 另一个受欢迎的网站是Trivago,这是一家酒店预订网站,在其广告中提到了这一概念。它会返回来自其他100多个酒店预订网站的结果,包括Booking.com,Airbnb,Expedia,Trip.com和Agoda。可以在www.trivago.com上访问Trivago。

元搜索引擎的优势

  1. 元搜索引擎一次搜索所有搜索引擎,因此无需单独搜索。
  2. 作为非常易于使用的工具栏,可以轻松下载。
  3. 元搜索引擎中允许搜索白页和黄页。
  4. 元搜索引擎是免费的。它的服务类似于其他搜索引擎提供的服务。
  5. 用户可以根据自己的喜好自定义元搜索引擎。
  6. 结果提供的覆盖率数据比单个站点的结果包含更多的信息。
  7. 它允许用户在短时间内获得综合结果,从而省去了在单个站点中搜索结果的时间和精力,从而减少了用户的工作量。
  8. 如果获得概述或快速结果是动机,那么元搜索是一种更好的替代搜索方法。
  9. 元搜索引擎提供了一种从搜索中隐藏IP地址的方法。这为用户提供了很大的安全性。这就是法国政府为何将Qwant(元搜索引擎)用于其运营的原因。

元搜索引擎的缺点

  1. 元搜索引擎无法解析。
  2. 它不如Google和Yahoo搜索引擎之类的其他搜索流行。
  3. 元搜索引擎无法完全翻译查询语法。
  4. 它的可靠性可与其他搜索引擎媲美。
  5. 他们通常优先考虑链接的按点击付费类型,而不是更相关的搜索结果。
  6. 结果通常包含最多来自特定站点的10个链接,而没有包含来自主要站点的重要链接。
  7. 提供的超链接的数量受到限制,从而使搜索查询结果不完整。