搜索引擎的概念
1、所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术。
2、搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。
搜索引擎的历史
第一代:分类目录时代,用户可以从这个分类目录里找到自己想要的东西,这就是搜索引擎第一代。
第二代:文本检索时代,搜索引擎查询信息的方法则是通过用户所输入的查询信息提交给服务器,服务器通过查阅,返回给用户一些相关程度高的信息。
第三代:整合分析时代,第三代搜索引擎的典型特征就是智慧整合第二代返回的信息为立体的界面,让用户能轻易地一眼进入到最相关的分类区域去获取信息。
第四代:用户中心时代,当客户输入查询的请求时候,同一个查询的请求关键词在用户的背后可能是不同查询要求。
第五代:生活生态圈搜索时代,物联网搜索拥有更广阔的搜索空间
搜索引擎的工作原理
1、首先在互联网中发现、搜集网页信息;同时对信息进行提取和组织建立索引库;
2、再由检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。