浅谈搜索引擎(一)
搜索引擎,平日里都有接触到,想=像谷歌、百度、搜狗等等,都属于搜索引擎的一种。但是从来没有系统地学习过搜索引擎,今天是第一次接触到搜索引擎系列的课程,由于疫情的影响,被迫只能上网课了。 大声逼逼:武汉加油!中国加油 大声逼逼:武汉加油!中国加油 大声逼逼:武汉加油!中国加油 在学习搜索引擎之前,我们需要知道,什么是搜索引擎?百度百科给出的解释是: 所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反 馈给用户的一门检索技术。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、 网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相 关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可 添加其他一系列辅助模块,以为用户创造更好的网络使用环境。 至于为什么要有搜索引擎,我就不一一赘述了。 什么是信息? 从客观上看,信息是一切事物存在方式和运动规律的表征。 从主观上看,信息是指人们对世界的认识所形成的各种只是、学问、消息。 数据和信息有什么区别? 数据和信息之间是相互联系的。数据是反映客观事物属性的记录,是信息的具体表现形式。数据经过加工处理之后,就成为信息;而信息需要经过数字化转变成数据才能存储和传输。 从信息论的观点来看,描述信源的数据是信息和数据冗余之和,即:数据=信息+数据冗余。