1、爬取 搜索引擎蜘蛛(spider)通过链接访问网页,然后把抓取网页的内容存取到数据库中。 2、预处理 搜索引擎对抓取到的网页进行,索引,分词,内容处理,链接关系计算等处理。 3、排名 最后根据用户搜索的关键词,调用索引库的内容,计算相关性,生成相关页。 来源:https://www.cnblogs.com/wbly2019/p/11416114.html 标签 搜索引擎 网页抓取 索引