基于 Serverless 快速实现简单版查询工具(文本相似度)
需求背景 朋友的单位,有一个小型的图书室,图书室中摆放了很多的书,每本书都被编号放在对应的区域,为了让大家更快,更容易找到这些书,他联系我,让我帮他弄一个图书查询系统。可以通过用户输入,模糊匹配到对应的结果,并且提供书籍对应的地点。 功能设计 让朋友把书籍整理并存储到一个Excel表格中; 将Excel表放到对象存储中,云函数读取这个文件,并且解析; 根据词语的相似寻找相似的图书; 前端页面通过MUI制作,放在对象存储中,并且使用对象存储的Website功能; 整体实现 数据形态 Excel样式主要包括书名和编号,同时下面包括分类的tab: 基于函数的搜索功能 核心代码实现: import jieba import openpyxl from gensim import corpora, models, similarities from collections import defaultdict import urllib.request with open("/tmp/book.xlsx", "wb") as f: f.write( urllib.request.urlopen("https://********").read() ) top_str = "abcdefghijklmn" book_dict = {} book_list = [] wb = openpyxl