字典树在多个单词匹配长句或者求单词的相似前缀时非常好用。
下面是他的结构:
字典树的每一条边就是一个字母,按照单词字母顺序给节点排序号。
这里用二维数组代表线段树的结构:\(tree[i][j]=k\)
\(i\)代表节点序号,\(j\)代表是上一个节点下面的哪个字母节点(\(a-z\)分为\(0-25\)),\(k\)代表下一个节点的序号。
如果要查找单词还需要一个is_end数组来记录保存哪些节点是末节点。
下面是字典树的插入节点函数:
void insert(string s,int node)//node从0开始 { for (int i = 0; s[i]; i++) { int num = s[i] - 'a'; if (trie[node][num] == 0) trie[node][num] = ++tot;//全部变量,让序号一直增长 node = trie[node][num];//获取下一个点的序号 } //is_end[node] = 1;//如果到了终点给下一个节点赋结束符 }
查找函数:
bool find(string s,int node)//找前缀或者找单词 { for (int i = 0; s[i] ; i++) { int num = s[i] - 'a'; if (trie[node][num] == 0) return 0; node = trie[node][num]; } //if (is_end(node))//查找单词的时候使用,判断是否是末节点就可以了 return 1; //else //return 0; }