本周学习内容
- 字符串基础
- 哈希
- KMP
- manecher
字符串基础
String类相关函数
eg.查找给定字符串(str)并把相应子串(src)替换为另一给定字符串(dest)
int str_replace(string &str, string &src,string &dest)
{
int counter = 0;
int pos = 0;
while ((pos = str.find(src, pos)) != string::npos) {
str.replace(pos, src.size(), dest);
++counter;
pos += dest.size();
}
return counter;//返回替换的次数
}
哈希
相当于函数中的映射,把字符串经过hash后变成一个值,不同字符串的hash值基本不会重合。
hash[i] = hash[i - 1] * base + (s[i] - ‘a’);
取字符串s[l,r]hash值:
hash[l,r]=f[r]-f[l-1]*p[r-l+1]。
void init(){
p[0]=1;
hash[0] = 0;
int n=strlen(s+1);
for(int i=1;i<=100000;i++)p[i]=p[i-1]*base;
for(int i=1;i<=n;i++)hash[i]=hash[i-1]*base+(s[i]-'a');
}
KMP
虽然看了一晚上博客,但我还是没理解,然后去某站随便找了个视频,发现新大陆(为什么播放量这么低 不合理!)(我不知道把视频放上来 有兴趣的可以搜up主id:代码随想录)先放个板子。代码来自KMP算法最浅显理解——一看就明白
虽然我并没有一看就明白…
void cal_next(char *str, int *next, int len)
{
next[0] = -1;//next[0]初始化为-1,-1表示不存在相同的最大前缀和最大后缀
int k = -1;//k初始化为-1
for (int q = 1; q <= len-1; q++)
{
while (k > -1 && str[k + 1] != str[q])//如果下一个不同,那么k就变成next[k],注意next[k]是小于k的,无论k取任何值。
{
k = next[k];//往前回溯
}
if (str[k + 1] == str[q])//如果相同,k++
{
k = k + 1;
}
next[q] = k;//这个是把算的k的值(就是相同的最大前缀和最大后缀长)赋给next[q]
}
}
int KMP(char *str, int slen, char *ptr, int plen)
{
int *next = new int[plen];
cal_next(ptr, next, plen);//计算next数组
int k = -1;
for (int i = 0; i < slen; i++)
{
while (k >-1&& ptr[k + 1] != str[i])//ptr和str不匹配,且k>-1(表示ptr和str有部分匹配)
k = next[k];//往前回溯
if (ptr[k + 1] == str[i])
k = k + 1;
if (k == plen-1)//说明k移动到ptr的最末端
{
//cout << "在位置" << i-plen+1<< endl;
//k = -1;//重新初始化,寻找下一个
//i = i - plen + 1;//i定位到该位置,外层for循环i++可以继续找下一个(这里默认存在两个匹配字符串可以部分重叠)
return i-plen+1;//返回相应的位置
}
}
return -1;
}
KMP算法主要用于解决字符串匹配的问题,例如求一个文本串中是否出现了模式串,如果用暴力,复杂度是O(m×n),容易TLE。KMP利用前缀表帮助找到前面已经匹配过的内容。
感觉最难理解的是next数组的理解,我的理解是next数组保存了第i位最长相等的前缀和后缀的长度。这里,前缀是包含首字母不包含尾字母的所有子串,后缀就是包含尾字母不包含首字母的所有子串。
例如aabaaf
对于a,匹配的长度为0
对于aa,匹配的长度为1
对于aab,匹配的长度为0
对于aaba,匹配的长度为1
对于aabaa,匹配的长度为2
对于aabaaf,匹配的长度为0
那么得到一个{0,1,0,1,2,0}的数组就是所需要的前缀表。
那么如何利用这个前缀表进行匹配呢?
假设文本串str为aabaabaaf
模式串ptr为aabaaf
一开始,用str[i]和ptr[i]比对,相等就继续下一轮匹配。在i=5(i从0开始)发现’b’和’f’不相同,此时找到’f’前面的子串的最长相等前后缀是多少,根据前缀表{0,1,0,1,2,0}可以得到长度为2,因为’aa’的后缀不匹配了,所以找到与其相等的前缀’aa’的后面继续开始匹配,也就是跳到下标为2的位置’b’继续匹配,也就是str[5]和ptr[2]开始继续匹配。
语言five不大会用文字说明,本来想用画图说明没想到还手残…只能这么描述一下了,将就看看叭。
manecher
来源:oschina
链接:https://my.oschina.net/u/4281474/blog/4712601