C++中提供子串查询的函数可以使用std::string类的相关方法来实现。
find函数:可以查找一个子串在原字符串中的第一个出现位置。它返回子串的起始索引,如果找不到则返回std::string::npos。substr函数:可以提取原字符串中的一个子串,根据起始位置和长度来确定子串的范围。compare函数:可以比较两个字符串是否相等或者大小关系
- #include
- const int N=1e5+10;
- signed main()
- {
- std::string s1="hello world";
- std::string s2="hello";
-
- //find函数
- if(s1.find(s2)!=std::string::npos)//如果是子串
- {
- std::cout<<"yes"<<'\n';
- }else{
- std::cout<<"no"<<'\n';
- }
-
- //substr提取子串
- std::string s3=s1.substr(0,5);
- std::cout<
'\n'; -
- //比较字符串大小关系
-
- if(s1.compare(s3)==0) // 字符串相等
- {
- std::cout<<"equl"<<'\n';
-
- }else if(s1.compare(s3)<0){// str1小于str2
-
- std::cout<<"s1 is less than s3"<<'\n';
-
- }else{ // str1大于str2
- std::cout<<"s3 is less than s1"<<'\n';
- }
- return 0;
- }
find函数的时间复杂度取决于字符串的长度和待查找的子串的长度。在C++标准库中,std::string的find函数使用的是一种称为"Boyer-Moore-Horspool"算法的快速字符串搜索算法。在最坏情况下,算法的时间复杂度为O(mn),其中n是字符串的长度,m是待查找的子串的长度。这种情况发生在待查找的子串中的每个字符都与字符串进行了比较,但最终没有匹配成功。
时间复杂度是不如KMP的
KMP算法是对暴力算法的优化
在暴力算法中我们定义两个指针i,j从0开始,
如果s[i]==x[j],则i++,j++
否则j=0(将子串移到开头,重新比较)
KMP算法则是在s[i]!=x[j]的情况下进行优化,如果不相等不将j移到0,而是根据预处理的结果来确定。
比如:
s BBC ABCDAB ABCDABCDABDE
x ABCDABD

比如到这一步时,x[j]!=s[i]
这是暴力做法:

这是KMP算法:

我们利用了ABCDAB中 后面的AB等于前面AB这一信息。
字符串头部和尾部会有重复。比如,"ABCDAB"之中有两个"AB"。我们需要学的就是如何利用这一信息。
n e [ i ] = j 的定义是p [ 1 , j ] = p [ i - j + 1 , i ]
对ne数组求解时,要牢抓定义
ne【1】=0,因此i从2开始计算,j从0开始,记录前后缀相等的最大长度
字符串匹配的KMP算法 - 阮一峰的网络日志 (ruanyifeng.com)
如果p【i】==p【j+1】,那么j++
否则j一直往前找,直到p【i】==p【j+1】
最后p【i】==p【j+1】,ne【i】=j
- #include
- using namespace std;
- const int N=1e6+10;
- char p[N],s[N];
- int m,n;
- int ne[N];
-
- signed main()
- {
- cin>>n>>p+1>>m>>s+1;
-
- for(int i=2,j=0;i<=n;i++)
- {
- while(j&&p[i]!=p[j+1]) j=ne[j];
- if(p[i]==p[j+1]) j++;
- ne[i]=j;
- }
-
- for(int i=1,j=0;i<=m;i++)
- {
- while(j&&s[i]!=p[j+1]) j=ne[j];
- if(s[i]==p[j+1]) j++;
- if(j==n)
- {
- std::cout<
" "; - j=ne[j];
- }
- }
-
- return 0;
- }
AcWing 841. 字符串哈希 【公式助理解】 - AcWing

- #include
- typedef unsigned long long ULL;
- const int N=1e5+10,P=131;
- char str[N];
- int p[N],h[N];
-
- ULL get(int l,int r)
- {
- return h[r]-h[l-1]*p[r-l+1];
- }
- signed main()
- {
- int n,m;
- std::cin>>n>>m>>str+1;
- p[0]=1;
- for(int i=1;i<=n;i++)
- {
- p[i]=p[i-1]*P;
- h[i]=h[i-1]*P+str[i];
- }
- while(m--)
- {
- int l1,r1,l2,r2;
- std::cin>>l1>>r1>>l2>>r2;
- if(get(l1,r1)==get(l2,r2)) std::cout<<"Yes"<<'\n';
- else std::cout<<"No"<<'\n';
- }
- return 0;
- }