• fail树(失配树)


    fail树是由KMP算法引申出来的概念,在解释fail树之前,首先要讲一个概念:Border。

    Border的定义和性质

    1. 定义:对于字符串S,用|S|表示其长度。那么S串的一个Border就是S的某个前缀(S串本身不算),这个前缀能和后缀匹配。举个例子,abcdabc的一个Border是abc。一个字符串的Border可能有多个。
    2. 性质1:对于任意一个字符串S,一个Border的长度就对应一个Border(比如abcdabc的长度为3的Border当然就只能是abc)。并且,假设S长度记为n,则S的所有Border的长度分别为:ne[n], ne[ne[n]], ne[ne[ne[n]]].......直到值为0的不算。并且这个序列的值从左往右递减(根据kmp的性质容易得出)
    3. 性质2:根据上面的结论,我们可以知道,对一个字符串S求解next数组之后,我们就知道了S所有前缀(包括S自身)的所有Border了。

    接下来就可以讲fail树了,这里先不讲引入fail树的原因,先说fail树是个啥。 

    Fail树

    1. fail树是由所有 ne[i] -> i 的单向边构成的树,也就是说,这棵树的结构是底部指向顶部,最终汇聚到root点。
    2. 性质:结合前面Border的结论,在fail树上,一个结点x不断向上寻找祖先的过程,就是遍历字符串S[1,x]的所有Border长度的过程,又因为Border的长度和Border一一对应,所以fail树上就记录着字符串S所有前缀的Border。

     根据前面所说,我们就能推出以下结论,S的两个前缀S[1,p]和S[1,q]的公共最长Border长度,就是lca(ne[p], ne[q])。而这道模板题就是要用到这个基础结论:【模板】失配树 - 洛谷

    代码如下:

    1. #include
    2. using namespace std;
    3. #define FOR(i, a, b) for (int i = (a); i <= (b); i++)
    4. // #define int long long
    5. #define pii pair
    6. const int N = 1e6+5, mod=1e9+7;
    7. char s[N]; int n,m;
    8. int ne[21][N], d[N];
    9. int lg[N];
    10. int lca(int x,int y){
    11. if(d[x] < d[y]) swap(x,y);
    12. while(d[x] > d[y]) x = ne[lg[d[x]-d[y]]][x];
    13. if(x==y) return y;
    14. for(int k=lg[d[x]]; k>=0; k--){
    15. if(ne[k][x] != ne[k][y]){x=ne[k][x]; y=ne[k][y];}
    16. }
    17. return ne[0][x];
    18. }
    19. void solve(){
    20. cin>>(s+1); n=strlen(s+1);
    21. //init of lg[]
    22. FOR(i,2,n) lg[i]=lg[i>>1]+1;
    23. //get_ne
    24. for(int i=2,j=0; i<=n; i++){
    25. while(j && s[i]!=s[j+1]) j=ne[0][j];
    26. if(s[i]==s[j+1]) j++;
    27. ne[0][i] = j, d[i]=d[j]+1; //记录next和深度d
    28. }
    29. //预处理倍增跳
    30. FOR(j,1,20) FOR(i,1,n)
    31. ne[j][i] = ne[j-1][ne[j-1][i]];
    32. //处理询问
    33. cin>>m;
    34. FOR(i,1,m){
    35. int x,y; cin>>x>>y;
    36. cout<<lca(ne[0][x], ne[0][y])<<'\n';
    37. }
    38. }
    39. signed main(){
    40. ios::sync_with_stdio(false), cin.tie(0), cout.tie(0);
    41. int T=1;
    42. while(T--) solve();
    43. }

    再补充一道fail树的应用题:[NOI2014] 动物园 - 洛谷 

    大致题意是要求字符串S所有前缀 S[1,x]  (1xn)的长度不大于x/2的Border数量。

    我们这样考虑问题:如果没有长度不大于x/2的要求,那就很简单,求一个点的祖先数量就行,很容易预处理。而加上这个条件之后,根据fail树数字大小的单调性(ne[x]<x),我们也能知道,符合条件的祖先是“上面的连续一段”。所以我们依然可以直接预处理每个点的祖先数量(其实就是深度),然后不断跳fail,直到找到第一个长度不大于x/2的,它的祖先数量就是当前的答案。

    这个思路没错,但是复杂度不ok,因为暴力跳fail是O(n)的,再算上n次询问,总复杂度O(n^2),过不了。所以把暴力跳fail改成倍增跳,优化成O(nlogn)就能过了。

    代码如下:

    1. #include
    2. using namespace std;
    3. #define FOR(i, a, b) for (int i = (a); i <= (b); i++)
    4. // #define int long long
    5. #define pii pair
    6. const int N = 1e6+5, mod=1e9+7;
    7. char s[N]; int n;
    8. int ne[21][N], num[N];
    9. void solve(){
    10. //init
    11. memset(num,0,sizeof(num));
    12. num[1] = 1;
    13. //input
    14. cin>>(s+1); n=strlen(s+1);
    15. //get_ne
    16. for(int i=2,j=0; i<=n; i++){
    17. while(j && s[i]!=s[j+1]) j=ne[0][j];
    18. if(s[i]==s[j+1]) j++;
    19. ne[0][i] = j;
    20. num[i] = num[j]+1;
    21. }
    22. //预处理倍增跳
    23. FOR(j,1,20) FOR(i,1,n)
    24. ne[j][i] = ne[j-1][ne[j-1][i]];
    25. //跳fail到合适位置,取出答案
    26. long long ans = 1;
    27. FOR(i,1,n){
    28. int tt = ne[0][i];
    29. for(int j=20; j>=0; j--)
    30. if((ne[j][tt]<<1) > i) tt=ne[j][tt];
    31. // if((ne[tt][j]<<1) > i) tt=ne[tt][j];
    32. if((tt<<1) > i) tt = ne[0][tt];
    33. ans = (ans*(num[tt]+1))%mod;
    34. }
    35. cout<'\n';
    36. }
    37. signed main(){
    38. ios::sync_with_stdio(false), cin.tie(0), cout.tie(0);
    39. int T=1; cin>>T;
    40. while(T--) solve();
    41. }

  • 相关阅读:
    Camera | 5.Linux v4l2架构(基于rk3568)
    一定要看的前端codeReview规范指南
    Java8的Stream用法
    Anaconda 踩过的一些坑
    Android三种数据存储的方式
    元宇宙的八大典型应用场景
    # 从浅入深 学习 SpringCloud 微服务架构(三)注册中心 Eureka(3)
    开发 Java 用小而美的框架,Solon v1.9.4 发布
    PeopleCode中Date函数的用法
    【python】程序员最浪漫的表白方式,将情书写在她的照片里
  • 原文地址:https://blog.csdn.net/bunny_1024/article/details/126294431