Trie 是一种能够快速插入和查询字符串的多叉树结构。、
节点的编号各不相同,根节点编号为0,其他节点用来标识路径,还可以标记单词的插入次数,边表示字符。
tire 维护字符串的集合,支持两种操作:
1. 向集合中插入一个字符串
2. 在集合中查询一个字符串
儿子数组 son[p][26] : 存储从节点p沿着j这条边走到的子节点。边为26个小写字母(a~z)对应的映射值0~25,每个节点最多可以有26个分叉。
计数数组 cnt[p] : 存储以节点p结尾的单词的插入次数
节点编号 idx : 用来给节点编号
1. 空 trie 仅有一个根节点,编号为0
2. 从根开始插,枚举字符串的每个字符
如果有儿子,则p指针走到儿子
如果没有儿子,则 先创建儿子,p指针再走到儿子
3. 在单词结束点记录插入次数
- int son[N][26], cnt[N], idx;
- // 0号点既是根节点,又是空节点
- // son[][]存储树中每个节点的子节点
- // cnt[]存储以每个节点结尾的单词数量
-
- // 插入一个字符串
- void insert(char *str)
- {
- int p = 0;
- for (int i = 0; str[i]; i ++ )
- {
- int u = str[i] - 'a';
- if (!son[p][u]) son[p][u] = ++ idx;
- p = son[p][u];
- }
- cnt[p] ++ ;
- }
-
- // 查询字符串出现的次数
- int query(char *str)
- {
- int p = 0;
- for (int i = 0; str[i]; i ++ )
- {
- int u = str[i] - 'a';
- if (!son[p][u]) return 0;
- p = son[p][u];
- }
- return cnt[p];
- }
例题:(835. Trie字符串统计 - AcWing题库)
题目:
维护一个字符串集合,支持两种操作:
I x
向集合中插入一个字符串 x;Q x
询问一个字符串在集合中出现了多少次。共有 N 个操作,所有输入的字符串总长度不超过 105105,字符串仅包含小写英文字母。
第一行包含整数 N,表示操作数。
接下来 N 行,每行包含一个操作指令,指令为 I x
或 Q x
中的一种。
对于每个询问指令 Q x
,都要输出一个整数作为结果,表示 x 在集合中出现的次数。
每个结果占一行。
- 5
- I abc
- Q abc
- Q ab
- I ab
- Q ab
- 1
- 0
- 1
代码:
- #include
- #include
- #include
- #include
- #include
- #include
- #include
- #include
- #include
- #include
-
- const int N = 1e5 + 10;
- using namespace std;
- typedef pair<int ,int> PII;
- int son[N][26],cnt[N],idx;
- char str[N];
- void insert(char str[]){
- int p = 0;
- for(int i = 0;str[i];i ++){
- int u = str[i] - 'a';
- if(!son[p][u])
- son[p][u] = ++idx;
- p = son[p][u];
- }
- cnt[p] ++;
- }
- int query(char str[]){
- int p = 0;
- for(int i = 0;str[i];i ++){
- int u = str[i] - 'a';
- if(!son[p][u]) return 0;
- p = son[p][u];
- }
- return cnt[p];
- }
- int main(){
- int n;
- cin >> n;
- while(n --){
- char op[2];
- scanf("%s%s",op,str);
- if(op[0] == 'I')
- insert(str);
- else printf("%d\n",query(str));
- }
- return 0;
- }