码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • C/C++小型文本查询引擎


    C/C++小型文本查询引擎

    小型文本查询引擎的设计与实现
    实验要求:
    (1)构造二叉查找树
    ① 从文件中读入内容,过滤掉阿拉伯数字和标点符号,并将英文字母的大写形式
    全部转换成小写形式。
    ② 按照英文字母表的顺序构造英文单词的二叉查找树。当两个英文单词的首字母
    相同时,按第二个字母进行排序,依次类推。
    ③ 为每个英文单词建立一个单链表,用于存放该单词在文档中的位置信息(即:
    该单词是文档的第几个单词,序号从1开始)。如果一个单词在文档中出现多次,则该链表中将包含多个结点,并按照单词在文档中出现的次序(位置信息)递增排序。
    (2)遍历二叉查找树
    ① 实现二叉查找树的先序遍历,以便能够找出出现次数最多的单词;
    ② 查询:输入一个待检索单词,以先序遍历的方式从二叉查找树中查找单词,如
    果能找到该单词,则输出该单词在原始文档中出现的位置信息,否则提示文档中不包含该检索词;
    ③ 实现二叉查找树的中序遍历,并将遍历结果保存到文件中(words.txt)。(要求:
    每个单词占一行,每行依次记录单词、该单词出现的次数、以及该单词在文档中的位置信息。)
    (3)删除结点
    ① 给定一个停用词列表(停用词是指对查询没有作用的词,如:of, and, a, an, the
    等等),将二叉查找树中的属于停用词表中的单词依次删除(不仅删除结点,还需清空记录该单词位置信息的单链表);
    ② 在查询时,当输入的查询词是停用词时,则不进行查询。
    (4)多关键词查询
    ① 允许一次输入两个或者更多个单词进行查询,即:先获得这些单词各自在文档中出现的位置信息,然后再分析这些单词的位置信息,判断这些单词在原始文档中是否存在连续出现的情况。
    ② 在查询时,当输入的查询词包含停用词时,先去除停用词,再进行查询。

    源码传送门

    传送门:https://pan.baidu.com/s/1JJs9vbZahUCB6cQvXLgAVg?pwd=1111

  • 相关阅读:
    MyBatisPlus-代码生成器原理及实现
    利用Nginx正向代理实现局域网电脑访问外网
    ADB 命令结合 Monkey 的使用
    【我的Android进阶之旅】在Android中使用MediaPipe库在实时视频源上实现人脸网格Face Mesh的绘制
    网络基础 【发展、协议、传输、地址】
    Android:多进程的开启方式、注意点以及如何解决。
    Jmeter(三十一):制造大批量的用户数据数据
    (原创)Lottie动画使用介绍
    OWASP Top 10漏洞解析(2)- A2:Cryptographic Failures 加密机制失效
    CentOS 7 mysql 安装以及常用语句(select、update、alter、rename、drop等)速查
  • 原文地址:https://blog.csdn.net/qq_35960743/article/details/128050164
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号