信息检索的主要目的是在最短的时间内获得最满意的检索结果
布尔逻辑检索
逻辑
与
用AND
(或*
)表示逻辑
或
用OR
(或+
,或|
)表示逻辑“
非
“用NOT
(AND NOT
,BUT NOT
)(或-
)表示优先次序:逻辑“
非
“ > 逻辑”与
” > 逻辑”或
“,若有括号存在,则括号优先
邻近检索(位置限制检索)
是用一些特定的算符(位置算符)来表达检索词与检索词之间的顺序和词间距的检索
短语检索(精确检索)
使用
“ “
表示
截词检索
是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分(常见截词符:?、*、!)
字段限制检索
在信息检索的过程中,为了提高查全率和查准率,需要将检索范围限制在特定的字段中,如AB 代表文摘
括号检索
用于改变运算的先后次序,括号内的运算优先
自然语言检索(智能检索)
直接采用自然语言中的字、词、句进行提问式检索,同一般口语一样
多语种检索
提供多语种的检索环境供用户选择,系统按照用户选定的语种进行检索并反馈结果
模糊检索
是指使用某一检索词进行检索时,能同时对该词的同义词、近义词、上位词、下位词进行检索
区分大小写的检索
搜索工具认为用户指定了只要大写,就只会查找哪些与用户键入的输入形式完全相同的结果,如China,则只检索出China
全文检索技术
全文检索技术是将一个完整信息源的全部内容转化为计算机可以识别、处理的信息单元而形成的数据集合
特点:
- 信息量大,未经加工的详尽的、客观的原始信息;
- 信息检索的灵活性和适应性;
- 文本中任何字符或字符串都可以作为检索入口点,且能够处理结构化和非结构化等各类文本数据;
- 检索语言的天然性,支持使用自然语言进行检索;
- 数据相对稳定
缺点:查准率较低,检索结果过多,让用户较难甄别高价值信
多媒体信息检索技术
音频的检索方式:1)语音检索;2)音乐检索;3)音频检索
视频的检索方式:1)视频分割;2)关键帧提取;3)场景变换探测;4)故事情节重构
超文本及超媒体检索技术
把有关的信息或资源通过超链接联系起来,检索时可以借助超链接实现相关信息的阅读
智能信息检索技术
采用人工智能进行信息检索的技术(可进行语义处理)
可视化信息检索技术:
是将信息资源、用户提问、信息检索模型、检索过程以及检索结果中各种不可见的内部语义关系转换成图像,显示在一个二维、三维或多维的可视化空间中,帮助用户理解检索结果、把握检索方向,以提高信息检索的效率和性能。
跨语言信息检索技术
允许用户使用其熟悉的某一种语言来构造检索式,以此检索出另外一种或集中语言表达的信息。
跨语言信息检索技术实现的核心问题是“翻译”
文本聚类技术
聚类:在对应的特征空间的亲疏远近来决定其类别
自动聚类技术用来分析被聚类对象的特征,再根据一定的聚类算法将这些对象分成不同的簇
检索策略:是为实现检索目标而制定的全盘计划,是就一个问题检索或多个数据库输入的全部检索式的集合
了解所要查询的目的和要求
明确你进行信息检索的目的是什么,确定你希望获得什么样的信息。例如,你是在进行学术研究还是解决实际问题,你需要的是基础知识还是最新的研究成果。
确定检索问题的关键词
确定与你的查询问题相关的关键词或术语
确定涉及的学科或主题范围、地域范围、语种范围、资源的时间范围
这些限定条件将有助于缩小检索范围,提高检索结果的相关性。
确定需要的信息类别
明确你所需要的信息类别有助于针对性地选择合适的资源和数据库。
确定查询方式(浏览、分类检索、关键词检索)
你可以通过浏览资源的目录或索引、进行分类检索或使用关键词检索等方式来获取相关信息。
确定资源的性质(学术?大众化?)
有助于选择适合的信息源和数据库
选择关键词的建议:
OR
连接同义词、近义词、相关词或同一术语的不同表达方式
OR
连接,以扩大检索范围。“ ”
进行精确检索
OR
将这些词语连接起来形成子检索式。积木型检索式
”。下面是一个关于积木型检索式
的简单应用:
假设我们想要查找关于高血压(hypertension)和心血管疾病(cardiovascular disease)之间的关联的学术文献。我们可以使用以下的"积木型检索式"来进行构造检索式:
(高血压 OR hypertension) AND (心血管疾病 OR cardiovascular disease)
OR
”:
AND
” 连接最不重要的检索词:
AND
” 连接,而辅助词或次要关键词可以不使用 “AND
”,以避免过于严格的检索限制。NOT
”,取消某些限制:
OR
” 连接更多的关键词:
NOT
” 把不需要查找的关键词排除在检索结果之外:
输出方式
显示、复制、打印、下载、Email发送、输入到参考文献管理软件或个人信息管理软件
输出形式
目录、题录、文摘、全文或自定义形式、选择性输出