码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • ES 关于text和keyword两种类型数据搜索区别


    ElasticSearch 5.0以后,string类型有重大变更,移除了string类型,

    string字段被拆分成两种新的数据类型: text用于全文搜索的,而keyword用于关键词搜索。

     

     1、ES 关于text和keyword两种类型

    ElasticSearch字符串将默认被同时映射成text和keyword类型,将会自动创建下面的动态映射。

    通过 GET /dist_test/_mapping/field/weixin_number 命令查看 weixin_number 字段数据类型,可以看到 mapping 下除了 text 还有 keyword。两者有什么区别呢? 

    1. {
    2. "dist_test" : {
    3. "mappings" : {
    4. "weixin" : {
    5. "weixin_number" : {
    6. "full_name" : "weixin_number",
    7. "mapping" : {
    8. "weixin_number" : {
    9. "type" : "text",
    10. "fields" : {
    11. "keyword" : {
    12. "type" : "keyword",
    13. "ignore_above" : 256
    14. }
    15. }
    16. }
    17. }
    18. }
    19. }
    20. }
    21. }
    22. }

     1.1 text:

    1. 会分词,然后进行索引
    2. 支持模糊、精确查询
    3. 不支持聚合
    4. 分词器默认standard ,对于中文来说就是按字分词
    5. 支持fields属性,可以在fields中添加keyword子类型,以实现精确检索

    1.2 keyword:

    1. 不进行分词,直接索引
    2. 支持模糊、精确查询
    3. 支持聚合
    4. 支持按字数建立索引,以便节约索引空间
    5. 看下text分词规律。

    1.2.1、纯小写字符串

    1. GET /dist_test/_analyze
    2. {
    3. "field": "weixin_number",
    4. "text": "vicky1176320626"
    5. }

    1.2.2、包含大写字母字符串会全部转换为小写。

    1. GET /dist_test/_analyze
    2. {
    3. "field": "weixin_number",
    4. "text": "XP3412"
    5. }

    1.2.3、包含特殊符号,如空格、-,则会分词为多个字符串。

    1. GET /dist_test/_analyze
    2. {
    3. "field": "weixin_number",
    4. "text": "AAAA-95533"
    5. }

    这也是某些情况下,term 查询后查询不到数据的原因。解决方案也很简单,使用 keyword 精确查询即可。

    如例:针对Text类型的数据,要使用term查询

    1. {
    2. "from": 0,
    3. "size": 10,
    4. "query": {
    5. "bool": {
    6. "must": [
    7. {
    8. "term": {
    9. "city.keyword": {
    10. "value": "湖南省长沙市",
    11. "boost": 1
    12. }
    13. }
    14. }
    15. ],
    16. "adjust_pure_negative": true,
    17. "boost": 1
    18. }
    19. }
    20. }

  • 相关阅读:
    隆云通PM2.5+PM10+TSP传感器
    配置Linux系统协作代理:将多个代理服务器串联起来
    2024三掌柜赠书活动第十三期:API安全技术与实战
    递归概述与递归能解决的问题和规则 [数据结构][Java]
    PMP考试是如何提高项目管理能力的?
    skimage库的安装
    Redis相关知识
    单体、分布式、 微服务架构发展
    【分布式】分布式系统、Redis中间件 、Cache穿透、击穿、雪崩
    [发布] 一个测试 WebService 和数据库连接的工具 - DBTest v1.0
  • 原文地址:https://blog.csdn.net/yexiaomodemo/article/details/126941437
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号