码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Redis(11)Hyperloglog


    1 什么是基数?

    A {1,3,5,7,8,7} B{1,3,5,7,8} 基数(不重复的元素) = 5,可以接受误差!

    2 简介

    Redis 2.8.9 版本就更新了 Hyperloglog 数据结构! Redis Hyperloglog 基数统计的算法!

    优点:占用的内存是固定,2^64 不同的元素的基数,只需要废 12KB内存!如果要从内存角度来比较的 话 Hyperloglog 首选!

    网页的 UV (一个人访问一个网站多次,但是还是算作一个人!)

    传统的方式, set 保存用户的id,然后就可以统计 set 中的元素数量作为标准判断 ! 这个方式如果保存大量的用户id,就会比较麻烦!我们的目的是为了计数,而不是保存用户id; 0.81% 错误率! 统计UV任务,可以忽略不计的!

    3 测试使用

    127.0.0.1:6379> PFadd mykey a b c d e f g h i j   # 创建第一组元素 mykey
    (integer) 1
    127.0.0.1:6379> PFCOUNT mykey  # 统计 mykey 元素的基数数量
    (integer) 10
    127.0.0.1:6379> PFadd mykey2 i j z x c v b n m   # 创建第二组元素 mykey2
    (integer) 1
    127.0.0.1:6379> PFCOUNT mykey2
    (integer) 9
    127.0.0.1:6379> PFMERGE mykey3 mykey mykey2  # 合并两组 mykey mykey2 => mykey3 并集 
    OK
    127.0.0.1:6379> PFCOUNT mykey3  # 看并集的数量!
    (integer) 15

    如果允许容错,那么一定可以使用 Hyperloglog ! 如果不允许容错,就使用 set 或者自己的数据类型即可

  • 相关阅读:
    描述符——设备描述符
    function—— Verilog的函数
    SpringBoot 文件操作 整合思路
    1,2-二苯基-1,2-二(4-羧基苯)乙烯 ;CAS: 1609575-40-7
    【深圳大学算法设计与分析】 实验六 最大流应用问题 FF -> EK -> Dinic
    技术改变了什么?
    Python中使用MySQL模糊查询的方法
    Apache Iceberg 是什么?
    在linux上部署一个web项目的小经验
    C/C++-内存
  • 原文地址:https://blog.csdn.net/weixin_48560325/article/details/126457840
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号