码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 数据分析知识点搜集(纯粹的搜集)


    数据分析+统计的知识点

    • A/B Testing
    • 产品迭代流程
    • 棣莫弗—拉普拉斯中心极限定理
    • 中心 极限定理
    • 幂律分布
    • 指标的统计属性
    • 假设检验
    • T检验和Z检验
    • 第一类错误 a
    • 第二类错误 b
    • 把握度power
    • P值

    A/B Testing

    A/B 测试是促进业务持续增长的最实用、最有效的方式。
    主要是实验组和对照组的对比,观察(A/B差别的显著性)是否符合统计上的显著和业务上的显著。

    产品迭代流程

    产品 / 业务迭代的流程大概分为 3 步:

    1. 具体的业务问题催生出迭代的想法,比如出现业务问题后,团队会提出具体的迭代方案;
    2. 团队论证方案的可行性和效果;
    3. 论证完成后,具体实施迭代方案。

    棣莫弗—拉普拉斯中心极限定理

    棣莫弗—拉普拉斯中心极限定理(De Moivre-Laplace),即二项分布以正态分布为其极限分布定律。

    中心 极限定理

    不管是什么概率分布,只要样本数据量足够大,样本 统计量近似服从 正态分布

    中心极限定理在A/B测试中的应用

    中心极限定理是概率论中最重要的一类定理,它支撑着和置信区间相关的T检验和假设检验的计算公式和相关理论。如果没有这个定理,之后的推导公式都是不成立的。

    事实上,以上对于中心极限定理的两种解读,在不同的场景下都可以对A/B测试的指标置信区间判定起到一定作用。

    • 对于属于正态分布的指标数据,我们可以很快捷地对它进行下一步假设检验,并推算出对应的置信区间;
    • 而对于那些不属于正态分布的数据,根据中心极限定理,在样本容量很大(>30)时,总体参数的抽样分布是趋向于正态分布的,最终都可以依据正态分布的检验公式对它进行下一步分析。

    幂律分布

    统计物理学家习惯于把服从幂律分布的现象称为无标度现象,即,系统中个体的尺度相差悬殊,缺乏一个优选的规模。可以说,凡有生命的地方,有进化,有竞争的地方都会出现不同程度的无标度现象。

    这里是引用

    指标的统计属性

    • 均值类的指标,比如用户的平均使用时长、平均购买金额、平均购买频率,等等。
    • 概率类的指标,比如用户点击的概率(点击率)、转化的概率(转化率)、购买的概率(购买率),等等。

    在数量足够大时,均值类指标服从正态分布;概率类指标本质上服从二项分布,但当数量足够大时,也服从正态分布。

    假设检验

    Null Hypothesis
    Alternative Hypothesis

    • 零假设是,实验组和对照组的点击率是相同的。
    • 备择假设是,实验组和对照组的点击率是不同的。

    在 A/B 测试的实践中,更推荐使用双尾检验。

    T检验和Z检验

    根本是,方差是否知道。
    不知道,就用样本反差估计总体方差,然后用t检验,但是在现在的大数据时代,基本上只要样本量>30就可以认为Z和T检验是一样的。

    在这里插入图片描述

    第一类错误 a

    假阳性概率
    误诊

    第二类错误 b

    假阴性概率
    漏诊

    把握度power

    1-b = 不漏的概率

    P值

    当零假设成立,观测到对照组和实验组不同的概率。

  • 相关阅读:
    Linux下C/C++编程开发(一)GCC
    基于JavaSwing开发电子琴程序(简约版)(小作业) 课程设计 大作业源码
    [Database] MySQL 5.7+ JSON 字段的使用的处理
    A Survey on Explainable Artificial Intelligence (XAI): Toward Medical XAI学习笔记
    Netty之I/O模型
    Spring Boot 常用注解汇总
    range方法在Python2和Python3中的不同​​​​​​​
    数据结构(7-2广度~~7-15)所有代码
    计算机毕业设计ssm基于SSM的社区疫情防控管理信息系统的设计与实现khjit系统+程序+源码+lw+远程部署
    华为录屏全攻略,从入门到高手
  • 原文地址:https://blog.csdn.net/weixin_43702920/article/details/126105035
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号