活动地址:CSDN21天学习挑战赛
随机变量是随机取得不同值的变量。
比如,骰子有六个面,分别是1到6, 即[1,6]是随机变量x的取值;硬币的正反面,明天的天气,这些事离散的随机变量,
可以认为是变量+不确定值是什么+确定可能的值是什么(不然怎么求期望)
概率分布是描述随机变量取得不同值的可能性。
随机变量有离散和连续两种,对应着两种概率分布。
离散型随机变量的概率分布用概率质量函数(probability mass function, PMF)来描述。不同的随机变量有不同的概率质量函数,用$ x \sim p(x) $, 即需要知道x的不同取值对应的可能性,所有可能性的和为1,即
∑
P
(
x
=
k
)
\sum{P(x=k)}
∑P(x=k).如二项分布, $x \sim b(n,p) 或 X \sim B(n,p) $,所有可能性之和
∑
P
(
x
=
k
)
=
∑
k
n
(
k
n
)
p
k
⋅
(
1
−
p
)
n
−
k
\sum{P(x=k)} =\sum^n_k (kn)
连续型随机变量的概率分布用概率密度函数(probability density function, PDF)来描述。即 p ( x ) p(x) p(x),满足:
联合分布率,(joint distribution function)亦称多维分布函数:是多个随机变量(全集)的概率分布,如二元函数, P ( x , y ) P(x,y) P(x,y)
边缘分布:某个子集的分布。
离散型随机变量的边缘分布:
∀
x
∈
X
,
P
(
X
=
x
)
=
∑
y
P
(
X
=
x
,
Y
=
y
)
\forall x\in X, P(X=x)=\sum_y P(X=x, Y=y)
∀x∈X,P(X=x)=y∑P(X=x,Y=y)
连续型随机变量的边缘分布:
p
(
x
)
=
∫
p
(
x
,
y
)
d
y
p(x)=\int p(x,y)dy
p(x)=∫p(x,y)dy
离散用求和,连续用积分。
基础表达式:
P
(
Y
=
y
∣
X
=
x
)
=
P
(
Y
=
y
,
X
=
x
)
P
(
X
=
x
)
P(Y=y|X=x)=\frac{P(Y=y,X=x)}{P(X=x)}
P(Y=y∣X=x)=P(X=x)P(Y=y,X=x)
链式表达式,也成为乘法法则:
P
(
x
(
1
)
,
.
.
.
,
x
(
n
)
)
=
P
(
x
(
1
)
)
⨿
i
=
2
n
P
(
x
(
i
)
∣
x
(
1
)
,
.
.
.
,
x
(
n
)
)
P(x^{(1)},...,x^{(n)})=P(x^{(1)})\amalg ^n_{i=2}P(x^{(i)}|x^{(1)},...,x^{(n)})
P(x(1),...,x(n))=P(x(1))⨿i=2nP(x(i)∣x(1),...,x(n))
常用:
P
(
Y
=
y
,
X
=
x
)
=
P
(
X
=
x
)
P
(
Y
=
y
∣
X
=
x
)
P(Y=y,X=x)=P(X=x)P(Y=y|X=x)
P(Y=y,X=x)=P(X=x)P(Y=y∣X=x)
P
(
Z
=
z
,
Y
=
y
,
X
=
x
)
=
P
(
X
=
x
)
P
(
Y
=
y
∣
X
=
x
)
P
(
Z
=
z
∣
Y
=
y
,
X
=
x
)
P(Z=z,Y=y,X=x)=P(X=x)P(Y=y|X=x)P(Z=z|Y=y,X=x)
P(Z=z,Y=y,X=x)=P(X=x)P(Y=y∣X=x)P(Z=z∣Y=y,X=x)
函数
f
(
x
)
f(x)
f(x)关于分布
P
(
x
)
P(x)
P(x)的期望为
离散:
E
x
∼
P
[
f
(
x
)
]
=
∑
x
P
(
x
)
f
(
x
)
\mathbb{E} _{x\sim P}[f(x)]=\sum_x P(x)f(x)
Ex∼P[f(x)]=∑xP(x)f(x)
连续:
E
x
∼
P
[
f
(
x
)
]
=
∫
P
(
x
)
f
(
x
)
d
x
\mathbb{E} _{x\sim P}[f(x)]=\int P(x)f(x)dx
Ex∼P[f(x)]=∫P(x)f(x)dx
V a r ( f ( x ) ) = E [ ( f ( x ) − E [ f ( x ) ] ) 2 ] Var(f(x))=\mathbb{E}[(f(x)-\mathbb{E}[f(x)])^2] Var(f(x))=E[(f(x)−E[f(x)])2]
C o v ( f , g ) = E [ ( f − E [ f ] ) ( g − E ( g ) ) ] Cov(f,g)=\mathbb{E}[(f-\mathbb{E}[f])(g-\mathbb{E}(g))] Cov(f,g)=E[(f−E[f])(g−E(g))]
协方差矩阵: n × n n\times n n×n 矩阵, C o v ( X i , j ) = C o v ( x i , y i ) Cov( \mathrm {X} _{i,j})=Cov(x_i,y_i) Cov(Xi,j)=Cov(xi,yi), 矩阵的对角元是方差。
也称为正态分布(Normal distribution)。
其概率密度函数为:
N
(
μ
,
σ
2
)
=
1
2
π
σ
2
e
x
p
(
−
1
2
σ
2
(
x
−
μ
)
2
)
N(\mu,\sigma^2)=\sqrt{\frac{1}{2 \pi \sigma^2}} exp(-\frac{1}{2\sigma^2}(x-\mu)^2)
N(μ,σ2)=2πσ21exp(−2σ21(x−μ)2)
P
(
λ
)
=
{
λ
e
λ
x
,
i
f
x
>
0
0
,
i
f
x
≤
0
P(\lambda)={λeλx,ifx>00,ifx≤0
P ( μ , λ ) = 1 2 λ e − ∣ x − μ ∣ λ P(\mu,\lambda)=\frac{1}{2\lambda}e^{-\frac{|x-\mu|}{\lambda}} P(μ,λ)=2λ1e−λ∣x−μ∣
刻画 Laplace分布和正态分布:
import matplotlib.pyplot as plt
import numpy as np
import math
pi=math.pi
def laplace_function(x, lamb):
return (1/(2*lamb)) * np.e**(-1*(np.abs(x)/lamb))
def norm_function(x, mu,sigma):
return math.sqrt(1/(2*pi*sigma**2))*math.exp(-(x-mu)**2/(2*sigma^2))
x = np.linspace(-5,5,10000)
l1 = [laplace_function(_,1) for _ in x]
l2 = [laplace_function(_,0.5) for _ in x]
n1 = [norm_function(_,1,5) for _ in x]
n2 = [norm_function(_,-1,3) for _ in x]
plt.plot(x, l1, color='r', label="laplace:1")
plt.plot(x, l2, color='g', label="laplace:0.5")
plt.plot(x, n1, color='b', label="norm:(1,5)")
plt.plot(x, n2, color='y', label="norm:(-1,3)")
plt.title("probability density function")
plt.legend()
plt.show()
P ( x ∣ y ) = P ( x ) P ( y ∣ x ) P ( y ) P(x|y)=\frac{P(x)P(y|x)}{P(y)} P(x∣y)=P(y)P(x)P(y∣x)