连续型随机变量(基础阶段讨论)
奇异型随机变量
和离散型随机变量不同,连续型随机变量可以充满某个区间
分布律的形式无法描述这类随机变量的取值的统计规律性
为了统一研究各种类型的随机变量,引入分布函数的概念
设 X 是一个随机变量 , x 是任意实数 设X是一个随机变量,x是任意实数 设X是一个随机变量,x是任意实数
任何随机变量X都有分布函数
函数F(x)成为某个随机变量X的分布函数的条件:
值域:
极限:
lim x → − ∞ F ( x ) = 0 \lim\limits_{x\to -\infin}F(x)=0 x→−∞limF(x)=0
lim x → + ∞ F ( x ) = 1 \lim\limits_{x\to +\infin}F(x)=1 x→+∞limF(x)=1
单调性:
F ( x ) 是右连续的 F(x)是右连续的 F(x)是右连续的
🎈即,如果 x 在 x = k x在x=k x在x=k处的某个邻域 U = U ( k , δ ) U={U}(k,\delta) U=U(k,δ) 有定义,存在右极限
lim x → k + F ( x ) = F ( k ) \lim_{x\to k^+}F(x)=F(k) \\ x→k+limF(x)=F(k)
比如: F ( x + 0 ) = F ( x ) F(x+0)=F(x) F(x+0)=F(x)
例如:
F
(
x
)
=
{
0
,
x
⩽
0
A
x
2
+
B
,
0
<
x
⩽
1
1
x
>
1
F(x)=
上面这个分布函数的分段定义涵盖了实数区间R
利用右连续性求解A,B
由于 F ( x ) 在 x = 0 处和 x = 1 处均有定义 由于F(x)在x=0处和x=1处均有定义 由于F(x)在x=0处和x=1处均有定义
lim x → 0 + F ( x ) = F ( 0 ) \lim\limits_{x\to 0^+}F(x)=F(0) x→0+limF(x)=F(0)
lim x → 1 + F ( x ) = F ( 1 ) \lim\limits_{x\to1+}F(x)=F(1) x→1+limF(x)=F(1)
即:A=1,B=0
对于
∀
x
1
<
x
2
;
P
(
{
x
1
<
x
⩽
x
2
}
)
=
F
(
x
2
)
−
F
(
x
1
)
\forall x_1
有分布函数可以确定随机变量在某一个区间内的取值概率
对于任意的 x , P ( { X = x } ) = F ( x ) − F ( x − 0 ) 对于任意的x,P(\set{X=x})=F(x)-F(x-0) 对于任意的x,P({X=x})=F(x)−F(x−0)
例:
对于分布函数
F
(
x
)
=
{
0
,
x
⩽
0
x
2
,
0
<
x
⩽
1
1
x
>
1
F(x)=
P
(
0.2
<
x
⩽
0.8
)
=
F
(
0.8
)
−
F
(
0.2
)
=
0.6
P(0.2
一般的,对于随机变量X的为:
P ( X = x k ) = p k , k = 1 , 2 , ⋯ P(X=x_k)=p_k,k=1,2,\cdots P(X=xk)=pk,k=1,2,⋯
F ( x ) = P ( X ⩽ x ) = ∑ x k ⩽ x P ( X = x k ) = ∑ x ⩽ x p k 其中 p k = P ( X = x k ) 这种转换得到的是一个跳跃性的函数 F ( x ) , 跳跃点分布在 x = x k 处 而且跳跃的高度为 p k F(x)=P(X\leqslant x)=\sum\limits_{x_k\leqslant x}P(X=x_k)=\sum\limits_{x\leqslant x}p_k \\其中p_k=P(X=x_k) \\这种转换得到的是一个跳跃性的函数F(x),跳跃点分布在x=x_k处 \\而且跳跃的高度为p_k F(x)=P(X⩽x)=xk⩽x∑P(X=xk)=x⩽x∑pk其中pk=P(X=xk)这种转换得到的是一个跳跃性的函数F(x),跳跃点分布在x=xk处而且跳跃的高度为pk
显然,离散型随机变量的函数不是连续函数
设随机变量X的分布函数是F(x)
如果存在一个**非负可积函数 f ( x ) , 使得任意 x ∈ R f(x),使得任意x\in R f(x),使得任意x∈R**有
F ( x ) = ∫ − ∞ x f ( t ) d t F(x)=\int_{-\infin}^{x}f(t)dt F(x)=∫−∞xf(t)dt
X 是连续性随机变量 X是连续性随机变量 X是连续性随机变量
f ( x ) 是随机变量 X 的概率密度函数 f(x)是随机变量X的概率密度函数 f(x)是随机变量X的概率密度函数,检查密度函数(密度)
F ( x ) 是 f ( x ) 的积分上限函数 F(x)是f(x)的积分上限函数 F(x)是f(x)的积分上限函数
设其中X为连续型随机变量时,有:
对于任意实数 : a , b ( a ⩽ b ) 对于任意实数:a,b(a\leqslant b) 对于任意实数:a,b(a⩽b)
P
(
a
<
X
⩽
b
)
=
F
(
b
)
−
F
(
a
)
=
∫
a
b
f
(
x
)
d
x
P(a
推导:
P
(
a
<
X
⩽
b
)
=
F
(
b
)
−
F
(
a
)
=
∫
−
∞
b
f
(
x
)
d
x
−
∫
−
∞
a
f
(
x
)
d
x
=
∫
−
∞
b
f
(
x
)
d
x
+
∫
a
−
∞
f
(
x
)
d
x
=
∫
a
b
f
(
x
)
d
x
P(a
再回头看规范性:
设
ϵ
>
0
,
ϵ
可以视为积分变量的微分
:
∣
d
x
∣
=
ϵ
>
0
P
(
a
<
X
⩽
a
+
ϵ
)
=
∫
a
a
+
ϵ
f
(
x
)
d
x
F
(
x
)
=
∫
−
∞
x
f
(
x
)
d
x
从几何意义上看
,
概率的微分
F
′
(
x
)
d
x
=
f
(
x
)
d
x
F
(
−
∞
)
=
0
d
P
(
X
<
x
)
=
d
(
F
(
x
)
)
=
f
(
x
)
d
x
(
对上式两边同时微分
,
微积分第一基本定理
)
设\epsilon>0,\epsilon可以视为积分变量的微分:|\mathrm{d}x|=\epsilon>0 \\P(a
f ( x ) 在 x 0 处连续时 , f ( x 0 ) = F ′ ( x 0 ) f(x)在x_0处连续时,f(x_0)=F'(x_0) f(x)在x0处连续时,f(x0)=F′(x0)
∀ 常数 c , P ( X = c ) = 0 \forall 常数c, P(X=c)=0 ∀常数c,P(X=c)=0
对于
Δ
x
>
0
0
⩽
P
(
X
=
c
)
<
P
(
c
−
Δ
x
<
x
⩽
c
)
=
F
(
x
)
−
F
(
c
−
Δ
x
)
=
0
(
Δ
x
→
0
+
)
由夹逼法则
,
P
(
X
=
c
)
=
0
对于\Delta x>0 \\0\leqslant P(X=c) 对于Δx>00⩽P(X=c)<P(c−Δx<x⩽c)=F(x)−F(c−Δx)=0(Δx→0+)由夹逼法则,P(X=c)=0
可见,连续型随机变量取一个具体值的概率是0
基于此有:
P ( a ⩽ X < b ) = P ( { X = a } ∪ { a < X < b } ) = P ( X = a ) + P ( a < X < b ) = P ( a < X < b ) P(a\leqslant XP(a⩽X<b)=P({X=a}∪{a<X<b})=P(X=a)+P(a<X<b)=P(a<X<b)
类似的:
改变密度函数 f ( x ) 在有限个点处的函数值 ( 并且保证这些值非负 ) 改变密度函数f(x)在有限个点处的函数值(并且保证这些值非负) 改变密度函数f(x)在有限个点处的函数值(并且保证这些值非负)
比如得到新的函数 g ( x ) 比如得到新的函数g(x) 比如得到新的函数g(x)
根据概率密度的定义,g(x)也是X的概率密度函数
因此,改变有限个点处的密度函数值不会影响分布函数
即不同的密度函数可能得到相同的分布函数!
🎈一个随机变量的分布函数是确定的,但是它的概率密度却不是唯一的
f
(
x
)
=
{
1
,
0
<
x
<
1
0
,
e
l
s
e
g
(
x
)
=
{
1
,
0
⩽
x
⩽
1
0
,
e
l
s
e
f(x)=
f ( x ) , g ( x ) ( 作为概率密度 ) 在是不同的两个函数 , 但是它们有相同的分布函数 f(x),g(x)(作为概率密度)在是不同的两个函数,但是它们有相同的分布函数 f(x),g(x)(作为概率密度)在是不同的两个函数,但是它们有相同的分布函数
F
(
x
)
=
{
0
,
x
<
0
x
,
0
⩽
x
⩽
1
1
,
x
>
0
F(x)=
F
(
x
)
=
∫
−
∞
x
f
(
x
)
d
x
由于
f
(
x
)
是个分段函数
,
因此积分的时候也要相应的分段
f
(
x
)
在不同段
(
x
落在不同区间
)
下的积分如下
{
F
(
x
)
=
∫
−
∞
x
f
(
x
)
d
x
=
∫
−
∞
x
0
d
x
=
C
∣
−
∞
x
=
C
−
C
=
0
,
x
<
0
F
(
x
)
=
∫
−
∞
x
f
(
x
)
d
x
=
∫
−
∞
0
0
d
x
+
∫
0
x
1
d
x
=
0
+
x
∣
0
x
=
x
−
0
=
x
,
0
⩽
x
⩽
1
F
(
x
)
=
∫
−
∞
x
f
(
x
)
d
x
=
∫
−
∞
0
0
d
x
+
∫
0
1
1
d
x
+
∫
1
x
0
d
x
=
x
∣
0
1
=
1
,
x
>
0
F(x)=\int_{-\infin}^{x}f(x)\mathrm{d}x \\由于f(x)是个分段函数,因此积分的时候也要相应的分段 \\f(x)在不同段(x落在不同区间)下的积分如下 \\
F
(
x
)
=
{
0
,
x
⩽
0
x
,
0
<
x
<
1
1
,
x
⩾
0
F(x)=
由密度函数 f 积分 ( 变上限积分 ) 得到分布函数 F 由密度函数f积分(变上限积分)得到分布函数F 由密度函数f积分(变上限积分)得到分布函数F
求解随机变量落在给定区间内的概率
f
(
x
)
=
{
a
x
+
b
,
0
<
x
<
2
0
,
e
l
s
e
P
(
1
<
X
<
3
)
=
0.25
f(x)=
根据规范性:
∫
−
∞
+
∞
f
(
x
)
d
x
=
1
再结合密度函数
f
(
x
)
分段区间
∫
−
∞
+
∞
f
(
x
)
d
x
=
0
+
∫
0
2
f
(
x
)
d
x
+
0
=
1
(
a
x
2
2
+
b
x
)
∣
0
2
=
2
a
+
2
b
=
1
a
+
b
=
1
2
结合给出的特殊概率
:
P
(
1
<
X
<
3
)
=
0.25
P
(
1
<
X
<
3
)
=
∫
1
3
f
(
x
)
d
x
=
∫
1
2
f
(
x
)
d
x
+
0
=
∫
1
2
(
a
x
+
b
)
d
x
=
0.25
(
a
x
2
2
+
b
x
)
∣
1
2
=
2
a
+
2
b
−
(
1
2
a
+
b
)
=
3
2
a
+
b
=
0.25
a
=
−
0.5
,
b
=
1
\int_{-\infin}^{+\infin}f(x)\mathrm{d}x=1 \\再结合密度函数f(x)分段区间 \\\int_{-\infin}^{+\infin}f(x)\mathrm{d}x=0+\int_{0}^{2}f(x)\mathrm{d}x+0=1 \\(\frac{ax^2}{2}+bx)|_0^2=2a+2b=1 \\a+b=\frac{1}{2} \\结合给出的特殊概率: \\P(1
f
(
x
)
=
{
−
1
2
x
+
1
,
0
<
x
<
2
0
,
e
l
s
e
F
(
x
)
=
∫
−
∞
x
f
(
x
)
d
x
=
{
∫
−
∞
0
f
(
x
)
d
x
=
0
,
x
⩽
0
∫
−
∞
0
f
(
x
)
d
x
+
∫
0
x
(
−
1
2
x
+
1
)
d
x
=
0
+
−
x
2
4
+
x
=
−
x
2
4
+
x
,
0
<
x
<
2
∫
−
∞
0
f
(
x
)
d
x
+
∫
0
2
f
(
x
)
d
x
+
∫
2
x
f
(
x
)
d
x
=
0
+
1
+
0
=
1
,
x
⩾
2
f(x)=
P ( X > 1.5 ) = 1 − P ( X ⩽ 1.5 ) = 1 − F ( 1.5 ) = 1 16 = 0.0625 P(X>1.5)=1-P(X\leqslant 1.5)=1-F(1.5)=\frac{1}{16}=0.0625 P(X>1.5)=1−P(X⩽1.5)=1−F(1.5)=161=0.0625
f
(
x
)
=
{
3
x
2
,
0
<
x
<
1
0
,
e
l
s
e
f(x)=
这里例子中
,
f
(
x
)
被分为三段
,
容易直接推断分布函数中的首尾两段
中间段的
x
3
结果不一定要算出来
,
特别是有些求随机变量的密度函数的问题
,
不必求出
P
(
X
<
x
)
=
{
0
,
x
<
0
1
,
x
>
1
∫
−
∞
x
f
(
x
)
d
x
=
∫
0
x
3
x
2
d
x
=
x
3
,
0
⩽
x
⩽
1
这里例子中,f(x)被分为三段,容易直接推断分布函数中的首尾两段 \\中间段的x^3结果不一定要算出来,特别是有些求随机变量的密度函数的问题,不必求出 \\ P(X
从分布函数
F
(
x
)
=
P
(
X
⩽
x
)
=
∫
−
∞
x
f
(
x
)
d
x
以及公式
:
P
(
a
<
X
⩽
b
)
=
F
(
b
)
−
F
(
a
)
=
∫
a
b
f
(
x
)
d
x
的角度来看
,
以
[
a
,
b
]
为底
,
以曲线
f
(
x
)
为顶的曲边梯形的面积表示的就是是概率
P
(
a
<
X
⩽
b
)
从分布函数F(x)=P(X\leqslant x)=\int_{-\infin}^{x}f(x)\mathrm{d}x \\以及公式:P(a
从极限的角度考虑上述公式
:
取
b
=
a
+
Δ
x
P
(
a
<
X
⩽
x
+
ε
)
=
F
(
a
+
ε
)
−
F
(
a
)
=
∫
a
a
+
ε
f
(
x
)
d
x
a
一般化
,
用
x
代替
a
P
(
x
<
X
⩽
x
+
Δ
x
)
=
F
(
x
+
Δ
x
)
−
F
(
x
)
=
∫
x
x
+
Δ
x
f
(
x
)
d
x
≈
f
(
x
)
d
x
\\从极限的角度考虑上述公式: \\取b=a+\Delta x \\P(a
即 , 运用化曲为直的近似思想 , 可以得到小曲边梯形近似称小矩形的结果 ∫ x x + Δ x f ( x ) d x 表示 [ x , x + Δ x ] 区间内的曲顶面积 f ( x ) d x = f ( x ) Δ x 则表示面积近似的矩形 ( 估计值 ) 容易发觉 , 当 f ( x 1 ) > f ( x 2 ) 的是时候 , X 的取值落在 x 1 附近的概率比较大 ( 概率密度函数在 x = x 1 附近区间的积分的面积 ( 近似小矩形面积 ) 比较大 ) \\即,运用化曲为直的近似思想,可以得到小曲边梯形近似称小矩形的结果 \\ \int_{x}^{x+\Delta x}f(x)\mathrm{d}x表示[x,x+\Delta{x}]区间内的曲顶面积 \\f(x)\mathrm{d}x=f(x)\Delta{x}则表示面积近似的矩形(估计值) \\ \\容易发觉,当f(x_1)>f(x_2)的是时候,X的取值落在x_1附近的概率比较大 \\(概率密度函数在x=x_1附近区间的积分的面积(近似小矩形面积)比较大) 即,运用化曲为直的近似思想,可以得到小曲边梯形近似称小矩形的结果∫xx+Δxf(x)dx表示[x,x+Δx]区间内的曲顶面积f(x)dx=f(x)Δx则表示面积近似的矩形(估计值)容易发觉,当f(x1)>f(x2)的是时候,X的取值落在x1附近的概率比较大(概率密度函数在x=x1附近区间的积分的面积(近似小矩形面积)比较大)