在概率论中,大数定律 (LLN) 是描述大量执行相同实验的结果的定理。 根据规律,大量试验所得结果的平均值应接近预期值,并随着试验次数的增加而趋于接近预期值。
LLN 很重要,因为它保证了一些随机事件的平均值的长期稳定结果。例如,虽然赌场可能会在轮盘赌的单次旋转中赔钱,但其收益将趋向于在大量旋转中的可预测百分比。 玩家的任何连胜最终都会被游戏的参数所克服。 要注意的是,该定律仅在考虑大量观察时才适用(如名称所示)。 没有原理关系的是少数观察结果会与预期值一致,或者一个值的连续性会立即被其他值“平衡”。
另外是要注意,LLN 仅适用于平均值。因此,虽然
lim n → ∞ ∑ i = 1 n X i n = X ˉ \lim _{n \rightarrow \infty} \sum_{i=1}^{n} \frac{X_{i}}{n}=\bar{X} n→∞limi=1∑nnXi=Xˉ
其他看起来相似未经验证的公式,例如与“理论结果”的原始偏差:
∑ i = 1 n X i − n × X ˉ \sum_{i=1}^{n} X_{i}-n \times \bar{X} i=1∑nXi−n×Xˉ
它不仅不会随着 n n n 的增加而收敛到零,反而随着 n n n 的增加,它的绝对值也趋于增加。
为了完整起见,下面的模拟将按照以下逻辑估计 π \pi π 的值:
知道圆的面积是 π r 2 \pi r^{2} πr2,我们知道半径 ( r r r ) 为 1 的圆的面积只是 π \pi π 。 如果我们将圆完美地放置在边长为 2 的正方形(即面积为 4)的内部,我们知道圆的面积与正方形的面积之比为 π 4 \frac{\pi}{4} 4π。
因此,如果我们随机向一个尺寸相同的飞镖板多次投掷飞镖,那么圆内的飞镖与击中正方形的飞镖的比率应该接近 π 4 \frac{\pi}{4} 4π。如果我们将这个比率乘以 4,我们就得到了 π \pi π 的估计值。
# Create a dartboard
dart_board <- ggplot() +
geom_circle(aes(x0 = 0, y0 = 0, r = 1), fill = "black") +
geom_circle(aes(x0 = 0, y0 = 0, r = 0.99), fill = "red") +
geom_circle(aes(x0 = 0, y0 = 0, r = 0.7), fill = "lightyellow") +
geom_circle(aes(x0 = 0, y0 = 0, r = 0.2), fill = "red") +
geom_circle(aes(x0 = 0, y0 = 0, r = 0.1), fill = "darkgreen") +
coord_fixed() +
geom_segment(aes(x=-1,xend=1,y=1,yend=1)) +
geom_segment(aes(x=-1,xend=1,y=-1,yend=-1)) +
geom_segment(aes(x=1,xend=1,y=-1,yend=1)) +
geom_segment(aes(x=-1,xend=-1,y=-1,yend=1)) +
xlab("x")+ylab("y")+
theme_bw()
dart_board