Skip to main content

概率论与数理统计

·2610 words·6 mins· loading · loading · ·
Sans
Author
Sans
wanna know everything
Table of Contents

1 随机事件及其概率
#

1.1 利用四大公式计算概率
#

四大公式(韦恩图直观推导):

  1. 加(分类)
    1. $A \cup B$ 含义: A, B 至少发生一个
    2. $P(A \cup B) = P(A) + P(B) - P(AB)$
    3. $P(A \cup B \cup C)$ 将 $A \cap B$ 视为整体即可, 加积减偶
  2. 减(分步)
    1. $P(A - B) = P(A) - P(AB)$
    2. 同理 $P(AB - C) = P(AB) - P(ABC)$
    3. 对立事件(读ba): $P(\overline{A}) = 1 - P(A)$
  3. 乘(交)
    1. $P(AB) = P(B) P(A|B)$
    2. $P(A\overline{B}) = P(A) - P(AB)$
  4. 条件概率公式
    1. B 事件发生的前提下(缩小了观测空间), A 发生的概率
    2. $P(A | B) = \frac{P(AB)}{P(B)}$

A 与 B 独立 <=>:

  1. A 与 B 互不影响 <=>
  2. P(A)P(B) = P(AB) <=>
  3. B 是否发生不影响 A, A 是否发生不影响 B <=>
  4. P(A) = P(A|B), P(B) = P(B|A)

加法基础例题:

加法例题

减法基础例题:

减法基础例题

条件概率公式基础例题:

条件概率公式基础例题

1.2 古典概率
#

$P(A) = \frac{A样本数}{样本空间样本总数}$
分步相乘, 分类相加
至少xx事件, 求对立事件

1.3 全概率公式与贝叶斯公式
#

特征: “随机试验"分“两个阶段完成”

全概率公式原理与贝叶斯公式及其处理步骤:

全概率公式原理

贝叶斯公式及整体解题步骤

题解:
题解

例题:

例题

1.4 伯努利概型 - 二项概率公式
#

“独立“, “n次”, “两种结果” = 伯努利概型

伯努利概型

2 一维随机变量(RV)及其概率
#

2.1 离散型变量求分布律
#

分布律即概率分布
求分布律: “先求取值, 再求概率”

例题:

方法一

方法二

常见离散型分布
#

常见离散型分布

连续型变量相关计算
#

基础知识和题型:

例题1

已知 f 求 F(不定积分-大题重点):

例题2-1

例题2-2

例题 - 三个参数(利用连续性):

三个参数

常见的连续型分布-均匀型
#

均匀分布的概率密度函数为距离差的倒数

例题1:

例题1

例题2 - 正态分布:

正态分布-法1
标准化性质解法(注意需要先标准化):
正态分布-法2

离散型变量函数的分布律
#

alt text

连续性变量的函数的密度(重点)
#

分部函数的定义: $F_Y(y) = P{Y \leq y}$

例题:

例题

3 二维随机变量及其分布
#

二维离散型的分布(联合、边缘、条件、独立性)
#

例1:
1-联合分布律:

1-二维离散型

1-边缘分布律:
1-边缘分布律

1-条件分布率:
1-条件分布率

1-独立性:

  1. 联合分布率行之间是否成比例可用于选择题快速判断
  2. 联合概率 === 边缘概率的乘积, 正式判断
    1-独立性

二维规范性: 二重积分为 1
边缘密度:

二维连续型
#

ref

例2:
2-联合密度函数:

2-联合密度函数

2-区域概率(求交集):
2-区域概率

2-边缘密度:
2-边缘密度
2-条件密度:
2-条件密度

2-独立性: 联合密度 != 边缘密度之积, 因此不独立

快捷判断: f(x,y) 区域非正矩形, 必不独立

两个离散变量函数的分布
#

例3:

例3

两个连续变量函数的分布
#

例4:

alt text
alt text
alt text

4 随机变量的数字特征
#

二项分布(B)
#

记作: B(n, p), 表示 n 次实验, 每次成功概率 p
$P{x = k} = C_n^kp^k \cdot (1-p)^{n-k}$

每次重复时成功概率不变时, 又称作伯努利试验

均匀分布(U)
#

记作: U(a, b)
期望: $\frac{a+b}{2}$
方差: $\frac{(b-a)^2}{12}$

均匀分布

正态分布(N)
#

正态分布具有可加性: $X_1 + X_2 = N(u_1 + u_2, \sigma_1^2 + \sigma_2^2)$

$f(x) = \frac{1}{\sqrt{2\pi}\sqrt{\sigma^2}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}$

正态分布性质

泊松分布(P)
#

推导过程 描述一段时间内一个概率事件发生次数的概率分布
通过将分割时间段取极限, 将每个区间视作二项分布:
$\lambda$ 为期望(如二项分布的期望为 np)

计算过程1

计算过程2

因此泊松分布的式子: $\frac{\lambda^k \cdot e^{-\lambda}}{k!}$
其期望和方差均为 $\lambda$

指数分布(E)
#

记作 $E(\lambda)$
$$ f(x) = \begin{cases} \lambda e^{-\lambda x} (x < 0) \newline 0 \newline \end{cases} $$ 期望: $\frac{1}{\lambda}$
方差: $\frac{1}{\lambda^2}$

期望和方差
#

标准差(S) 标准差的平方即方差
随机变量的期望和方差满足:
$D(X) = E((X - E(X))^2) = E(X^2) - E(X)^2$
推导过程:

推导过程

离散变量的期望 = (取值 * 概率)求和

协方差
#

方差衡量单个变量的离散程度
协方差衡量两个变量的离散程度
$Cov(X,Y) = E[(X - E(X))(Y - E(Y))]$
即方差是协方差的特殊形式: $Cov(X, X) = D(X)$
$Cov(X, Y) = E(XY) - E(X)E(Y)$ 乘积的期望 - 期望的乘积
$Cov(aX + bY, Z) = aCov(X, Z) + bCov(Y, Z)$
$Cov(aX,bY) = abCov(X,Y)$

相关系数($\rho$)
#

$\rho(X, Y) = \frac{Cov(X, Y)}{\sqrt{(D(x)} \cdot \sqrt{D(Y)})}$ 相关系数为 0 即不相关, 不相关是独立事件的必要非充分条件
Todo, 确认:
正相关(你增我增), ρ = 1;
负相关(你增我减), 例如投掷硬币固定次数, 正反次数 ρ = -1;

抽样
#

为什么样本方差除以 n-1? - 抽样让样本的集中程度变高了, 即抽样过程会低估方差
样本方差记作 $S^2 = \frac{1}{n-1} \displaystyle \sum_{i=1}^n(X_i-\overline X)^k$

正态总体的抽样分布定理:

正态总体的抽样分布定理

2001年真题:

2001年真题:

常见分布的数字特征(期望, 方差)
#

U(Uniform) - 均匀
N(Normal) - 正态
P - 泊松
D - 方差

  • D(X + Y)
    • 若 X, Y 独立, D(X + Y) = D(X) + D(Y)
    • 若非独立, D(X + Y) = D(X) + D(Y) + 2Cov(X, Y)
  • $D(CX) = C^2D(X)$, C 为常数

常见的性质与例题:

常见的性质与例题

例题1:

例题1

离散型变量的协方差和相关系数
#

例题2:

例题2-1

例题2-2

连续型变量的协方差和相关系数
#

连续型变量的期望 = 取值乘密度再积分
例题:

例题

切比雪夫不等式估算概率
#

没有密度函数, 估算区间概率:
$P{|X - E(X)| \geq \epsilon } \leq \frac{D(X)}{\epsilon^2}$
等价于:
$P{|X - E(X)| \lt \epsilon } \ge 1 - \frac{D(X)}{\epsilon^2}$

例题:

例题

5 中心极限定理与数理统计
#

利用中心极限定理计算概率
#

特征: “n个变量”, “独立”, “同分布”
意义: n个变量互相独立且都服从xx分布, 求和后近似服从正态分布(n趋近无穷时, 则趋近等于)

例题1:

例题1

例题2:

例题2

数理统计的三大分布($x^2$分布, t分布, F分布)
#

基础知识:

  • $x^2$分布具有可加性

基础知识

例题:

例题

6 参数估计
#

ref

  1. 点估计:
    1. 矩估计: n 较大时, 总体矩 = 样本矩
    2. 最大似然估计: 使样本 {$X_1, X_2, \cdots X_n$} 发生概率最大的 $\theta$ 值
      1. 写出似然函数
      2. 对其求导以求最大值
  2. 区间估计

#

一系列数字特征的鼻祖

  1. 期望(1 阶原点矩) - 分布的中心
  2. 方差(2 阶原点矩) - 分布对重心的离散程度
  3. 峰度 - 刻画分布的尖峭程度
  4. 偏度 - 刻画分布偏离对程性程度

原点矩, 左侧为样本矩, 右侧总体矩:

原点矩

中心距(与中心的距离):

中心距

大数定律(矩估计法): 样本矩在n趋于无穷时收敛于总体矩

未知参数的矩估计与最大似然估计法(重点-压轴)
#

(简单随机)样本性质:

  1. 个体间独立
  2. 与 X 同分布

矩估计与最大似然估计法基础解题思路:

矩估计与最大似然估计法基础解题思路

例题:

例题-1

例题-2(1)

例题-2(2)

估计量的无偏性与有效性
#

无偏的充要条件 <=> 系数之和为 1

性质 & 例题:

例题

区间估计(非重点)
#

ref

区间估计要素:

  1. 可靠性 - 估计正确的概率, 区间越大越可靠
  2. 精度 - 区间越小精度越高
    对于区间估计, 保证可靠性前提下, 尽可能提高精度:
  3. (容许)犯错率, 通常取 5%,即 95% 概率落在区间

置信区间

****四个常用统计量及其分布(重要)**:

四个常用统计量及其分布

上 $\alpha$ 分位点:

分位点

区间估计步骤:

  1. 找到合适的枢轴变量 Y
  2. 写出 $P{y_1 \leq Y \leq y_2} = 1 - \alpha$
  3. 等价变形为 $P{\theta_1 \leq \theta \leq \theta_2} = 1 - \alpha$
  4. $[\theta_1, \theta_2]$ 即为所求置信区间

对期望进行区间估计 - $\sigma^2$已知, 基础例题:

期望区间估计-方差已知例题

对期望进行区间估计 - $\sigma^2$未知, 基础例题:

期望区间估计-方差未知例题

对方差进行区间估计 - $\mu$已知, 基础例题:

方差区间估计-期望已知

对方差进行区间估计 - $\mu$未知, 基础例题:

方差区间估计-期望未知

四种情况总结:

四种情况总结

例题:

例题-1

例题-2

7 假设校验
#

检验估计的准确性

正态总体的均值检验
#

拒绝域: 小概率事件对应的区间

解题思路:

解题思路

例题:

例题

正态方差的均值检验
#

例题:

例题

待补充
#

首中即停止-几何分布

离散用级数算

要求随机遍量的数字特征:

  1. 一维离散型交给分布律
  2. 二维离散型交给联合分布率
  3. 连续型交给密度函数

最大似然估计值: xi - 指样本值 最大似然估计量: Xi - 指样本

通常用 $S^2$ 表示样本方差

样本方差和三大分布之间的关联:

样本方差和三大分布之间的关联

最大似然估计没有确切值的例题:

例题1
例题2

全期望, 全方差公式(24年9题):

全期望, 全方差公式