1 随机事件及其概率 #
1.1 利用四大公式计算概率 #
四大公式(韦恩图直观推导):
- 加(分类)
- $A \cup B$ 含义: A, B 至少发生一个
- $P(A \cup B) = P(A) + P(B) - P(AB)$
- $P(A \cup B \cup C)$ 将 $A \cap B$ 视为整体即可, 加积减偶
- 减(分步)
- $P(A - B) = P(A) - P(AB)$
- 同理 $P(AB - C) = P(AB) - P(ABC)$
- 对立事件(读ba): $P(\overline{A}) = 1 - P(A)$
- 乘(交)
- $P(AB) = P(B) P(A|B)$
- $P(A\overline{B}) = P(A) - P(AB)$
- 条件概率公式
- B 事件发生的前提下(缩小了观测空间), A 发生的概率
- $P(A | B) = \frac{P(AB)}{P(B)}$
A 与 B 独立 <=>:
- A 与 B 互不影响 <=>
- P(A)P(B) = P(AB) <=>
- B 是否发生不影响 A, A 是否发生不影响 B <=>
- P(A) = P(A|B), P(B) = P(B|A)
加法基础例题:
减法基础例题:
条件概率公式基础例题:
1.2 古典概率 #
$P(A) = \frac{A样本数}{样本空间样本总数}$
分步相乘, 分类相加
至少xx事件, 求对立事件
1.3 全概率公式与贝叶斯公式 #
特征: “随机试验"分“两个阶段完成”
全概率公式原理与贝叶斯公式及其处理步骤:
题解:
例题:
1.4 伯努利概型 - 二项概率公式 #
“独立“, “n次”, “两种结果” = 伯努利概型
2 一维随机变量(RV)及其概率 #
2.1 离散型变量求分布律 #
分布律即概率分布
求分布律: “先求取值, 再求概率”
例题:
常见离散型分布 #
连续型变量相关计算 #
基础知识和题型:
已知 f 求 F(不定积分-大题重点):
例题 - 三个参数(利用连续性):
常见的连续型分布-均匀型 #
均匀分布的概率密度函数为距离差的倒数
例题1:
例题2 - 正态分布:
离散型变量函数的分布律 #
连续性变量的函数的密度(重点) #
分部函数的定义: $F_Y(y) = P{Y \leq y}$
例题:
3 二维随机变量及其分布 #
二维离散型的分布(联合、边缘、条件、独立性) #
例1:
1-联合分布律:
1-边缘分布律:
1-条件分布率:
1-独立性:
- 联合分布率行之间是否成比例可用于选择题快速判断
- 联合概率 === 边缘概率的乘积, 正式判断
二维规范性: 二重积分为 1
边缘密度:
二维连续型 #
例2:
2-联合密度函数:
2-区域概率(求交集):
2-边缘密度:
2-独立性: 联合密度 != 边缘密度之积, 因此不独立
快捷判断: f(x,y) 区域非正矩形, 必不独立
两个离散变量函数的分布 #
例3:
两个连续变量函数的分布 #
例4:
4 随机变量的数字特征 #
二项分布(B) #
记作: B(n, p), 表示 n 次实验, 每次成功概率 p
$P{x = k} = C_n^kp^k \cdot (1-p)^{n-k}$
每次重复时成功概率不变时, 又称作伯努利试验
均匀分布(U) #
记作: U(a, b)
期望: $\frac{a+b}{2}$
方差: $\frac{(b-a)^2}{12}$
正态分布(N) #
正态分布具有可加性: $X_1 + X_2 = N(u_1 + u_2, \sigma_1^2 + \sigma_2^2)$
$f(x) = \frac{1}{\sqrt{2\pi}\sqrt{\sigma^2}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}$
泊松分布(P) #
推导过程
描述一段时间内一个概率事件发生次数的概率分布
通过将分割时间段取极限, 将每个区间视作二项分布:
$\lambda$ 为期望(如二项分布的期望为 np)
因此泊松分布的式子: $\frac{\lambda^k \cdot e^{-\lambda}}{k!}$
其期望和方差均为 $\lambda$
指数分布(E) #
记作 $E(\lambda)$
$$
f(x) =
\begin{cases}
\lambda e^{-\lambda x} (x < 0) \newline
0 \newline
\end{cases}
$$
期望: $\frac{1}{\lambda}$
方差: $\frac{1}{\lambda^2}$
期望和方差 #
标准差(S) 标准差的平方即方差
随机变量的期望和方差满足:
$D(X) = E((X - E(X))^2) = E(X^2) - E(X)^2$
推导过程:
![]()
离散变量的期望 = (取值 * 概率)求和
协方差 #
方差衡量单个变量的离散程度
协方差衡量两个变量的离散程度
$Cov(X,Y) = E[(X - E(X))(Y - E(Y))]$
即方差是协方差的特殊形式: $Cov(X, X) = D(X)$
$Cov(X, Y) = E(XY) - E(X)E(Y)$ 乘积的期望 - 期望的乘积
$Cov(aX + bY, Z) = aCov(X, Z) + bCov(Y, Z)$
$Cov(aX,bY) = abCov(X,Y)$
相关系数($\rho$) #
$\rho(X, Y) = \frac{Cov(X, Y)}{\sqrt{(D(x)} \cdot \sqrt{D(Y)})}$
相关系数为 0 即不相关, 不相关是独立事件的必要非充分条件
Todo, 确认:
正相关(你增我增), ρ = 1;
负相关(你增我减), 例如投掷硬币固定次数, 正反次数 ρ = -1;
抽样 #
为什么样本方差除以 n-1? - 抽样让样本的集中程度变高了, 即抽样过程会低估方差
样本方差记作 $S^2 = \frac{1}{n-1} \displaystyle \sum_{i=1}^n(X_i-\overline X)^k$
正态总体的抽样分布定理:
2001年真题:
常见分布的数字特征(期望, 方差) #
U(Uniform) - 均匀
N(Normal) - 正态
P - 泊松
D - 方差
- D(X + Y)
- 若 X, Y 独立, D(X + Y) = D(X) + D(Y)
- 若非独立, D(X + Y) = D(X) + D(Y) + 2Cov(X, Y)
- $D(CX) = C^2D(X)$, C 为常数
常见的性质与例题:
例题1:
离散型变量的协方差和相关系数 #
例题2:
连续型变量的协方差和相关系数 #
连续型变量的期望 = 取值乘密度再积分
例题:
切比雪夫不等式估算概率 #
没有密度函数, 估算区间概率:
$P{|X - E(X)| \geq \epsilon } \leq \frac{D(X)}{\epsilon^2}$
等价于:
$P{|X - E(X)| \lt \epsilon } \ge 1 - \frac{D(X)}{\epsilon^2}$
例题:
5 中心极限定理与数理统计 #
利用中心极限定理计算概率 #
特征: “n个变量”, “独立”, “同分布”
意义: n个变量互相独立且都服从xx分布, 求和后近似服从正态分布(n趋近无穷时, 则趋近等于)
例题1:
例题2:
数理统计的三大分布($x^2$分布, t分布, F分布) #
基础知识:
- $x^2$分布具有可加性
例题:
6 参数估计 #
- 点估计:
- 矩估计: n 较大时, 总体矩 = 样本矩
- 最大似然估计: 使样本 {$X_1, X_2, \cdots X_n$} 发生概率最大的 $\theta$ 值
- 写出似然函数
- 对其求导以求最大值
- 区间估计
矩 #
一系列数字特征的鼻祖
- 期望(1 阶原点矩) - 分布的中心
- 方差(2 阶原点矩) - 分布对重心的离散程度
- 峰度 - 刻画分布的尖峭程度
- 偏度 - 刻画分布偏离对程性程度
原点矩, 左侧为样本矩, 右侧总体矩:
中心距(与中心的距离):
大数定律(矩估计法): 样本矩在n趋于无穷时收敛于总体矩
未知参数的矩估计与最大似然估计法(重点-压轴) #
(简单随机)样本性质:
- 个体间独立
- 与 X 同分布
矩估计与最大似然估计法基础解题思路:
例题:
估计量的无偏性与有效性 #
无偏的充要条件 <=> 系数之和为 1
性质 & 例题:
区间估计(非重点) #
区间估计要素:
- 可靠性 - 估计正确的概率, 区间越大越可靠
- 精度 - 区间越小精度越高
对于区间估计, 保证可靠性前提下, 尽可能提高精度: - (容许)犯错率, 通常取 5%,即 95% 概率落在区间
****四个常用统计量及其分布(重要)**:
上 $\alpha$ 分位点:
区间估计步骤:
- 找到合适的枢轴变量 Y
- 写出 $P{y_1 \leq Y \leq y_2} = 1 - \alpha$
- 等价变形为 $P{\theta_1 \leq \theta \leq \theta_2} = 1 - \alpha$
- $[\theta_1, \theta_2]$ 即为所求置信区间
对期望进行区间估计 - $\sigma^2$已知, 基础例题:
对期望进行区间估计 - $\sigma^2$未知, 基础例题:
对方差进行区间估计 - $\mu$已知, 基础例题:
对方差进行区间估计 - $\mu$未知, 基础例题:
四种情况总结:
例题:
7 假设校验 #
检验估计的准确性
正态总体的均值检验 #
拒绝域: 小概率事件对应的区间
解题思路:
例题:
正态方差的均值检验 #
例题:
待补充 #
首中即停止-几何分布
离散用级数算
要求随机遍量的数字特征:
- 一维离散型交给分布律
- 二维离散型交给联合分布率
- 连续型交给密度函数
最大似然估计值: xi - 指样本值 最大似然估计量: Xi - 指样本
通常用 $S^2$ 表示样本方差
样本方差和三大分布之间的关联:
最大似然估计没有确切值的例题:
全期望, 全方差公式(24年9题):