高三(数学): 概率统计——离散型随机变量及其分布列

一、知识点讲解

(一)离散型随机变量的概念

离散型随机变量:如果随机变量 $X$ 的所有可能取值可以一一列举出来(即取值为有限个或可列无限个),则称 $X$ 为离散型随机变量。

核心特征: 1. 取值能一一列举(如:抛掷骰子的点数 $1,2,3,4,5,6$) 2. 每个取值都有确定的概率 3. 所有概率之和为 1

(二)分布列的定义与性质

分布列:设离散型随机变量 $X$ 的可能取值为 $x_1, x_2, \dots, x_n$,$X$ 取每个值 $x_i$ 的概率为 $p_i$,即:

$$P(X = x_i) = p_i, \quad i = 1, 2, \dots, n$$

则表格:

$X$ $x_1$ $x_2$ $\dots$ $x_n$
$P$ $p_1$ $p_2$ $\dots$ $p_n$

称为 $X$ 的分布列

分布列的性质: 1. 非负性:$p_i \geq 0, \quad i=1,2,\dots,n$ 2. 归一性:$\sum_{i=1}^{n} p_i = 1$

(三)三种常见分布

分布名称 定义 概率公式 期望 $E(X)$ 方差 $D(X)$
两点分布(0-1分布) 一次试验只有两种结果 $P(X=1)=p,\ P(X=0)=1-p$ $p$ $p(1-p)$
二项分布 $B(n,p)$ $n$ 次独立重复试验 $P(X=k)=C_n^k p^k (1-p)^{n-k}$ $np$ $np(1-p)$
超几何分布 $H(N,M,n)$ 不放回抽取 $P(X=k)=\frac{C_M^k C_{N-M}^{n-k}}{C_N^n}$ $n\frac{M}{N}$ $\frac{nM(N-M)(N-n)}{N^2(N-1)}$

二、核心公式与推导

(一)二项分布的期望推导

$$E(X) = \sum_{k=0}^n k \cdot C_n^k p^k (1-p)^{n-k}$$ $$\quad = np \sum_{k=1}^n C_{n-1}^{k-1} p^{k-1} (1-p)^{(n-1)-(k-1)}$$ $$\quad = np [p + (1-p)]^{n-1} = np$$

(二)方差公式

$$D(X) = E(X^2) - [E(X)]^2$$

对于二项分布:$D(X) = np(1-p)$

📌 趣味练习:哪个分布更合理? 判断下列情境适用哪种分布,并说明理由: | 情境 | 你的判断 | 理由 | |------|---------|------| | 掷一颗骰子10次,记录出现6点的次数 | | | | 从100件产品(含5件次品)中不放回抽10件,记录次品数 | | | | 某射击手命中率为0.8,射击5次,记录命中次数 | | | | 抛一枚硬币1次,记录正面朝上与否 | | | **答案**: - 掷骰子10次→二项分布 $B(10,\frac{1}{6})$(独立重复试验) - 不放回抽10件→超几何分布(不放回,总产品有限) - 射击5次→二项分布 $B(5,0.8)$(独立重复试验) - 抛硬币1次→两点分布(一次试验两种结果)

三、典型例题

例题:某射击运动员每次射击命中目标的概率为 0.8,假设每次射击结果相互独立。

(1)该运动员射击 3 次,求恰好命中 2 次的概率。 (2)该运动员射击 3 次,求命中次数 $X$ 的分布列。

(1)设命中次数为 $X$,则 $X \sim B(3, 0.8)$

$$P(X=2) = C_3^2 \times 0.8^2 \times 0.2^{1} = 3 \times 0.64 \times 0.2 = 0.384$$

(2)$X$ 的可能取值为 $0, 1, 2, 3$

$$P(X=0) = C_3^0 \times 0.8^0 \times 0.2^3 = 1 \times 1 \times 0.008 = 0.008$$ $$P(X=1) = C_3^1 \times 0.8^1 \times 0.2^2 = 3 \times 0.8 \times 0.04 = 0.096$$ $$P(X=2) = 0.384$$ $$P(X=3) = C_3^3 \times 0.8^3 \times 0.2^0 = 1 \times 0.512 \times 1 = 0.512$$

分布列为:

$X$ 0 1 2 3
$P$ 0.008 0.096 0.384 0.512

验证:$0.008 + 0.096 + 0.384 + 0.512 = 1 \quad \checkmark$

四、课后作业

基础题

  1. 已知随机变量 $X$ 的分布列为 $P(X=k)=\frac{k}{15}, k=1,2,3,4,5$,求 $P(2 < X \leq 4)$。
  2. 某盒中有 10 个球,其中 3 个红球、7 个白球。从中不放回地摸取 2 个球,设摸到的红球个数为 $X$,求 $X$ 的分布列。
  3. 若 $X \sim B(5, 0.4)$,求 $P(X \geq 3)$。

提高题

  1. 甲、乙两人进行投篮比赛,甲命中率为 0.7,乙命中率为 0.6,每人投 3 次。设甲、乙命中次数分别为 $X$ 和 $Y$。 (1)求 $P(X=2)$ 和 $P(Y=2)$; (2)求 $P(X > Y)$。
  2. 某公司生产一批产品共 100 件,其中含 8 件次品。质检员从中有放回地抽取 5 件检验,求: (1)抽到次品件数的分布列; (2)抽到至少 1 件次品的概率。

拓展题

  1. 证明:超几何分布的期望 $E(X) = n\frac{M}{N}$。(提示:利用组合恒等式 $k C_M^k = M C_{M-1}^{k-1}$)
  2. 结合实际生活场景,设计一个可用二项分布模型解决的问题,列出完整的分布列并计算期望和方差。

五、深入理解:期望与方差的应用

(一)期望的实际意义

期望值 $E(X)$ 反映的是随机变量取值的平均水平,可以理解为大量重复试验中观测值的平均值。

重要性质: 1. 线性性质:$E(aX + b) = aE(X) + b$ 2. 和的期望:$E(X + Y) = E(X) + E(Y)$ 3. 独立积的期望:若 $X, Y$ 独立,则 $E(XY) = E(X)E(Y)$

(二)方差的实际意义

方差 $D(X)$ 反映的是随机变量取值的离散程度,方差越大,数据波动越大。

重要性质: 1. $D(aX + b) = a^2D(X)$ 2. $D(X) = E(X^2) - [E(X)]^2$ 3. 若 $X, Y$ 独立,则 $D(X + Y) = D(X) + D(Y)$

(三)标准差

$$\sigma(X) = \sqrt{D(X)}$$

标准差与 $X$ 的单位相同,更易于直观理解数据的离散程度。

六、题型分类与解题模板

类型一:求分布列(三步法)

步骤 操作 示例
第一步 确定随机变量 $X$ 的所有可能取值 如:抽取2个球,红球个数可为 0,1,2
第二步 用排列组合或概率公式计算每个值对应的概率 如:$P(X=k) = \frac{C_3^k C_7^{2-k}}{C_{10}^2}$
第三步 列表验算(概率和是否为1) $\sum p_i = 1$

类型二:求期望和方差

模板: 1. 先求出分布列 2. 代入公式 $E(X) = \sum x_i p_i$ 3. 代入公式 $D(X) = \sum (x_i - E(X))^2 p_i = E(X^2) - [E(X)]^2$

类型三:二项分布与超几何分布的辨别

条件 二项分布 超几何分布
抽样方式 有放回/独立重复 不放回
总体大小 无限大或近似无限 有限总体
每次概率 固定不变 随抽取而变化
公式 $C_n^k p^k (1-p)^{n-k}$ $\frac{C_M^k C_{N-M}^{n-k}}{C_N^n}$
近似 当 $n/N \leq 0.1$ 时可用二项近似

七、经典例题精讲

例题一:分布列综合应用

题目:一个袋中有4个红球和6个白球,不放回地随机取球3次,每次取1个。设取到的红球个数为 $X$,求 $X$ 的分布列、期望和方差。

: $X$ 服从超几何分布 $H(10, 4, 3)$

$P(X=k) = \frac{C_4^k C_6^{3-k}}{C_{10}^3}, \quad k=0,1,2,3$

$C_{10}^3 = 120$

$$P(X=0) = \frac{C_4^0 C_6^3}{120} = \frac{1 \times 20}{120} = \frac{20}{120} = \frac{1}{6}$$ $$P(X=1) = \frac{C_4^1 C_6^2}{120} = \frac{4 \times 15}{120} = \frac{60}{120} = \frac{1}{2}$$ $$P(X=2) = \frac{C_4^2 C_6^1}{120} = \frac{6 \times 6}{120} = \frac{36}{120} = \frac{3}{10}$$ $$P(X=3) = \frac{C_4^3 C_6^0}{120} = \frac{4 \times 1}{120} = \frac{4}{120} = \frac{1}{30}$$

分布列:

$X$ 0 1 2 3
$P$ $\frac{1}{6}$ $\frac{1}{2}$ $\frac{3}{10}$ $\frac{1}{30}$

验算:$\frac{1}{6} + \frac{1}{2} + \frac{3}{10} + \frac{1}{30} = \frac{5 + 15 + 9 + 1}{30} = 1$

$$E(X) = 0 \times \frac{1}{6} + 1 \times \frac{1}{2} + 2 \times \frac{3}{10} + 3 \times \frac{1}{30} = 0 + 0.5 + 0.6 + 0.1 = 1.2$$

$$E(X^2) = 0^2 \times \frac{1}{6} + 1^2 \times \frac{1}{2} + 2^2 \times \frac{3}{10} + 3^2 \times \frac{1}{30} = 0 + 0.5 + 1.2 + 0.3 = 2.0$$

$$D(X) = E(X^2) - [E(X)]^2 = 2.0 - 1.44 = 0.56$$

例题二:二项分布的实际应用

题目:某工厂生产的产品合格率为 0.95。质检员每天随机抽查 20 件产品,求: (1)恰好有 1 件次品的概率; (2)次品数不超过 2 件的概率; (3)次品数的期望和方差。

: 设次品数为 $X$,则 $X \sim B(20, 0.05)$

(1)$P(X=1) = C_{20}^1 \times 0.05 \times 0.95^{19} \approx 20 \times 0.05 \times 0.3774 \approx 0.3774$

(2)$P(X \leq 2) = P(X=0) + P(X=1) + P(X=2)$

$$P(X=0) = 0.95^{20} \approx 0.3585$$ $$P(X=1) \approx 0.3774$$ $$P(X=2) = C_{20}^2 \times 0.05^2 \times 0.95^{18} = 190 \times 0.0025 \times 0.3972 \approx 0.1887$$

$$P(X \leq 2) \approx 0.3585 + 0.3774 + 0.1887 = 0.9246$$

(3)期望 $E(X) = np = 20 \times 0.05 = 1$;方差 $D(X) = np(1-p) = 20 \times 0.05 \times 0.95 = 0.95$

八、常见错误与易错点

易错点一:混淆有放回与不放回

错误:直接将超几何分布当二项分布计算。 判断方法:看题目中是否明确"有放回"或"不放回"。无说明时看总体大小与抽样数量的比例。

易错点二:分布列概率和不为1

错误:计算遗漏某些取值或概率算错。 检查:分布列列完后,一定要将所有概率相加检验是否为1。

易错点三:期望公式计算错误

错误:将 $E(X^2)$ 当成 $[E(X)]^2$。 纠正:$E(X^2) = \sum x_i^2 p_i$,而 $[E(X)]^2 = (\sum x_i p_i)^2$,二者不同。方差公式中需要计算二者之差。

九、课后作业(补充)

综合训练

  1. 某篮球运动员罚球命中率为 0.75,独立罚球 4 次,求: (1)恰好命中 3 次的概率; (2)命中次数的期望和方差。

  2. 在一个不透明的盒子中有 5 个白球和 3 个红球,有放回地抽取 4 次,每次取一个球。设 $X$ 为抽到红球的次数。 (1)求 $X$ 服从什么分布; (2)求 $X$ 的分布列; (3)求 $P(X \geq 2)$。

  3. 从 1, 2, 3, 4, 5 这五个数字中随机取出 3 个数字(不放回),设取出的最大数字为 $X$,求 $X$ 的分布列和期望。

探究拓展

  1. 证明:若 $X \sim B(n, p)$,则 $E(X) = np$,并进一步推导二项分布的方差公式。
  2. 在实际生活中,举出三个可以用离散型随机变量描述的例子,并判断它们分别符合哪种分布,说明理由。

十、高考真题速递

2023年全国乙卷理科第17题(改编)

某厂生产甲、乙两种产品,甲产品的次品率为 0.02,乙产品的次品率为 0.01。从甲、乙产品中各随机抽取 100 件。

(1)求抽取的甲产品中恰有 2 件次品的概率; (2)设抽取的甲、乙产品中的次品总数分别为 $X$ 和 $Y$,求 $E(X)$ 和 $E(Y)$。

解题思路: (1)$X \sim B(100, 0.02)$,$P(X=2) = C_{100}^2 \times (0.02)^2 \times (0.98)^{98}$ (2)$E(X) = np = 100 \times 0.02 = 2$,$E(Y) = 100 \times 0.01 = 1$

拓展思考:如果甲、乙的产量比例为 3:2,则随机抽取一件产品是次品的概率是多少? (提示:用全概率公式 $P(次品) = P(甲)P(次品|甲) + P(乙)P(次品|乙) = 0.6 \times 0.02 + 0.4 \times 0.01 = 0.016$)