#edu2013. 概率基本概念

概率基本概念

在讨论概率之前,有必要对事件做一点了解。随机试验指的是在相同的条件下,对某个随机现象进行大量重复观测。随机试验可以在相同条件下重复进行;随机试验出现的所有可能结果不止一个,但都事先已知;每次实验总是出现可能的结果之一,但实验前无法预知得到哪一种结果。

抛硬币是随机试验,因为可以重复抛这枚硬币很多次;可能的实验结果是“正面朝上”或“反面朝上”,不存在其他结果;每次抛硬币前所有人都不知道这次是正面朝上,还是反面朝上。生孩子也可以视为随机试验。

样本空间、随机事件

抛硬币有正面、反面朝上两种结果。生孩子有男、女两种结果。一个随机实验中可能发生的不能再细分的结果被称为基本事件,也称为样本点,通常用 ee 来表示。所有样本点的集合称为样本空间,通常用 Ω\Omega 来表示。

将一枚硬币连续抛两次,一共四种可能:正正、正反、反正、反反。于是写出基本事件(样本点):

e1=(正,正)e2=(正,反)e3=(反,正)e4=(反,反)e_1=(正,正),e_2=(正,反),e_3=(反,正),e_4=(反,反)

样本空间就是上述所有样本点的集合有 Ω=e1,e2,e3,e4\Omega={e_1,e_2,e_3,e_4}.

随机试验出现的结果并不保证是有限的。例如,在区间 [0,1][0,1] 中随机取一个点,每一个实数都对应一个基本事件;样本空间是 {xR0x1}\{x\in \R |0 \le x \le 1\} , 是无限的,其中的样本个数比所有自然数的个数还要多!

基本事件(样本点)是概率论中的“原子”,可以构建出其他事件。例如,抛两次硬币,“其中有一次正面朝上”,它就包含了两个事件 {e2,e3}\{e_2,e_3\} ;从区间 [0,1][0,1] 取数,“取出的数小于 0.5 ” ,也包含了无穷个基本事件。

为了刻画这些“包含了很多个基本事件的事件,定义随机事件的概念:随机事件 AA 是样本空间 Ω\Omega 的一个子集。当且仅当 AA 中的某个基本事件发生,说事件 AA 发生。

一个 随机事件 是样本空间 Ω\Omega 的子集,它由若干样本点构成,用大写字母 A,B,C,A, B, C, \cdots 表示。

  • A=ΩA=\Omega ,则称 A 是必然事件
  • A=A=\emptyset , 则称 A 是不可能事件

事件的关系

两个随机事件之间可以有各种各样的关系。

  • 包含关系:通常用符号 {\displaystyle\subset} 表示。一个事件 AA 包含另一个事件 BB 记作:BA{B\subset A} 。这时只要事件 BB 发生,那么事件 AA 也一定发生。这个关系其实就是集合论中的包含关系。

  • 等价关系:两个事件对应的子集完全相等,记作 A=BA=B

  • 对立关系:两个事件只能有一个发生,并且必然有一个发生,则它们是对立关系。这种关系对应的集合论术语是“补集”。

  • 互斥关系:两个事件只能有一个发生,但并不必然有一个发生。这时也称两个事件之间是互不相容的。

特别需要注意区别独立事件:

独立事件

如果两个事件同时发生的概率等于它们各自发生的概率的乘积,那么就称这两个事件是相互独立的。比如说,“抽到的牌是红桃”和“抽到的牌数字是4”就是相互独立的。独立事件强调两个事件之间没有关联,互不影响。

独立事件与互斥事件不同:

  • P(A)×P(B)=P(AB)P(A)×P(B)=P(AB),则事件 AA 和事件 BB 为相互独立事件
  • ABA、B 为互斥事件,则 AB=A∩B=∅ ,则 ABA、B 同时发生的可能性为 00 , 若 ABA、B 为互斥事件,AABB 发生的概率 P(A+B)=P(A)+P(B)P(A+B)=P(A)+P(B)

事件的运算

由于我们将随机事件定义为了样本空间 Ω\Omega 的子集,故我们可以将集合的运算(如交、并、补等)移植到随机事件上。记号与集合运算保持一致。

  • 事件 AB{A\cup B}:是事件 AA 和事件 BB 的和事件(并事件),指的是事件“事件 AA 发生或者事件 BB 发生”。

  • 事件 ABA\cap B:是事件 AA 和事件 BB 的积事件(交事件),指的是事件“事件 AA 发生且事件 BB 发生”。

  • 事件 ABA-B:是事件 AA 和事件 BB 的差事件,指的是事件“事件 AA 发生且事件 BB 不发生”。

特别的,事件的并 ABA \cup B 也可记作 A+BA + B,事件的交 ABA \cap B 也可记作 ABAB,此时也可分别称作 和事件积事件

集合的交和并运算,是可以通过补运算来相互转化的。这就是大名鼎鼎的摩根定律:

AB=AˉBˉ\overline{ A \cup B}=\bar{A} \cap \bar{B} AB=AˉBˉ\overline{A \cap B}=\bar{A}\cup \bar{B}

在概率运算时,还有:

  • P(AB)P(A\mid B) :指的是“设 AABB 为样本空间 ΩΩ 中的两个事件,其中 P(B)>0P(B)>0。那么在事件 BB 发生的条件下,事件 AA 发生的条件概率”

概率

概率,是对随机事件发生之可能性的度量,为数学概率论的基本概念;概率的值是一个在 0011 之间的实数,也常以百分数来表示。

古典定义

在概率论早期实践中,由于涉及到的随机现象都比较简单,具体表现为样本空间 Ω\Omega 是有限集,且直观上所有样本点是等可能出现的,因此人们便总结出了下述定义:

如果一个随机试验满足:

  • 只有有限个基本结果;
  • 每个基本结果出现的可能性是一样的;

那么对于每个事件 AA 的概率定义为:

P(A)=A包含的基本事件个数基本事件的总数P(A)=\frac{A包含的基本事件个数}{基本事件的总数}

后来人们发现这一定义可以直接推广到 Ω\Omega 无限的一部分情景中,于是就有了所谓 几何概型。

公理化定义

古典概率定义存在循环定义。上述基于直观认识的定义在逻辑上有一个很大的漏洞:在定义「概率」这一概念时用到了「可能性」这一说法,产生了循环定义的问题。同时「等可能」在样本空间无限时会产生歧义,由此产生了包括 Bertrand 悖论 在内的一系列问题。

经过不断探索,苏联数学家柯尔莫哥洛夫于 1933 年在他的《概率论基础》一书中第一次给出了概率的公理化定义:

设随机事件的样本空间为 ΩΩΩΩ 的一个子集称为事件。对于 ΩΩ 中的每一个事件 AA,都有实函数 P(A)P(A),满足:

  • 非负性:P(A)0P(A)\geq 0
  • 规范性:P(Ω)=1P(\Omega )=1
  • 可数可加性:对可数个两两互斥事件 {Ai}iN\{A_i\}_{i \in N} 有:

i=1P(Ai)=\sum _{i=1}^{ \infty }P(A_i)= P(i=1Ai)P \left ( \bigcup _{i=1}^{ \infty }A_{i}\right)

任意一个满足上述条件的函数 PP 都可以作为样本空间 ΩΩ 的概率函数,称函数值 P(A)P(A)ΩΩ 中事件 AA 的概率。

条件概率与独立性

当某事件已经发生时,一些随机事件的概率会因为已知信息的增加发生变化。研究在某些已知条件下事件发生的概率是必要的。

条件概率:若已知事件 AA 发生,在此条件下事件 BB 发生的概率称为 条件概率,记作 P(BA)P(B|A).

若事件 AA 满足 P(A)>0P(A) > 0 ,则条件概率 P(BA)P(B|A) 定义为 P(BA)=P(AB)P(A)P(B|A)=\frac{P(AB)}{P(A)} .

根据定义式可以推出下面两个等式:

  • 概率乘法公式: 若 P(A)>0P(A) > 0,则对任意事件 BB 都有 P(AB)=P(A)P(BA)P(AB)=P(A)P(B|A)
  • 全概率公式:若一组事件 A1,,AnA_1, \cdots, A_n 两两不交且和为 Ω\Omega ,则对任意事件 BB 都有
  • P(B)=i=1nP(Ai)P(BAi)P(B)=\sum_{i=1}^{n}P(A_i)P(B|A_i)

贝叶斯公式

一般来说,设可能导致事件 BB 发生的原因为 A1,A2,,AnA_1, A_2, \cdots, A_n ,则在 P(Ai)P(A_i)P(BAi)P(B|A_i) 已知时可以通过全概率公式计算事件 BB 发生的概率。但在很多情况下,我们需要根据「事件 BB 发生」这一结果反推其各个原因事件的发生概率。于是有

$$P(A_i|B)=\frac{P(A_iB)}{P(B)}=\frac{P(A_i)P(B|A_i)}{\sum_{j=1}^{n}P(A_j)P(B|A_j)} $$

上式即贝叶斯公式( Bayes 公式)。

多数情况,AA 是原因,现在知道结果 BB 发生的概率,反过来求 AA 发生的概率,使用条件概率公式直接推导:

$$P(A|B)=\frac{P(A \bigcap B)}{P(B)}=\frac{P(B|A)P(A)}{P(B)} $$

这在实际生活中非常有用。假设某种疾病在一般人群中发病率是 0.01%0.01\% ,而某种检测方式可以检测这种疾病,如果某人患病,则检测阳性的概率是 99%99\% ; 如果没有患病,则检测出阳性的概率是 1%1\% 。现在某人检测阳性,问他真的患上该病的概率?

分析: 常理来讲,患病有 99%99\% 的概率检测呈阳性,且健康人被检测出阳性的概率只有 1%1\% ,我们会不假思索就认为这人真患病的可能性大。但是计算一下:

P(患病检测阳性)=P(检测阳性患病)P(患病)P(检测阳性)P(患病|检测阳性)=\frac{P(检测阳性|患病)P(患病)}{P(检测阳性)}
$=\frac{99\% \times 0.01\%}{99\%\times0.01\%+1\% \times 99.99\%}$
0.0098\approx 0.0098

原来真的患病概率还不到 1%1\% ,这是该检验方法过高的假阳性率导致的。 上面的计算中对分母的处理方式,即认为 P(检测阳性)=P(检测阳性且患病)+P(检测阳性且不患病)P(检测阳性)=P(检测阳性且患病)+P(检测阳性且不患病) 是没有问题的,因为患病和不患病是互斥事件。事实上,我们经常使用这种方式来计算贝叶斯公式中的分母。

概率计算总结

事件 概率
AA P(A)[0,1]P(A)\in [0,1]
A非A P(Aˉ)=1P(A)P(\bar{A})=1-P(A)
ABA或B P(AB)=P(A)+P(B)P(AB)P(A\bigcup B)=P(A)+P(B)-P(A \bigcap B) AB互斥,P(AB)=P(A)+P(B)A与B 互斥,P(A\bigcup B)=P(A)+P(B)
ABA和B P(AB)=P(A)P(BA)=P(B)P(AB)P(A \bigcap B)=P(A)P(B|A)=P(B)P(A|B) AB独立,P(AB)=P(A)P(B)A和B独立,P(A\bigcap B)=P(A)P(B)
B发生的情况下A发生的概率B发生的情况下A发生的概率 P(AB)=P(AB)P(B)P(A|B)=\frac{P(A \bigcap B)}{P(B)}=P(BA)P(A)P(B)\frac{P(B|A)P(A)}{P(B)}

习题1: 请解决以下和事件相关的问题

  1. 连续抛两次骰子,每个骰子出现点数 1166 的可能性相等。请写出“点数之和为 1010 ”这个事件包括的所有基本事件。

  2. 111010 中等概率选取一个数,请写出“取出的数是质数”这个事件所包含的所有样本点。

  3. 今有甲乙丙三人,心里随便想一个自然数,想出一个奇数或者一个偶数的可能性相同,然后报出来。关注他们三个人想的数的奇偶性,请写出“甲想的数的奇偶性与乙相同”这个事件所包含的全部基本事件。

习题2:

根据事件的运算原理,请思考以下问题,可以举一些例子来验证你的判断。

  1. 互斥事件一定是对立事件吗?
  2. 对立事件一定互斥吗?
  3. 如果 A,BA,B 互斥,那么 Aˉ\bar{A}BB 是否一定不互斥?
  4. 交运算是否符合交换律、结合律?
  5. 并运算是否符合交换律、结合律?
  6. A(BC)A\bigcup (B\bigcap C) 是否等于 (AB)(AC)(A\bigcup B)\bigcap(A\bigcup C)
  7. A(BC)A\bigcap (B\bigcup C) 是否等于 (AB)(AC)(A\bigcap B)\bigcup(A\bigcap C)
  8. ABA\bigcap B 是否等于 A+AˉBA+\bar{A}B ?
  9. AA 是否等于 AB+ABˉAB+A\bar{B} ?

习题3:计算以下概率期望相关的题目

  1. (NOIP2017 普及组初赛)一家四口人,至少两个人生日属于同一个月份的概率是()。(假定每个人生日属于每个月份的概率相同且不同人之间相互独立)。

  2. (NOIP2017 提高组初赛)小明要去南美洲旅游,一共乘坐三趟航班才能到达目的地,其中第 11 个航班准点的概率是 0.90.9,第 22 个航班准点的概率是 0.80.8 ,第 33 个航班准点概率为 0.90.9 。如果存在第 ii 个(i=1,2i=1,2)航班晚点,第 i+1i+1 个航班准点,则小明将赶不上第 i+1i+1 个航班,旅行失败;除了这种情况,其他情况下旅行都能成功。请问小明此次旅行成功的概率是()。

  3. (NOIP2017 提高组初赛)儿童游乐场有个游戏叫“欢乐喷泉”,正方形场地中心能不断喷出彩色乒乓球,以场地中心为圆心还有一个圆形轨道,轨道上有一列小火车匀速运动,火车有六节车厢,如下图所示。

    假设乒乓球等概率落到正方形场地的每个地点,包括火车车厢。小朋友玩这个游戏时,只能坐在同一个火车车厢里,可以在自己的车厢里捡落在该车厢内的所有乒乓球,每个人每次游戏有三分钟时间,则一个小朋友独自玩一次游戏期望可以得到( )个乒乓球。假设乒乓球喷出的速度为 22 个/秒,每节车厢的面积是整个场地面积的 120\frac{1}{20}

  1. (NOIP2018 提高组初赛)假设一台抽奖机中有红、蓝两色的球,任意时刻按下抽奖按钮,都会等概率获得红球或篮球之一。有足够多的人每人都用这台抽奖机抽奖,假如他们的策略均为:抽中蓝球则继续抽球,抽中红球则停止。最后每个人都把自己获得的所有球放到一个大箱子里,最终大箱子里的红球和篮球比例接近于( )。

  2. (NOIP2018提高组初赛)在一条长度为 11 的线段上随机取两个点,则以这两个点为端点的线段的期望长度是( )。


学习完毕

{{ select(1) }}

  • YES
  • NO