#edu2013. 概率基本概念
概率基本概念
在讨论概率之前,有必要对事件做一点了解。随机试验指的是在相同的条件下,对某个随机现象进行大量重复观测。随机试验可以在相同条件下重复进行;随机试验出现的所有可能结果不止一个,但都事先已知;每次实验总是出现可能的结果之一,但实验前无法预知得到哪一种结果。
抛硬币是随机试验,因为可以重复抛这枚硬币很多次;可能的实验结果是“正面朝上”或“反面朝上”,不存在其他结果;每次抛硬币前所有人都不知道这次是正面朝上,还是反面朝上。生孩子也可以视为随机试验。
样本空间、随机事件
抛硬币有正面、反面朝上两种结果。生孩子有男、女两种结果。一个随机实验中可能发生的不能再细分的结果被称为基本事件,也称为样本点,通常用 来表示。所有样本点的集合称为样本空间,通常用 来表示。
将一枚硬币连续抛两次,一共四种可能:正正、正反、反正、反反。于是写出基本事件(样本点):
样本空间就是上述所有样本点的集合有 .
随机试验出现的结果并不保证是有限的。例如,在区间 中随机取一个点,每一个实数都对应一个基本事件;样本空间是 , 是无限的,其中的样本个数比所有自然数的个数还要多!
基本事件(样本点)是概率论中的“原子”,可以构建出其他事件。例如,抛两次硬币,“其中有一次正面朝上”,它就包含了两个事件 ;从区间 取数,“取出的数小于 0.5 ” ,也包含了无穷个基本事件。
为了刻画这些“包含了很多个基本事件的事件,定义随机事件的概念:随机事件 是样本空间 的一个子集。当且仅当 中的某个基本事件发生,说事件 发生。
一个 随机事件 是样本空间 的子集,它由若干样本点构成,用大写字母 表示。
- 若 ,则称 A 是必然事件
- 若 , 则称 A 是不可能事件
事件的关系
两个随机事件之间可以有各种各样的关系。
-
包含关系:通常用符号 表示。一个事件 包含另一个事件 记作: 。这时只要事件 发生,那么事件 也一定发生。这个关系其实就是集合论中的包含关系。
-
等价关系:两个事件对应的子集完全相等,记作 。
-
对立关系:两个事件只能有一个发生,并且必然有一个发生,则它们是对立关系。这种关系对应的集合论术语是“补集”。
-
互斥关系:两个事件只能有一个发生,但并不必然有一个发生。这时也称两个事件之间是互不相容的。
特别需要注意区别独立事件:
独立事件
如果两个事件同时发生的概率等于它们各自发生的概率的乘积,那么就称这两个事件是相互独立的。比如说,“抽到的牌是红桃”和“抽到的牌数字是4”就是相互独立的。独立事件强调两个事件之间没有关联,互不影响。
独立事件与互斥事件不同:
- 若 ,则事件 和事件 为相互独立事件
- 若 为互斥事件,则 ,则 同时发生的可能性为 , 若 为互斥事件, 和 发生的概率
事件的运算
由于我们将随机事件定义为了样本空间 的子集,故我们可以将集合的运算(如交、并、补等)移植到随机事件上。记号与集合运算保持一致。
-
事件 :是事件 和事件 的和事件(并事件),指的是事件“事件 发生或者事件 发生”。
-
事件 :是事件 和事件 的积事件(交事件),指的是事件“事件 发生且事件 发生”。
-
事件 :是事件 和事件 的差事件,指的是事件“事件 发生且事件 不发生”。
特别的,事件的并 也可记作 ,事件的交 也可记作 ,此时也可分别称作 和事件 和 积事件。
集合的交和并运算,是可以通过补运算来相互转化的。这就是大名鼎鼎的摩根定律:
在概率运算时,还有:
- :指的是“设 与 为样本空间 中的两个事件,其中 。那么在事件 发生的条件下,事件 发生的条件概率”
概率
概率,是对随机事件发生之可能性的度量,为数学概率论的基本概念;概率的值是一个在 到 之间的实数,也常以百分数来表示。
古典定义
在概率论早期实践中,由于涉及到的随机现象都比较简单,具体表现为样本空间 是有限集,且直观上所有样本点是等可能出现的,因此人们便总结出了下述定义:
如果一个随机试验满足:
- 只有有限个基本结果;
- 每个基本结果出现的可能性是一样的;
那么对于每个事件 的概率定义为:
后来人们发现这一定义可以直接推广到 无限的一部分情景中,于是就有了所谓 几何概型。
公理化定义
古典概率定义存在循环定义。上述基于直观认识的定义在逻辑上有一个很大的漏洞:在定义「概率」这一概念时用到了「可能性」这一说法,产生了循环定义的问题。同时「等可能」在样本空间无限时会产生歧义,由此产生了包括 Bertrand 悖论 在内的一系列问题。
经过不断探索,苏联数学家柯尔莫哥洛夫于 1933 年在他的《概率论基础》一书中第一次给出了概率的公理化定义:
设随机事件的样本空间为 , 的一个子集称为事件。对于 中的每一个事件 ,都有实函数 ,满足:
- 非负性:
- 规范性:
- 可数可加性:对可数个两两互斥事件 有:
任意一个满足上述条件的函数 都可以作为样本空间 的概率函数,称函数值 为 中事件 的概率。
条件概率与独立性
当某事件已经发生时,一些随机事件的概率会因为已知信息的增加发生变化。研究在某些已知条件下事件发生的概率是必要的。
条件概率:若已知事件 发生,在此条件下事件 发生的概率称为 条件概率,记作 .
若事件 满足 ,则条件概率 定义为 .
根据定义式可以推出下面两个等式:
- 概率乘法公式: 若 ,则对任意事件 都有
- 全概率公式:若一组事件 两两不交且和为 ,则对任意事件 都有
贝叶斯公式
一般来说,设可能导致事件 发生的原因为 ,则在 和 已知时可以通过全概率公式计算事件 发生的概率。但在很多情况下,我们需要根据「事件 发生」这一结果反推其各个原因事件的发生概率。于是有
$$P(A_i|B)=\frac{P(A_iB)}{P(B)}=\frac{P(A_i)P(B|A_i)}{\sum_{j=1}^{n}P(A_j)P(B|A_j)} $$上式即贝叶斯公式( Bayes 公式)。
多数情况, 是原因,现在知道结果 发生的概率,反过来求 发生的概率,使用条件概率公式直接推导:
$$P(A|B)=\frac{P(A \bigcap B)}{P(B)}=\frac{P(B|A)P(A)}{P(B)} $$这在实际生活中非常有用。假设某种疾病在一般人群中发病率是 ,而某种检测方式可以检测这种疾病,如果某人患病,则检测阳性的概率是 ; 如果没有患病,则检测出阳性的概率是 。现在某人检测阳性,问他真的患上该病的概率?
分析: 常理来讲,患病有 的概率检测呈阳性,且健康人被检测出阳性的概率只有 ,我们会不假思索就认为这人真患病的可能性大。但是计算一下:
$=\frac{99\% \times 0.01\%}{99\%\times0.01\%+1\% \times 99.99\%}$
原来真的患病概率还不到 ,这是该检验方法过高的假阳性率导致的。 上面的计算中对分母的处理方式,即认为 是没有问题的,因为患病和不患病是互斥事件。事实上,我们经常使用这种方式来计算贝叶斯公式中的分母。
概率计算总结
事件 | 概率 |
---|---|
= |
习题1: 请解决以下和事件相关的问题
-
连续抛两次骰子,每个骰子出现点数 到 的可能性相等。请写出“点数之和为 ”这个事件包括的所有基本事件。
-
从 到 中等概率选取一个数,请写出“取出的数是质数”这个事件所包含的所有样本点。
-
今有甲乙丙三人,心里随便想一个自然数,想出一个奇数或者一个偶数的可能性相同,然后报出来。关注他们三个人想的数的奇偶性,请写出“甲想的数的奇偶性与乙相同”这个事件所包含的全部基本事件。
习题2:
根据事件的运算原理,请思考以下问题,可以举一些例子来验证你的判断。
- 互斥事件一定是对立事件吗?
- 对立事件一定互斥吗?
- 如果 互斥,那么 与 是否一定不互斥?
- 交运算是否符合交换律、结合律?
- 并运算是否符合交换律、结合律?
- 是否等于 ?
- 是否等于
- 是否等于 ?
- 是否等于 ?
习题3:计算以下概率期望相关的题目
-
(NOIP2017 普及组初赛)一家四口人,至少两个人生日属于同一个月份的概率是()。(假定每个人生日属于每个月份的概率相同且不同人之间相互独立)。
-
(NOIP2017 提高组初赛)小明要去南美洲旅游,一共乘坐三趟航班才能到达目的地,其中第 个航班准点的概率是 ,第 个航班准点的概率是 ,第 个航班准点概率为 。如果存在第 个()航班晚点,第 个航班准点,则小明将赶不上第 个航班,旅行失败;除了这种情况,其他情况下旅行都能成功。请问小明此次旅行成功的概率是()。
-
(NOIP2017 提高组初赛)儿童游乐场有个游戏叫“欢乐喷泉”,正方形场地中心能不断喷出彩色乒乓球,以场地中心为圆心还有一个圆形轨道,轨道上有一列小火车匀速运动,火车有六节车厢,如下图所示。
假设乒乓球等概率落到正方形场地的每个地点,包括火车车厢。小朋友玩这个游戏时,只能坐在同一个火车车厢里,可以在自己的车厢里捡落在该车厢内的所有乒乓球,每个人每次游戏有三分钟时间,则一个小朋友独自玩一次游戏期望可以得到( )个乒乓球。假设乒乓球喷出的速度为 个/秒,每节车厢的面积是整个场地面积的 。
-
(NOIP2018 提高组初赛)假设一台抽奖机中有红、蓝两色的球,任意时刻按下抽奖按钮,都会等概率获得红球或篮球之一。有足够多的人每人都用这台抽奖机抽奖,假如他们的策略均为:抽中蓝球则继续抽球,抽中红球则停止。最后每个人都把自己获得的所有球放到一个大箱子里,最终大箱子里的红球和篮球比例接近于( )。
-
(NOIP2018提高组初赛)在一条长度为 的线段上随机取两个点,则以这两个点为端点的线段的期望长度是( )。
学习完毕
{{ select(1) }}
- YES
- NO