第1章 概率论的基本概念
概率论与数理统计是研究和探索客观世界中随机现象的统计规律性的一门数学学科,与其他学科有着紧密的联系,并在社会经济各个领域有广泛的应用.本章重点介绍概率论中的基本概念,如随机事件、样本空间、概率等,它们是学习概率论与数理统计的基础.
1.1 随机事件与样本空间
1.1.1 随机现象及其统计规律性
在自然界和社会生活中,存在着两类不同的现象:必然现象和随机现象,它们是从其结果能否准确预知的角度来区分的.必然现象是在一定条件下,必然发生(或必然不发生),并能准确预知其结果的现象.例如:在一个标准大气压下,水在100℃沸腾;太阳每天都从东边升起;在地面上竖直上抛的石子一定下落等.随机现象是指在相同条件下重复进行时事先无法预知其结果的现象.例如:在相同条件下抛掷同一枚硬币,可能出现标明硬币价值的“数字面”(记为“正面”)朝上,也可能另一面(记为“反面”)朝上,而每次在抛掷这枚硬币之前,都无法预知会出现“正面朝上”还是“反面朝上”的结果;记录一天内来某医院就诊的人数,可能是任意非负整数,但事先无法预知其确切数字;某人买彩票,可能中奖,也可能不中奖,但买之前无法预知是否中奖等.
对于随机现象的结果,虽然无法预测,但并不是完全无规律可循.例如:多次重复抛掷一枚硬币,得到“正面朝上”的结果大致有一半;一天内到某医院就诊的人数按照一定规律分布;等等.可见,虽然随机现象在个别试验或观察中会出现不确定的结果,但在大量重复试验或观察中,其结果具有某种规律性,这种规律性称为随机现象的统计规律性.
1.1.2 随机试验与样本空间
为了研究随机现象的统计规律性,需要对客观事物进行观察或试验,下面是一些观察或试验的例子.
E1:抛掷一枚骰子,观察出现的点数.
E2:抛掷一枚骰子两次,观察出现的点数.
E3:抛掷一枚骰子两次,观察出现的点数之和.
E4:记录某火车站售票处一天内售出的车票数.
E5:在一批日光灯管中任意抽取一只,测试它的使用寿命.
仔细分析,可以发现上述观察或试验具有以下共同的特点:
(1)可以在相同的条件下重复地进行;
(2)每次试验的结果不止一个,并且能事先明确试验的所有可能结果;
(3)进行一次试验之前不能确定哪一个结果会出现.
一般地,将具有以上三个特点的观察或试验称为随机试验,记为,本书之后提到的试验都是指随机试验.
将随机试验所有可能结果构成的集合称为试验的样本空间,记为.样本空间里的元素,即随机试验的每个可能结果,称为样本点,记为.
例如,上面个随机试验的样本空间分别为
n是售票处一天内准备出售的车票数;
t表示日光灯管的使用寿命.
注意:样本空间的元素是由试验的目的所确定的.例如,在随机试验和中同是将一枚骰子抛掷两次,但由于试验的目的不一样,其对应的样本空间和也不一样.
1.1.3 随机事件
在进行随机试验时,人们常常只关心满足某些条件的样本点构成的集合.例如,在观测日光灯管的使用寿命的随机试验中,自然希望灯管的使用寿命越长越好,比如寿命是否大于1000h,即是否有,满足这一条件的样本点构成样本空间的一个子集,这样的子集常常是我们*关心的.
一般地,将随机试验的样本空间的子集称为试验的随机事件,简称事件,常用大写字母等表示.在每次试验中,当且仅当这一子集中的一个样本点出现时,则称这一事件发生.例如,在随机试验中随机抽一个灯管,测得其使用寿命为1100h,那么就说在这次试验中事件发生了,否则就称事件没有发生.
一个样本空间能构成多个事件,在中“出现的点数是奇数”的事件,“出现大点”的事件;在中“第一次出现的点数是1”的事件;“点数之和是7点”的事件等.
随机试验中有三个特殊的事件:由一个样本点构成的单点集,称为基本事件,例如试验有6个基本事件,试验有11个基本事件;样本空间包含了所有的样本点,它可以看作是自身的子集,且在每次试验中都必然发生,所以称为必然事件,之后所说的必然事件即是指样本空间;空集不包含任何样本点,它也是的子集,但在每次试验中都不会发生,称为不可能事件,例如试验中,掷一个骰子出现7点就是一个不可能事件.
1.1.4 事件的关系与运算
在同一样本空间中,往往存在多个随机事件,数学上一个基本的思想方法是通过对较简单事件的分析,去了解较复杂的事件.因此,需要研究各个事件之间的关系和运算.
因为样本空间、随机事件都是集合,所以随机事件之间的关系和运算同集合之间的关系和运算是一致的.下面根据“事件发生”的含义,给出这些关系和运算在概率论中的提法.
设随机试验的样本空间为,而是的子集.
1.事件的包含
若事件发生必然导致事件发生,则称事件包含事件,记为.即属于事件的每一个样本点均属于事件.
2.事件的相等
若事件发生必然导致事件发生,且若事件发生也必然导致事件发生,则称事件与事件相等,记为,这表明事件与事件所包含的样本点完全相同,即且.
3.事件的和(并)
将“事件与事件至少有一个发生”的事件,称为事件与事件的和(并),记为.它是由属于或的所有样本点构成的集合:
一般地,事件的和(并)可以推广到多个事件的情形:称为个事件的和(并)事件;称为可列个事件的和(并)事件.和(并)事件表示“中至少有一个发生”.
4.事件的交(积)
将“事件与事件同时发生”的事件,称为事件与事件的交(积)事件,记为或.它是由既属于又属于的样本点构成的子集:
类似地,称为个事件的交(积)事件;称为可列个事件的交(积)事件.事件表示“同时发生”.
5.事件的差
将“事件发生而事件不发生”的事件,称为事件与事件的差事件,记为.它表示由属于但不属于的样本点构成的子集:
6.事件的互不相容(或互斥)
若事件与事件不能同时发生,即,则称事件与事件互不相容(或互斥).它表明事件与事件没有相同的样本点.
7.对立事件(或逆事件)
若,且,则称事件与事件互为对立事件(或互为逆事件).它表明对每次试验而言,事件,必有一个且仅有一个发生.事件的对立事件记为,.
上述事件的各种关系和运算可用韦氏图直观地表示,如图1-1所示.
图1-1 事件关系与运算关系韦氏图
事件运算经常用到下述运算规律.设为事件,则有如下运算规律.
交换律:
结合律:
分配律:
德摩根律:
以上这些运算规律都可以推广到任意多个事件中去.下面只对德摩根律给出“事件发生”含义下的证明:
第一式:
左边表示中至少有一个发生,那么它的对立事件表示都不发生;而右边恰好表示都不发生,所以有.
第二式:
左边表示同时发生,那么它的对立事件表示A,B中至少有一个不会发生;而右边表示中至少有一个不会发生,所以有.
例1.1.1 设有甲、乙、丙三人参加某项测试,记为事件“甲参加该项测试合格”,为事件“乙参加该项测试合格”,为事件“丙参加该项测试合格”.试用的运算关系表示以下各事件:
(1)三人中只有甲合格;
(2)三人中仅有一人合格;
(3)三人中至少有一人合格;
(4)三人都合格.
解(1);
(2);
(3);
(4).
1.2 频率与概率
对于一个事件(除必然事件和不可能事件外)来说,它在一次试验中可能发生,也可能不发生.人们常常关注某些事件发生的可能性究竟有多大,希望找到一个合适的数来度量事件在一次试验中发生的可能性大小,这就是概率的概念.本节先从频率的定义出发,再给出概率的公理化定义,*后探讨概率的性质.
1.2.1 频率的定义
随机现象的统计规律是以大量重复试验为前提的,为此,首先引入频率及其稳定性的概念.
定义1.2.1在相同条件下,重复做次试验,在这次试验中,事件发生的次数称为事件发生的频数,称比值为事件发生的频率,并记为,即
(1-1)
由定义易知频率具有下列基本性质:
(1)对任意事件,有;
(2);
(3)若是两两不相容的事件,则
例1.2.1 考察“抛掷硬币试验”,将一枚硬币抛掷5次、50次、500次,各做6遍,得到数据如表1-1所示[其中表示“硬币正面朝上”(设为事件)发生的频数,表示发生的频率].
表1-1 抛掷硬币试验数据表
由表1-1中数据可以看出,虽然对于同样的试验次数,不尽相同,但当试验次数较大时,频率在0.5附近摆动,且随着的增加,它逐步稳定在0.5这个数值上.
大量试验证实,当试验的次数逐渐增大时,频率呈现出稳定性,这种“频率的稳定性”就是通常所说的统计规律性.更进一步,不妨大量重复做试验,这时频率趋于某一个稳定的常数(例1.2.1中),显然用常数来度量事件发生可能性的大小是合理的,从而引出概率的公理化定义.
1.2.2 概率的公理化定义
定义1.2.2(概率的公理化定义)设是随机试验的样本空间,对于上的每一事件规定一个实数与之对应,若集合函数满足下列三个公理条件:
(1)非负性;
(2)规范性;
(3)可列可加性,对任意可列个两两互不相容的事件有
则称为事件A的概率.
事件概率的公理化定义可以看成是事件频率定义的极限形式,它是频率定义的自然延伸,在第5章会证明,当时频率在一定意义下收敛于概率.
1.2.3 概率的性质
由概率定义的三个公理条件,可以推导出概率的一些重要性质:
性质1.2.1不可能事件的概率为,即.
证因为,由定义1.2.2的条件(2)和(3)有
所以
性质1.2.2(有限可加性)设事件是两两互不相容的,则有
证因为
而是可列个互不相容事件,由可列可加性和性质1.2.1,有
性质1.2.3对任意事件,有
证因为且,由性质1.2.2有
即
性质1.2.4对任意事件,有
特别地,若,则.
证由于而,所以由性质1.2.2,知
展开