第一章 抽样分布
与概率论一样,数理统计也是研究随机现象统计规律性的一门数学学科.概率论研究的基本内容是:在已知随机变量分布的情况下,着重讨论了随机变量的性质.但是对一个具体的随机变量来说,如何判断它服从某种分布?如果知道它服从某种分布又该如何确定它的各个参数?对于这些问题在概率论中都没有涉及,它们都是数理统计所要研究的内容,并且这些问题的研究都直接或间接建立在试验的基础上.数理统计学是利用概率论的理论对所要研究的随机现象进行多次的观察或试验研究如何合理地获得数据,如何对所获得的数据进行整理、分析如何对所关心的问题作出估计或判断的一门数学学科.其内容非常丰富.一般可分为两大类:一类是试验的设计与研究,一类是统计推断.我们着重讨论统计推断.
本章最先介绍数理统计的基本概念,然后介绍多元正态分布与正态二次型,最后介绍有关抽样分布的几个定理,为以后各章作必要的准备.
§1.1 基本概念、顺序统计量与经验分布函数
1.1.1 基本概念
总体、个体、样本是数理统计学中三个最基本的概念.我们称研究对象的全体为总体或母体.称组成总体的每个单元为个体.从总体中随机抽取n个个体,称这n个个体为容量是n的样本.
例如,为了研究某厂生产的一批灯泡质量的好坏,规定使用寿命低于1000小时的为次品.则该批灯泡的全体就为总体,每个灯泡就是个体.实际上,数理统计学中的总体是指与总体相联系的某个(或某几个)数量指标取值的全体.比如,该批灯泡的使用寿命的取值全体就是研究对象的总体.由于对不同的个体!取不同的值,且事先无法准确预言,所以n是随机变量,这时,我们就称的概率分布或更简单地就称为总体.为了判断该批灯泡的次品率,最精确的办法是把每个灯泡的寿命都测出来.然而,寿命试验是破坏性试验(即使试验是非破坏性的,由于试验要花费人力、物力和时间),我们只能从总体中抽取一部分,比如说,n个个体进行试验.试验结果可得一组数值,其中每个是一次抽样观察的结果.由于我们要根据这些观察结果对总体进行推断,所以对每次抽取就有一定的要求,要求每次抽取必须是随机的、独立的,这样才能较好地反映总体情况.所谓随机的是指每个个体被抽到的机会是均等的,这样抽到的个体才具有代表性.所谓独立的是指每次抽取之后不能改变总体的成分.这就要求:如果试验是非破坏性的且总体是有限的,抽取应该是有放回的;如果试验是破坏性的总体应该是无限的或是很大的.基于上述思想的抽样方法称为样.用简单随机抽样方法抽取!个个体进行试验,其结果是确定的一组,但是这组数值是随着每次抽样而改变的.因此实际上是一个n维随机向量的一次观察值.即在试验之前,实际上是随机向量.又因抽样是随机的、独立的,所以,n是相互独立的n个随机变量,且每个都与总体,同分布.我们称,或为总体,简称为(如无特别说明我们今后只讨论简单随机样本,称n个样本的所有可能的观察值组成的集合文称为,它是n维空间或其一个子集.这样样本的一次观察值,就是样本空间n中的一个点,即.
由于对总体进行统计推断的依据是样本提供的信息,然而样本是n维随机变量或n个随机变量,讨论起来很不方便.人们自然会想到能否用样本的函数代替样本对总体进行统计推断.当然,这个函数不能太任意了,最好是一个随机变量,这样使用起来才方便;同时这个函数中不能含有任何未知参数.由此我们引入如下定义.
定义1.1.1 设为总体,的样本,样本空间n上的实值(波雷尔可测)函数.如果中不包含任何未知参数则称为一个统计量.
例1.1.1 设为总体,的样本,记
(1.1.1)
则称与S分别为样本的均值、方差与标准差.它们都是统计量.当存在有限时,显然有
(1.1.2)
因此可用来估计,用估计.
当的观察值为(X1,X2, ,Xn)时,记,的观察值分别为即
(1.1.3)
注意:统计量中不會旨包含任何未知参数.例如,设总体(a,a2),其中都是未知参数.设为的样本,则与都不是统计量,而与n都是统计量.
定义1.1.2 设为总体的样本,记
(1.1.4)
则称分别为样本的r阶原点矩与r阶中心矩.显然,且A,都是统计量.
定义1.1.3 设,为二维总体的样本,记
(1.1.5)
(1.1.6)
则称分别为二维样本的协方差与二维样本的相关系数显然有
(1.1.7)
设为总体n的特征函数,n为总体n的样本,则样本均值的特征
数
(1.1.8)
利用上式与特征函数的唯一性定理,由总体的分布常可求得的分布.例如,设为总体的样本,因为有
从而样本均值#的特征函数为
此为正态分布特征函数,由特征函数唯一性定理知
1.1.2 顺序统计量
定义1.1.4 设为总体n的样本,现由样本建立n个函数:其中为这样的统计量,其观察值为,而为样本的观察值X1,X2, ,Xn按递增次序排列成后的第3个数值.为样本的顺序统计量或次序统计量.称知为样本的第k个顺序统计量.实际上是样本,中第3个最小的样品.显然有
(1.1.9)
(1.1.10)
(1.1.11)
则称为样本中位数(中值).称为样本极差.样本中位数的基本思想是把样本分为两个相等的部分(大数部分与小数部分),而样本中位数是分界线.样本极差是样本中最大值与最小值之差,它反映样本观察值波动程度,它与样本标准差—样反映观察值的离散程度.
设F(X)为总体(的分布函数,由文献[21]中定理2.7.6的推论1知的分布函数分别为
(1.1.12)
如果总体(为连续型随机变量且有密度函数,则为连续型随机变量,其密度函数分别为
(1.1.13)
由文献[21]中定理2.7.7知的联合分布函数为
(1.1.14)
如果总体(为连续型的且有密度,则)为二维连续型随机向量,其密度
(1.1.15)
从而极差,(1)有密度
(1.1.16)
当总体时,记为相应样本极差,且记.由式(1.1.16)可计算出与的值(见表1.1.1).当总体时,设!为其样本极差,令
则为总体的样本.记为样本的极差,则
故
从而
所以,我们可用来估计正态总体标准差将用估计与用S来估计进行比较,当n<10时,其效率相当高;然而当n>10时,其效率迅速下降.为提高效率,当n>10时,可随机地把样本观察值分成每组只有少数几个(最好5个)样品的若干组,然后由各组分别估计",最后再取平均值.
1.1.3 经验分布函数
定义1.1.5 设为总体的样本为样本的顺序统计量.对任意实数,记
(1.1.17)
则称为总体,的经验分布函数.是分段函数不便于使用,为此引入单位阶跃函数
(1.1.18)
则式(1.1.17)可改写为
(1.1.19)
表示于的那些样k的个数.因为对样本,的任一观察值是X的单调不减、左连续函数,且
所以是分布函数,其图形如图1-1所示.
图1-1
由式(1.1.19)知,对固定的X,Fn(X)是样本,的函数.又因,独立同分布
目录
序
第二版序
第一版序
第一章 抽样分布 1
§1.1 基本概念、顺序统计量与经验分布函数 1
1.1.1 基本概念 1
1.1.2 顺序统计量 3
1.1.3 经验分布函数 6
1.1.4 几个重要分布 8
§1.2 多元正态分布与正态二次型 11
§1.3 抽样分布定理 18
§1.4 分位数 21
习题一 23
第二章 参数估计 28
§2.1 点估计常用方法 28
2.1.1 矩法 28
2.1.2 极大似然法 30
§2.2 评价估计量好坏的标准 34
2.2.1 无偏性与有效性 34
2.2.2 一致*小方差无偏估计量 42
2.2.3 —致性(相合性)45
§2.3* 充分性与完备性 46
2.3.1 充分性 47
2.3.2 完备性 50
§2.4 区间估计 54
2.4.1 一个正态总体的情况 55
2.4.2 两个正态总体的情况 58
2.4.3 指数分布与0—1分布参数的区间估计 62
§2.5 贝叶斯(Bayes)估计 64
2.5.1 决策论的基本概念 64
2.5.2 *大风险*小化估计 66
2.5.3 后验分布 68
2.5.4 贝叶斯估计 68
2.5.5 先验分布的选取 73
2.5.6 *大后验估计 77
2.5.7 贝叶斯区间估计 78
2.5.8 离散型分布中参数的贝叶斯估计与极大似然估计 80
§2.6 截尾寿命试验中指数分布和几何分布的参数估计 88
2.6.1 指数分布中参数的点估计 88
2.6.2 指数分布中参数的区间估计 92
2.6.3 指数分布参数A的贝叶斯估计 93
2.6.4 几何分布中参数g的估计 94
习题二 97
第三章 假设检验 105
§3.1 假设检验的基本思想与基本概念 105
§3.2 参数假设检验 109
3.2.1 单个正态总体均值的假设检验 110
3.2.2 单个正态总体方差的假设检验 116
3.2.3 两个正态总体均值的假设检验 120
3.2.4 两个正态总体方差的假设检验 124
3.2.5 广义似然比检验 131
3.2.6* 似然比检验 134
3.2.7 指数分布中参数A的假设检验 135
3.2.8 截尾试验中指数分布参数的假设检验 137
§3.3 非参数假设检验 138
3.3.1 分布函数的拟合检验 138
3.3.2 两总体之间关系的假设检验 148
3.3.3 伯努利过程与泊松过程的检验 156
§3.4* 一致*优势检验 158
3.4.1 势函数 159
3.4.2 奈曼-皮尔逊基本引理 161
§3.5* 质量控制 166
3.5.1 验收抽样方案的制订 167
3.5.2 计量控制 170
3.5.3 计件控制与计点控制 173
习题三 175
第四章 方差分析与正交试验设计 180
§4.1 单因素方差分析 180
4.1.1 数学模型 180
4.1.2 方差分析 181
§4.2* 双因素方差分析 186
4.2.1 数学模型 186
4.2.2 方差分析 187
§4.3 正交试验设计 193
4.3.1 正交表 193
4.3.2 正交表的分析 196
习题四 200
第五章 线性回归模型 202
§5.1 线性模型 202
§5.2 *小二乘法估计 205
5.2.1 β的*小二乘法估计 205
5.2.2 *小二乘法估计量的性质 207
5.2.3 例子 213
§5.3 检验、预测与控制 218
5.3.1 线性模型与回归系数的检验 218
5.3.2 预测与控制 222
§5.4 带有线性约束的线性回归模型 227
5.4.1 拉格朗日乘子法 228
5.4.2 知的性质 229
5.4.3 对假设H0:Hβ=d的检验 230
习题五 234
附录一 定理 2.6.2 的证明 239
附录二 定理 2.6.4 的证明 242
附录三 常用数理统计表 245
附录四 常见随机变量分布表 265
答案 268
参考文献 274
温馨提示:请使用罗湖图书馆的读者帐号和密码进行登录