政治学与国际关系论坛
标题:
下载:2005年概率原命题组概率负责人周概容老师2005考研概率讲义
[打印本页]
作者:
haohao2046
时间:
2006-3-25 16:40
标题:
下载:2005年概率原命题组概率负责人周概容老师2005考研概率讲义
提供附件下载清晰版!
第二贴是附件中的内容,欢迎下载!
涉及版权请及时与我联系!
作者:
haohao2046
时间:
2006-3-25 16:40
原命题组概率负责人周概容老师2005考研概率讲义
一、随机事件和概率
数学一、数学三和数学四的考试大纲、内容和要求完全一致.
Ⅰ 考试大纲要求
㈠ 考试内容
随机事件和样本空间 事件的关系与运算 完备事件组 概率的概念 概率的基本性质 古典型概率 几何型概率 条件概率 概率的基本公式 事件的独立性 独立重复试验
㈡ 考试要求 事件及其概率的基本概念、基本公式和求事件概率的方法.
1、了解基本事件空间(样本空间)的概念,理解随机事件的概念,掌握事件的关系和运算及其基本性质;
2、理解事件概率、条件概率的概念和独立性的概念;掌握概率的基本性质和基本运算公式;掌握与条件概率有关的三个基本公式(乘法公式、全概率公式和贝叶斯公式).
3、掌握计算事件概率的基本计算方法:
(1) 概率的直接计算:古典型概率和几何型概率;
(2) 概率的推算:利用概率的基本性质、基本公式和事件的独立性,由较简单事件的概率推算较复杂事件的概率.
(3) 利用概率分布:利用随机变量的概率分布计算有关事件的概率.
4、理解两个或多个(随机)试验的独立性的概念,理解独立重复试验,特别是伯努利试验的基本特点,以及重复伯努利试验中有关事件概率的计算.
Ⅱ 考试内容提要
㈠ 随机试验、随机事件与基本事件空间(样本空间)
随机试验——对随机现象观测;样本点(基本事件) ——试验最基本的结局,基本事件空间(样本空间) ——一切基本事件(样本点) 的集合.随机事件——随机现象的每一种状态或表现,随机试验结果;必然事件 ——每次试验都一定出现的事件,不可能事件 ——任何一次试验都不出现的事件.
事件常用前面几个大写拉丁字母 表示;有时用 表示事件,这时括号中用文字或式子描述事件的内容.
数学上,事件是基本事件(样本点)的集合;全集 表示必然事件,空集 表示不可能事件.任何事件A都可视为基本事件空间 的子集: .
㈡ 事件的关系和运算
1、定义 关系:包含,相等,相容,对立;运算:和(并)、差、交(积).
(1) 包含 ,读做“事件 包含 ”或“ 导致 ”,表示每当 出现B也一定出现.
(2) 相等 ,读做“事件 等于 ”或“ 与 等价”,表示 与 或同时出现,或同时不出现.
(3) 和 或 ,表示事件“ 与 至少出现一个”,称做事件“ 与 的和或并”;特别,
或
表示事件“ 至少出现一个”.
(4) 差 或 ,表示事件“ 出现但是 不出现”,称做 与 的差,或 减 .
(5) 交 或 ,表示事件“ 与 同时出现”,称做 与 的交或积;特别,
或
表示事件“ …, 同时出现”.
(6) 相容 若 ,则称事件“ 和 相容”;若 ,则称“事件 与 不相容”;
(7) 对立事件 称事件 和 互为对立事件,若 ,即 { 不出现}.
(8) 完备事件组 构成完备事件组,若
.
换句话说,如果有限个或可数个事件 两两不相容,并且“所有事件的和”是必然事件,则称它们构成完备事件组.
(9) 文氏图 事件的关系和运算可以用所谓文氏图形象地表示出来(见图1.1,题中的矩形表示必然事件 ).
A+B A-B AB
A B
图1.1 文氏图
2、事件运算的基本性质 对于任意事件A, B, C, ,有
(1) 交换律 .
(2) 结合律 ;
.
(3) 分配律 ;
.
(4) 对偶律
;
㈢ 概率的概念和基本性质
1、概率的概念 事件的概率——事件在随机试验中出现的可能性的数值度量.用 表示事件A的概率,用 表示事件 的概率.
事件B关于A的条件概率定义为
. (1.1)
2、概率的运算法则和基本公式
(1) 规范性 .
(2) 可加性 对于任意有限或可数个两两不相容事件 ,有
.
(3) 对立事件的概率 .
(4) 减法公式 .
(5) 加法公式 ;
(6) 乘法公式
(7) 全概率公式 设 构成完备事件组,则对于任意事件A,有
.
(8) 贝叶斯公式 设 构成完备事件组,则
.
㈣ 事件的独立性和独立试验
1、事件的独立性 若 ,则称事件 和 独立;若事件 之中任意m 个事件的交的概率都等于各事件概率的乘积,则称事件 相互独立.
2、事件的独立性的性质 若事件 相互独立,则其中
(1) 任意 个事件也相互独立;
(2) 任意一个事件,与其余任意 个事件运算仍独立;
(2) 将任意 个事件换成其对立事件后,所得 个事件仍独立.
3、独立试验 称试验 为相互独立的,如果分别与各个试验相联系的任意 个事件之间相互独立.
(1) 独立重复试验 独立表示“与各试验相联系的事件之间相互独立”,其中“重复”表示“每个事件在各次试验中出现的的概率不变”.
(2) 伯努利试验 只计“成功”和“失败”两种对立结局的试验,称做伯努利试验.将一伯努利试验独立地重复作 次,称做 次( 重)伯努利试验,亦简称伯努利试验.伯努利试验的特点是,1)只有两种对立的结局;2)各次试验相互独立;3)各次试验成功的概率相同.设 是 次伯努利试验成功的次数,则
. (1.2)
㈤ 事件的概率的计算
1、直接计算 古典型和几何型;
2、用频率估计概率 当 充分大时,用 次独立重复试验中事件出现的频率,估计在每次试验中事件的概率;
3、概率的推算 利用概率的性质、基本公式和事件的独立性,由简单事件的概率推算较复杂事件的概率;
4、利用概率分布 利用随机变量的概率分布,计算与随机变量相联系的事件的概率(见“二、随机变量及其分布”).
㈥ 随机抽样和随机分配 在概率计算中常要用到以下模型.
1、简单随机抽样 计算古典型概率时,需要计算基本事件的总数和事件包含的基本事件的个数.自有限总体的随机抽样模型有助于完成运算.设 含 个元素,称 为总体.自总体 的抽样称做简单随机抽样,如果各元素被抽到的可能性相同.有4种不同的简单随机抽样方式:
(1) 还原抽样 每次从 中随意抽取一个元素,并在抽取下一元素前将其原样放回 .
(2) 非还原抽样 凡是抽出的元素均不再放回 .
(3) 有序抽样 既考虑抽到何元素又考虑各元素出现的顺序.
(4) 无序抽样 只考虑抽到哪些元素不考虑各元素出现的顺序.
还原与非还原及有序与无序,这四种情形的组合产生四种不同的简单随机抽样方式.表1-1列出了在每种抽样方式下各种不同抽法(基本事件)的总数.
表1-1 四种抽样方式下不同抽法的总数
自含N个元素的总体 的n次简单随机抽样 抽样方式 不同抽法的总数
还原 有序
无序
非还原 有序
无序
2、随机分配 即将n个质点随机地分配到N个盒中,区分每盒最多可以容纳一个和可以容纳任意多个质点,以及质点可辨别和不可辨别等四种情形,对应四种分配方式.各种分配方式下不同分法的总数列入表1-2.
表1-2 四种分配方式下不同分法的总数
将n个质点随机地分配到N个盒中 分配方式 不同分法的总数
每盒可容纳任意个质点 质点可辨
质点不可辨
每盒最多容纳一个质点 质点可辨
质点不可辨
自有限总体 的n次简单随机抽样,相当于将 个质点随机地分配到 盒中:每一个质点在N个盒中“任意选择一个盒子”;“还原”相当于“每盒可以容纳任意多个质点”,“非还原”相当于“每盒最多可以容纳一个质点”;“有序”相当于“质点可辨别”,“无序”相当于“质点不可辨别”.
Ⅲ 典型例题
〖填空题〗
例1.5(古典型概) 在4张同样的卡片上分别写有字母D,D,E,E,现在将4张卡片随意排成一列,则恰好排成英文单词DEED的概率p = 1/6 .
分析 这是一道古典型概率的小计算题.4张卡片的全排列有4!=24种,其中恰好排成英文单词DEED的总共4种:两个字母D交换位置计2种,两个字母E交换位置计2种.因此,所求概率为
.
例1.8(古典型概率) 铁路一编组站随机地编组发往三个不同地区 , 和 的各2,3和4节车皮,则发往同一地区的车皮恰好相邻的概率p= 1/210 .
分析 1)(古典型) 设 ={同一地区的车皮相邻}; ={发往 的车厢相邻}( ).
将发往 , 和 车皮各统一编组,且使发往同一地区的车皮恰好相邻的总共有3!=6种不同情形,其中每种情形对应 , 和 的一种排列.6种不同情形都是等可能的,如 是其中一种可能的情形,即“发往 的2节车皮编在最前面,发往 的3节车皮编在中间,发往 的4节车皮编在最后面”.由(1,3)式,有
2)(乘法公式) 计算概率P 亦可利用乘法公式:
例1.12(条件概率) 设在10件产品中有4件一等品6件二等品.现在随意从中取出两件,已知其中至少有一件是一等品,则两件都是一等品的条件概率为 1/5 .
分析 设A={两件中至少一件一等品},B={两件都是一等品}.易见
AB=B, P(AB) = P(B).
于是,所求条件概率为 .
例1.14 (独立试验) 对同一目标接连进行3次独立重复射击,假设至少命中目标一次的概率为7/8,则每次射击命中目标的概率p = 0.5 .
分析 引进事件A i={第i次命中目标}(i=1,2,3).由条件知,事件 相互独立,且其概率均为p.已知3次独立重复射击至少命中目标一次的概率为
由此得p=0.5.
例1.15(独立重复试验) 设事件A在每次试验中出现的概率为p, 则在n次独立重复试验中事件A最多出现一次的概率P= .
分析 引进事件 ={第i次试验出现 }(i=1,2,…,n).事件 相互独立且每个事件的概率均为p.设Bk={在n次独立重复试验中事件A恰好出现k次}(k=0,1),则
〖选择题〗
例1.20 设A, B和C是任意三事件,则下列选项中正确的选项是
(A) 若 ,则 ;(B) 若 ,则 .
(C) 若 ,则 ; (D) 若 ,则 . [D]
分析 本题既可以用直选法,也可以用排除法.(1) 直选法.由事件运算的对偶律,有 .而由 且 ,可见A和B互为对立事件,即 ,因此(D)正确.
(2) 排除法.前三个选项都不成立,只需分别举出反例.例如,由于 是三任意事件,若取 而 是必然事件,则 且 但 ,从而命题(A)和(B)不成立.设 ,则 但 ,从而命题(C)不成立.
注意,该题的结果反映了事件的运算与数的运算的不同之处.
〖解答题〗
例1.33 (随机抽样) 假设箱**有n个球,其中m(0≤m≤n)个是红球其余是白球.现在一个接一个地接连从箱中抽球,试求第k(1≤k≤n)次抽球抽到红球的概率p.
分析 引进事件 ={第k次抽球抽到红球}(1≤k≤n).对于还原抽样,显然
.
对于非还原抽样有同样结果.问题有多种解法.
解法1 设想将n个球一一编号.这样,不但区分球的颜色,而且区分球的编号.假如将n个球一个接一个(非还原)地接连从箱中抽出,则不同抽法(基本事件)的总数为n!.导致事件 的不同抽法有(n-1)!×m种,即 共包含 个基本事件:在第k次抽球抽到红球的情形共有m种,其余n-1次抽球不同抽法的总数等于从(n-1)!.从而
.
解法2 仍将n个球一一编号.从n个不同的球中接连抽出k个球,相当于从n个元素中选k个元素的选排列.因此总共有
种不同抽法,即基本事件的总数为 .导致事件 的不同抽法有
种,即 共包含 个基本事件:第k次抽球抽到红球的情形共有m种,前 次抽球的不同抽法的总数等于从 个元素中选 个的选排列数.于是
.
解法3 对于同颜色球不加区分.设想有n个格子依次排成一列(见插图)
将n个球分别放进n个格子(每格一球)且使m个红球占据m个固定的格子,总共有 种不同放法,即基本事件的总数为 :在第k格中放一红球,然后从其余 个格子选 个放其余红球,总共有 种放法,即 共包含 个基本事件.因此
.
例1.34(配对问题) 假设四个人的准考证混放在一起,现在将其随意地发给四个人.试求事件A={没有一个人领到自己准考证}的概率p.
解 引进事件:Ak={第k个人恰好领到自己的准考证}(k = 1,2,3,4).那么,
显然,每个人领到自己准考证的概率等于1/4,即
P(A1)=P(A2)=P(A3)=P(A4)= .
四个人各领一个准考证总共有4!种不同情形.四个人中任何两个人(例如第一个人和第二个人)都领到自己准考证总共有1×1×2×1=2 种不同情形(第一个人和第二个人各有一种选择,对于第三个人剩下两种选择,对于第四个人最后只剩下一种选择).因此
(1≤i<j≤4).
若四个人中任何三个人(例如,第一、第二和第三人)都领到自己准考证,则第四人自然也领到自己的准考证.因此
例1.39(条件概率) 假设有来自三个地区的各10名、15名和25名考生的报名表,其中女生的报名表分别为3份、7份和5份.现在随机抽取一个地区的报名表,并从中先后随意抽出两份.
(1) 求先抽出的一份是女生表的概率p;
(2) 已知后抽出的一份是男生表,求先抽出的一份是女生表的概率q.
解 引进事件:Hj={报名表是第j地区考生的}(j= 1,2,3);Ai={第i次抽到的是男生表}(i=1,2).由条件知: ;
(1) 由全概率公式,得
(2) 由条件知
由全概率公式,得
例1.40(贝叶斯公式) 假设一个人在一年内患感冒的次数X服从参数为5的泊松分布;正在销售的一种药品A对于75%的人可以将患感冒的次数平均降低到3次,而对于25%的人无效.现在有某人试用此药一年,结果在试用期患感冒两次,试求此药有效的概率 .
解 以X表示一个人在一年内患感冒的次数.引进事件: ={服药无效}, ={服药有效}.由条件知,X服从参数为5的泊松分布;对于 ,有
例1.42 (试验次数) 设P(A)= p.接连不断地独立地重复进行试验,问为使事件A至少出现一次的概率不小于Q(0<Q<1),至少需要进行多少次试验?
解 设所需试验的次数为n, Bn={n次试验中A至少出现一次}, Ak={第k次试验中出现A}, 则Bn= A1+A2+…+A n ,P(Ak)= p,且A1, A2,…,A n相互独立.
例如,p = 0.15,Q =0.95,则
即为使事件A至少出现一次的概率不小于0.95,至少需要进行n = 19次试验.
例1.44(独立性) 将一枚完备对称和均匀的硬币接连掷n次.引进事件: {正面最多出现一次}, {正面和反面各至少出现一次}.
试就n = 2,3和4的情形讨论事件 和 的独立性.
解 以 表示“将硬币掷n次正面恰好出现的次数”.易见
显然 服从参数为 的二项分布.需要就n = 2,3和4的情形讨论 的条件
当n≥2时,由 ,可见
.
事件 和 独立,当且仅当
.
由此可见,事件 和 独立的充分必要条件是
.
由于上式当n=3时成立,故当n=3时事件 和 独立;但上式当n=2和4时不成立,从而当n=2或4时事件 和 不独立.
〖证明题〗
例1.48(独立性) 对于任意二事件 和 ,其中0<P(A), P(B)<1,称
为事件 和 的相关系数.试证明,
(1) ;
(2) 是二事件 和 独立的充分和必要条件.
证明 记P(A) = p ,P(B) = q,P(AB) = r.考虑两随机变量 :
其概率分布为:
.
此外,显然随机变量 只有0和1两个可能值,并且
.
易见,随机变量 的数字特征为:
因此,事件 和 的相关系数就是随机变量 的相关系数:
. (*)
1) 由随机变量的相关系数的基本性质知 .
2) 必要性 假设事件 和 独立.因为根据条件 ,即r=pq ,故由(*)可见 =0.
充分性 假设 =0,则由(*)可见r=pq,即 .
例1.49(独立性) 对于任意二事件 ,考虑二随机变量
试证明随机变量 独立的充分与必要条件,是事件 相互独立.
证明 记 ,而 是 的相关系数.易见,随机变量 都服从0-1分布,并且
(1) 必要性.设随机变量 独立,则
从而,事件 相互独立.
(2) 充分性.设事件 相互独立,则 也都独立,故
从而,随机变量 独立.
例1.51(独立性) 假设有四张同样卡片,其中三张上分别只印有a1,a2,a3,而另一张上同时印有a1,a2,a3.现在随意抽取一张卡片,以Ak={卡片上印有ak}.证明事件 两两独立但三个事件不独立.
证明
由于对任意 ,有
,
可见事件 两两独立.但是,由于
,
可见事件 不独立
二、随机变量及其概率分布
这一部分,数学一、数学三和数学四的内容完全一致.
Ⅰ、考试大纲要求
㈠ 考试内容 随机变量 随机变量的分布函数的概念及其性质 离散型随机变量的概率分布 连续型随机变量的概率密度 常见随机变量的分布 随机变量函数的分布
㈡ 考试要求 概率分布的概念,常用概率分布,随机变量函数的分布.
(1) 理解概率分布的概念,掌握其三种基本形式:离散型概率分布,连续型概率密度,分布函数;掌握概率分布的特点、性质,会根据概率分布计算有关事件的概率;
(2) 掌握下列概率分布:0-1分布、二项分布、超几何分布和泊松分布等离散型概率分布,以及均匀分布、指数分布和正态分布等连续型概率分布,包括分布的表达式、特点、性质、数字特征和典型应用,以及与其他分布的关系;
(3) 理解0-1分布、二项分布、超几何分布和泊松分布等离散型概率分布之间的关系;
(4) 会根据随机自变量的分布,求其函数的分布的方法.
Ⅱ 考试内容提要
㈠ 随机变量及其概率分布
1、基本概念 (1) 随机变量 随机变量,直观上指取值带随机性的变量,数学上指基本事件(样本点)的函数.实际中遇到的随机变量有离散型和连续型两大类:可能值个数有限或可数的随机变量称做离散型的;连续型随机变量的值域是数轴上的有限或无限区间.通常用后面几个大写拉丁字母(如 )表示随机变量.
(2) 概率分布 随机变量X的概率分布,指它的“值域”及它取各可能值或在值域内各部分取值的“概率”二者的总称.实际中遇到的概率分布有离散型和连续型两大类,分别描绘离散型和连续型随机变量.
2、离散型随机变量的概率分布 设X是离散型随机变量, 是它的一切(m个或可数个)可能值的集合.离散型随机变量X的概率分布有如下一些常用的表示方法.
;
.
其中 , .对于任意实数a<b , 有
, (2.1)
其中Σ表示对于满足 的一切 求和.
3、连续型随机变量的概率密度 连续型随机变量X的概率分布,由一非负函数 ——概率密度函数决定:对于任意实数 ,有
. (2.2)
严格地说,只有有概率密度的随机变量才称做连续型的.
概率密度 的基本性质是:
.
此外,任意连续型随机变量 取任何给定值 的概率等于 : .
4、随机变量的分布函数 分布函数可以描绘任何随机变量的概率分布.不过,有简单的函数式的分布函数很少,因此分布函数不便用于处理具体的随机变量,多用于一般性研究.
(1) 定义 随机变量 的分布函数定义为 .它在点 处的值,是事件 的概率,即 在 上取值的概率.
(2) 性质 性质1)~3)为基本性质.
1) ,是单调不减函数;
2) 右连续: .
3) = =0, = =1.
4) 根据分布函数求事件的概率,例如
(2.3)
5) 连续型随机变量X的分布函数为
, (2.4)
其中 是 的概率密度.连续型随机变量的分布函数是连续函数,对于几乎一切 ,有
. (2.5)
6) 离散型随机变量X的分布函数为
, (2.6)
其中Σ表示对于不大于 的一切 求和.离散型随机变量的分布函数是阶梯函数.
㈡ 常用概率分布
1、常用概率分布表 考试大纲要求掌握的离散型概率分布有:0-1分布,二项分布,超几何分布和泊松分布,考试大纲要求掌握的连续型概率分布有:均匀分布,正态分布和指数分布.
表2.1 常用离散型概率分布( )
分布名称 P{X=k} 可 能 值k 参 数 数学期望 方 差
0-1 和 1和0
二项 0,1,…, n,
超几何 0,1,…,
泊松 自然数
表2.2 常用连续型概率分布
分布名称 概率密度 值域 参 数 数学期望 方 差
均匀 a,b
正态
指数 1/
2、常用概率分布的典型应用
(1) 0-1分布 只有“成功”和“失败” 两种对立结局的试验称做伯努利试验;伯努利试验成功的次数X服从0-1分布,参数 ——成功的概率, ——失败的概率.例如产品抽样验收:抽到不合格品——成功,抽到合格品──失败;射击:命中──成功,脱靶──失败……
(2) 二项分布 以 表示X服从参数为 的二项分布.
1) 独立重复试验成功次数的分布 设X是n次伯努利试验成功的次数,则 ,参数 是每次试验成功的概率.例如,n次独立重复射击命中的次数X服从二项分布,参数 是每次射击的命中率.
2) 自有限总体的还原抽样 设总体 含N个个体,其中M个具有某种特征A(如不合格品).设X是n次还原抽样具有特征A的个体出现的次数,则 布,其中 (如不合格品率).
(3) 超几何分布 设总体 含N个个体,其中M个具有特征A,则n次非还原抽样具有特征A的个体出现的次数X服从参数为 的超几何分布.
(4) 泊松分布 1) 二项分布概率的近似计算 设 服从二项分布,参数 充分大、p充分小而 p适中,则有如下近似公式——泊松定理:
(2.7)
实际中,当 时即可利用此式,不过 应尽量地大,否则近似效果不佳.
2) 随机质点流 我们把源源不断地出现在随机时刻的质点形成的“流”称做随机质点流.例如,到达商店的顾客、用户对商品质量的投诉、暴雨、交通事故、重大刑事案件、大震后的余震、设备的故障LL所形成的随机质点流.以 表示在长为 的时间内出现的随机质点的个数,则 服从参数为 的泊松分布:
, (2.8)
其中 是单位时间出现的随机质点的平均个数,称做质点流的强度.
(5) 均匀分布 几何型概率的数学描述.向区间 上均匀地掷随机点试验,产生均匀分布.区间 上均匀分布的分布函数有简单的表达式
(2.9)
(6) 指数分布 设 是在服从参数为 的泊松分布的随机质点流中,相继出现的两个随机质点时间间隔——等待时间(例如,设备无故障运转的时间、设备的使用寿命或维修时间、设备相继出现两次故障的时间间隔LL),则等待时间 服从参数为 的指数分布.参数为 的指数分布函数有简单的数学表达式
(2.10)
(7) 正态分布 以 表示随机变量X服从参数为 的正态分布.以 和 分别表示 的概率密度和分布函数,附表1是 的数值表; .附表2的最下边一行是标准正态分布的水平 双侧分位数 (见附表2),满足
. (2.11)
1)对于任意常数a和 ,若X~ ,则 ;
2)若X~ 和Y~ 相互独立,则
;
3)许多自然现象和社会现象都可以用正态分布律来描述.许多概率分布的极限分布是正态分布(中心极限定理).
4)许多重要分布,如 分布, 分布和 分布都是正态变量的函数的分布.
3、 常用概率分布之间的关系
(1) 与二项分布的关系
1) 设随机变量 独立且都服从参数为p的0-1分布,则
~ .
2) 泊松定理 设 ,则当 充分小而n充分大且 适中时,X近似服从参数为 的泊松分布.
3) 棣莫弗-拉普拉斯定理 设 ,则当n充分大时, 近似服从正态分布 .
4) 自有限总体的非还原抽样产生超几何分布,而还原抽样则产生二项分布.当总体容量 和抽样次数 充分大,但 相对N较小时,超几何分布和二项分布的概率相近:
, (2.12)
其中p = M / N.实际中,当 和抽样次数 充分大且 时可以利用此近似公式.
(2) 与正态分布的关系
1) 许多重要分布,如 分布, 分布和 分布都是正态变量函数的分布.
2) 许多概率分布的极限分布是正态分布.例如,若 ,则当 充分大时近似服从正 态分布(棣莫弗-拉普拉斯定理).
3) 在相当广泛的条件下,大量独立同分布随机变量之和近似服从正态分布(列维-林德伯格定理).
㈢ 随机变量的函数的概率分布
设 , 其中 是连续函数或分段连续函数.要求根据 的概率分布求 的概率分布.
1、一般情形 设法将 的概率分布通过 的概率分布表示:
.
用这种方法,在许多情形下可以求出的概率分布.
2、离散型情形 若已知 ,且函数 的一切可能值两两不等,则 (i =1,2,…)就是Y的概率分布,否则将各相等的 值对应的概率相加,即可得到的概率分布.
3、连续型情形 一般,先求的 分布函数 ,再对 求导数,即可得到的概率密度f (y).
特别,设 是严格单调的连续函数, 是函数 的值域, 是 的惟一反函数; 是连续型随机变量,其概率密度为 ,则 也是连续型随机变量,其概率密度 通过 表示为
(2.13)
Ⅲ、典型例题分析
〖填空题〗
例2.4(连续型分布) 假设X是在区间(0,1)内取值的连续型随机变量,而 .已知 ,则满足 的常数k= .
例2.11(泊松分布) 设一本书的各页的印刷错误个数X服从泊松分布律.已知有一个和两个印刷错误的页数相同,则随意抽查的4页中无印刷错误的概率p= .
分析 以X表示随意抽取的一页上印刷错误的个数,以 表示随意抽取的第k页上印刷错误的个数,由条件知X和 服从同一泊松分布,未知分布参数 决定于:
于是 =2.由于随机变量 显然相互独立,因此
例2.12(分布函数) 设10件产品中恰好有2件不合格品,从中一件一件地抽出产品直到抽到合格品为止,则最后抽出产品件数X的分布函数为 .
分析 先求X的概率分布.易见,X有1,2,3等3个可能值,且
于是,X的分布函数为
例2.18(由分布函数求事件的概率) 设随机变量X的分布函数为
则P = .
.
〖选择题〗
2.19(分布函数) 设随机变量X和Y相互独立,其分布函数相应为 和 ,则随机变量 的分布函数为
(A) . (B) .
(C) . (D) . [ C ]
分析 由分布函数的定义以及X和Y独立性,知随机变量 的分布函数为
例2.25(正态分布) 设随机变量 ,则随 的增大,概率
(A) 单调增大. (B) 单调减小. (C) 保持不变. (D) 增减不定. [ C ]
分析 应选(C).因为对于任意 和 , 为常数:(查表)
.
例2.27(分布函数) 假设X是只有两个可能值的离散型随机变量,Y是连续型随机变量,且X和Y相互独立,则随机变量X+Y的分布函数
(A) 是阶梯函数. (B) 恰好有一个间断点.
(C) 是连续函数. (D) 恰好有两个间断点. [ C ]
分析 (C).事实上,设X的概率分布为: ;而Y的分布函数为 .因为X和Y相互独立,故由全概率公式,有
由此可见X+Y是的分布函数是连续函数.
〖解答题〗
例2.30(分布函数) 一个正立方体容器盛有3/4的液体, 假设在其6个侧面(含上、下两个底面)的随机部位出现了一个小孔,液体经此小孔流出.求剩余液体液面的高度X的分布函数 .
解 不妨假设正立方体容器的边长为1.引进事件: ,即事件A表示“小孔出现在容器的下底面”.由于小孔出现在正立方体的6个侧面是等可能的,易见 .
从而, .对于任意x<0,显然 0;而 .由于小孔出现的部位是随机性,可见对于任意 ,有
该式中4x表示容器的四个侧面x以下的总面积,而容器6个侧面的总面积为6.
对于任意x≥0.75,显然 .于是,最后得
例2.31(分布函数) 假设一装置启动后无故障工作的时间 (小时)服从指数分布,平均无故障工作的时间为2百小时;每次启动(在无故障的情形下)只需工作10小时便自行关机.试求该装置每次启动无故障工作的时间Y的分布函数.
解 因 服从指数分布,且 (百小时),故分布参数 =0.5,故 的分布函数为
易见, .设 是Y的分布函数,则对于y<0, =0;对于y>0.1, =1;对于 ,有
于是, 的分布函数为
例2.33(有限几何分布) 设试验E是一伯努利试验,其成功的概率为p, 而失败的概率为q=1-p.现在将E独立地一次接一次地进行直到成功或完成n次试验为止,其中n≥2是给定的自然数.试求所作试验次数X的概率分布.
解 试验次数X是一随机变量.为求X的概率分布,引进事件: ={第j次试验成功}(j=1,2,…,n).显然P( ) = p.而由于试验的独立性,知事件 …相互独立.
设试验进行到成功或n次为止,则X的可能值为1,2,…,n 且 ;对于2≤k≤n-1,
于是,X的概率分布为有限几何分布:
.
例2.35(泊松定理) 假设某自动生产线上产品的不合格品率为0.02,试求随意抽取的30件中,
(1) 不合格品不少于两件的概率 ;
(2) 在已经发现一件不合格品的条件下,不合格品不少于两件的概率 .
解 以 表示抽到的30件产品中不合格品的件数,则 服从参数为(30,0.02)的二项分布:
1) 不合格品不少于两件的概率
2) 在已经发现一件不合格品的条件下,不合格品不少于两件的条件概率
例2.36(二项分布) 假设有10台设备,每台的可靠性(无故障工作的概率)为0.92,每台出现故障时需要由一人进行调整.问为保证在95%的情况下当设备出现故障时都能及时得到调整,至少需要安排几个人值班?
解 由条件知每台设备出现故障的概率为0.08.以 表示10台设备中同时出现故障的台数,则 服从参数为(10,0.08)的二项分布.需要安排的值班人数k应满足条件: .需要对不同的k进行试算.首先,设k=1和k=2,相应得
因此,至少需要安排2个人值班.
例2.37(二项分布) 假设一部机器在一个工作日因故停用的概率为0.2.一周使用5个工作日可创利润10万元;使用4个工作日可创利润7万元;使用3个工作日只创利润2万元;停用3天及多于3天亏损2万元.求所创利润的概率分布.
解 设X——一周5个工作日停用的天数;Y——一周所创利润.X服从参数为(5,0.2)的二项分布.因此,有
一周所创利润Y是X的函数:
.
例2.38(二项分布) 某生产线平均每三分钟生产一件产品,假设不合格品率为0.01.问为使至少出现一件不合格品的概率超过95%最少需要多长时间?
解 设n——至少出现一件不合格品所要生产产品的件数,则n件产品中不合格品的件数 服从参数为(n,0.01)的二项分布;按题意,n应满足条件
于是,为至少出现一件不合格品的概率超过95%,最少需要298.0729×3 895分,将近14小时55分.
例3.41(复合泊松分布) 假设一日内到过某商店的顾客数服从参数为 的泊松分布,而每个顾客实际购货的概率为 .分别以 和 表示一日内到过该商店的顾客中购货和未购货的人数,分别求 和 的概率分布.
解 由条件知 + 是一日内到过该商店的顾客的人数,服从参数为 的泊松分布.设X——一日内到过该商店的顾客中购货的人数.由条件知,在一日内有 个顾客到过该商店的条件下,购货人数的条件概率分布为
由全概率公式可见,对于m=0,1,2,…,有
于是,一日内到过该商店的顾客中购货的人数 服从参数为 的泊松分布.同理, 服从参数为 的泊松分布.
例2.44(随机质点流) 假设一商店每周(7天)平均售出56台电冰箱,其中因为质量问题要求返修的占5‰ .试求一个季度(90天)售出的电冰箱中返修件数X的概率分布.
解 以 表示 =90天内售出的电冰箱台数.可以假设 服从参数为 的泊松分布.由条件知 =56,从而 =8(台).这样, 服从参数为 =8t的泊松分布:
.
随机变量X的可能值为自然数m=0,1,2,….记 .由全概率公式,有
其中 .因此返修件数X服从参数为3.6的泊松分布:
.
例2.47(正态分布)假设随机变量X服从正态分布 ,求满足 的常数a.
解 由条件知
其中 是标准正态分布函数.由熟知的事实 ,可见
例2.48(正态分布) 假设随机测量的误差 ,求在100次独立重复测量中,至少三次测量的绝对误差大于19.6的概率 的近似值.
解 由条件知 .设 为100次独立重复测量中事件 出现的次数,则
.
易见 服从参数为(100 , 0.05)的二项分布,近似服从参数为5的泊松分布.因此
〖证明题〗
例2.52(分布函数) 设 和 都是随机变量的分布函数,a和b是非负常数且 ,证明 具有随机变量的分布函数的基本性质.
证明 只需验证 满足分布函数的三条基本性质.由条件知a和b非负且a+b =1.由于 和 都是分布函数,可见对于任意,有
对于任意实数 ,由于 ,可见
即 单调不减.由 和 的右连续性,可见 也右连续.最后,
于是 也是分布函数.
例2.53(分布函数) 假设随机变量X服从参数为 的指数分布, 是其分布函数,证明随机变量Y= 在区间(0,1)上服从均匀分布.
证明 指数分布函数为 设 为Y= 的分布函数.由于分布函数 的值域为(0,1),可见当 时 ;当 时 .设 ,有
于是, 是区间(0,1)上的均匀分布函数,从而Y= 在区间(0,1)上服从均匀分布.
作者:
haohao2046
时间:
2006-3-25 16:41
接上原命题组概率负责人周概容老师2005考研概率讲义
三、多维随机变量的分布 (数学三、四)
二维随机变量及其分布(数学一)
Ⅰ 考试大纲要求
㈠ 考试内容 [数学一] 二维随机变量及其概率分布 二维离散型随机变量的概率分布、边缘分布和条件分布 二维连续型随机变量的联合概率密度、边缘密度和条件密度 随机变量的独立性和不相关性 常用二维随机变量的分布 两个随机变量简单函数的分布
[数学三、四] 多维随机变量及其分布函数 二维离散型随机变量的概率分布、边缘分布和条件分布 二维连续型随机变量的联合概率密度、边缘密度和条件密度 随机变量的独立性和不相关性 常见二维随机变量的分布 两个及两个以上随机变量的函数的分布
㈡ 考试要求 联合分布函数;随机变量联合概率分布和联合概率密度;随机变量的独立性及不相关性;两个随机自变量的函数的概率分布.
1、理解二维随机变量的联合分布函数的基本概念和性质;离散型随机变量联合概率分布、边缘分布和条件分布;连续型随机变量联合概率密度、边缘密度和条件密度;会利用二维概率分布求有关事件的概率.
2、理解随机变量的独立性及不相关性的概念及其联系和区别,掌握随机变量独立的条件;
3、掌握二维均匀分布;了解二维正态分布的概率密度,理解其中参数的概率意义;
4、掌握根据两个随机自变量的联合分布,求其较简单函数的分布的基本方法;会根据两个或多个独立随机变量的分布求其较简单函数的分布.
Ⅱ、考试内容提要
㈠ 离散型随机变量的联合概率分布 主要讨论两个离散型随机变量的联合分布,多个变量的的情形完全类似.
1、联合概率分布 设离散型随机变量 和 的一切可能的集合为 ,则 和 的联合概率分布表示为:
; (3.1)
有时以列联表的形式表示
表3.1 离散型随机变量 和 的联合概率分布
1
其中 .
2、边缘概率分布 变量 和 的概率分布称做其联合分布的边缘分布:
(3.2)
表3.1的左右两列恰好是其中一个变量的概率分布,上下两行恰好是另一个变量的概率分布.
3、条件分布 随机变量 在 条件下的条件概率分布为
(3.3)
亦称“ 关于 的条件分布”.对于给定的 ,只要 ,条件分布就有定义,并且具有(无条件)概率分布的一切性质.
㈡ 连续型随机变量的联合分布 连续型随机变量的联合概率分布由联合密度表示.
1、联合密度 对于二连续型变量 和 , 可视为平面上的点.对于平面上的任意区域G,称函数 为 的概率密度或 和 的联合(概率)密度,如果点 属于G的概率可以通过一个非负函数 的积分表示为
, (3.4)
特别,对于矩形区域 ,如果
. (3.5)
联合概率密度具有如下性质:
. (3.6)
2、边缘密度 变量 和 的概率密度 和 可由其联合密度 表示为
, (3.7)
称做联合密度 的边缘密度.
3、条件密度 对于任意 ,若 >0,则称
(3.8)
为 关于 的条件密度.同样可以定义 关于 的条件密度.由(3.8),得密度乘法公式:
, (3.9)
㈢ 联合分布函数
1、定义 (1) 称 元函数
(3.11)
为随机向量 的分布函数,或随机变量 的联合分布函数.
(2) 随机变量 中每个变量的分布函数以及其中任意个变量的联合分布函数,称为 的边缘分布函数.
2、性质 以 和 的联合分布函数 为例[(1)~(4)是基本性质].
(1) 0≤ ≤1,且对于每一自变量单调不减.
(2) F(x, y)对于每一自变量右连续.
(3) , .
(4) 对于任意实数 ,有
(5) 随机变量 和 的联合分布函数 ,完全决定每个随机变量的分布函数 和 (反之未必):
. (3.12)
(6) 连续型随机向量 的分布函数 可由联合密度 表示为
; (3.13)
并且对于几乎一切 ,有
.
注意,联合分布函数完全决定随机变量的联合分布,但是它不便于描绘具体的随机变量,多用于一般性研究,况且很少联合分布函数有简单的数学表达式.实际中遇到的分布有离散型和连续型两大类,分别描绘离散型和连续型随机变量.
㈣ 随机变量的独立性
1、一般概念 (1) 称随机变量 为相互独立的,如果其联合分布函数
, (3.14)
其中 是随机变量X k的分布函数.
(2) 称随机向量 与 为相互独立的,如果
. (3.15)
(3) 称随机变量列 为相互独立的,如果对于任意 ,变量 相互独立.
2、离散型 称离散型变量 相互独立,若对于其一切可能值 ,有
. (3.16)
3、连续型 连续型随机变量 相互独立,如果它们的联合密度等于各变量密度的乘积:
. (3.17)
4、性质 (1) 若 相互独立,则其中任意 个随机变量也相互独立.
(2) 若随机变量 相互独立,则它们的函数也相互独立.
(3) 若两个随机变量独立,则一个关于另一个的条件分布就是其无条件分布.
㈤ 随机变量的相关性
假设随机变量 和 的相关系数 存在.如果 = 0,则称 和 不相关,否则称 和 相关:若 > 0,则称 和 正相关;若 < 0,则称 和 负相关.
二独立随机变量一定不相关,但是两个不相关随机变量却未必独立.对于联合分布是二维正态分布的随机变量 和 ,“独立与不相关等价”.
㈥ 常见随机变量的联合分布
考试大纲要求掌握二维均匀分布和二维正态分布.
1、二维均匀分布 设G是平面区域, 表示区域G的面积.称随机变量 和 的联合分布为区域G上的均匀分布,如果其联合密度为
(3.18)
若 是一个矩形区域,则 和 的联合密度为:
(3.19)
二维均匀分布的边缘分布、条件分布以及数字特征,都与区域G的形状密切相关.例如,对于圆形区域 , 和 的分布都不是均匀分布,而其中一个变量关于另一个变量的条件分布都是均匀分布.假如 是矩形,则 和 的分布,分别为区间 和 上的均匀分布.
2、二维正态分布 设 ,则二维正态密度
. (3.20)
(1) 分布参数 设随机变量 和 联合概率分布是二维正态分布,其五个参数分别为: ,而 —— 和 的相关系数.
(2) 边缘分布 二维正态分布的两个边缘分布—— 的分布和 的分布都是正态分布: , .但逆命题不成立:即便 和 都服从正态分布,甚至 和 的相关系数等于0, 和 的联合分布也未必是二维正态分布.
(3) 性质 1) 若 和 的联合分布是二维正态分布,而 和 是不同为0的实数,则 服从正态分布: ,
特别 ;
2) 若 和 的联合分布是二维正态分布,则相关系数 是 和 独立的充分和必要条件;换句话说,对于联合分布是二维正态分布的 和 ,独立与不相关等价.
㈦ 多个随机变量的函数的概率分布
包括多个独立随机变量之最大值、最小值的分布及其联合分布等.两个随机变量之和、差、积、商的分布……离散型情形见具体例题.
设随机变量 和 的联合密度为 .以 和 分别表示随机变量 和 的密度.当 和 独立时, .
1、随机变量之和的密度 和 是连续型随机变量,其概率密度
. (3.21)
2、随机变量之差的密度 差 是连续型随机变量,其概率密度
. (3.22)
3、随机变量之积的密度 积 是连续型随机变量,其概率密度
. (3.23)
4、随机变量之商的密度 商 是连续型随机变量,其概率密度
. (3.24)
Ⅲ 典型例题分析
〖填空题〗
例3.1(加法公式) 设 , 则 = .
分析 引进事件: ,则
, ;
例3.9(边缘分布函数) 设随机变量 和 的联合分布函数为
则随机变量 的分布函数 为 .
分析 是 的边缘分布函数: .因此
例3.10(边缘密度) 随机向量( , )的概率密度
的两个边缘密度 为 .
分析 由边缘密度的公式,有
即 是标准正态密度.由对称性知 也是标准正态密度.
例3.11(联合概率分布) 设随机变量U在区间[-2,2]上服从均匀分布,而随机变量
则 和 的联合概率分布为 .
分析 (1) 随机向量 有四个可能值: .易见
例3.15(函数的分布) 设X1和X2独立, , ,
,
则 的概率分布为 .
分析 显然 有0和1两个可能值
.
于是, 的概率分布是0-1分布:
.
例3.15(联合分布函数)设随机变量 和 的联合概率分布为
,
则其联合分布函数 .
答案 和 的联合分布函数为
〖选择题〗
3.19 设 和 独立,都服从同一0-1分布: ,则 =
(A) 0. (B) . (C) . (D) 1. [ B ]
分析 由全概率公式及 和 相互独立,知
例3.21 设随机变量 和 有相同的概率分布:
,
并且满足 ,则 等于
(A) 0. (B) 0.25. (C) 0.50. (D) 1. [ A ]
分析 应选(A).利用列联表3.1,首先将 的分布和 的分布用黑体填入表3.4;由条件 ,可见 .故 等于 , , , 的概率为0,将0用黑体填入表3.4,则容易求出 和 的联合分布.
表3.2 例3.14中 和 的联合分布计算表
Σ
0 0.25 0 1/4 0 1/4 0 0.25 0 0.250.500.25
Σ 0.25 0.50 0.25 1
由 和 的联合分布可见
.
3.22 设独立 和 之和 + 与 和 服从同名概率分布,如果 和 都服从
(A) 均匀分布. (B) 二项分布.
(C) 指数分布. (D) 泊松分布. [ D ]
分析 熟知,在所列的4个分布中,只有二独立泊松分布的变量之和仍然服从泊松分布.
例3.28 设随机变量 和 都服从正态分布,则
(A) + 一定服从正态分布.
(B) 和 不相关与独立等价.
(C) ( , )一定服从正态分布.
(D) ( , )未必服从正态分布. [ D ]
分析 (A) 不成立,例如,若 ,则 + ≡0不服从正态分布.(C)不成立,( , )不一定服从正态分布,因为边缘分布一般不能决定联合分布.(B)也不成立.(D) 虽然随机变量 和 都服从正态分布,但是因为边缘分布一般不能决定联合分布,故( , )未必服从正态分布.
〖解答题〗
例3.33(条件分布) 假设某地区一年内发生大暴雨的次数 和一般暴雨的次数 相互独立,且分别服从参数为 和 的泊松分布.在一年共发生了 次暴雨的条件下,试求大暴雨次数 的条件概率分布.
解 由条件知,一年共发生暴雨次数可以是任意自然数 ,有
对于任意自然数 ,有
于是,在“一年内共发生了 次暴雨”的条件下,大暴雨次数 的条件概率分布是参数为 的二项分布,其中
.
例3.34(联合分布) 设随机变量 相互独立有相同的概率分布:
.
求随机变量U和V的联合分布,其中
解 有4个可能值 .记 ,则
例3.37 (联合分布) 假设随机变量 服从参数 的指数分布,随机变量
求 的概率分布.
解 随机变量Y的分布函数为
随机向量 有四个可能值: , , , .易见
例3.39 (独立与不相关) 假设 是以原点为心半径为 的圆形区域,而随机变量 和 的联合分布是在圆 上的均匀分布.
(1) 由(3.19)知, 和 的联合密度为
由(3.10)知, 的密度 和 的密度 相应为
由于 ,可见随机变量 和 不独立.
(2) 证明 和 不相关,即 和 的相关系数 = 0.有
;
同理可得 .因此,有
于是, 和 的相关系数 = 0.这样, 和 虽然不相关,但是不独立.
例3.40(独立与不相关的等价条件) 假设随机向量 的联合密度为
,
其中 和 都是二维正态分布密度:
(1) 求随机变量 和 概率密度 和 ;
(2) 求随机变量 和 的相关系数 ;
(3) 问随机变量 和 是否独立?为什么?
解 由 和 的表达式,可见其数学期望都是0,方差都是1,相关系数分别为1/3和-1/3.
(1) 熟知,二维正态分布密度的两个边缘密度都是正分布态密度, 因此 和 的边缘密度都是标准正态分布密度 .由此可见
于是 和 概率密度 和 都是正态密度.
(2) 显然,EX=EY=0, DX=DY=1. 因此,由相关系数的定义,知
(3) 随机变量 和 不独立,因为显然 .
例3.41(密度的乘法公式) 设随机变量X在区间 (1,3) 上服从均匀分布,而 在区间 ( ,2) 上服从均匀分布.试求:
(1) 随机变量 和 联合密度 ;
(2) 随机变量 的概率密度 ;
(3) .
解 随机变量 的概率密度为 ;对于1< <2,随机变量 在 的条件下的条件概率密度
(1) 由密度的乘法公式(3.9),得 和 联合密度 :
(2) 随机变量 的概率密度 是联合密度 的边缘密度.当 1和 2时,显然 =0;对于 ,由(3.10),有
.
于是,随机变量 的概率密度为
例3.42(概率密度) 向区域
上均匀地掷一随机点 ,求 , 和 的概率密
度 和 .
分析 易见,区域 是以(2,0),
(0,2),(-2,0),(0,-2)为顶点的正方形,其面积为8
由于随机点. 在正方形上分布均匀,可见
正方形的4个边的方程依次为: , ;随机变量 和 的概率密度 是 的边缘密度:
随机变量 的概率密度 ,是利用对称性直接写出的.
例3.43(函数的分布) 已知随机变量 独立同分布:
, .
试求行列式 的概率分布.
解 记 , ,则 .易见, 和 独立同分布:
随机变量 有-1,0和1等3个可能值;
例3.48(和的密度) 某商品一周的需求量 是随机变量,已知其概率密度为
假设各周的需求量相互独立,以 表示 周的总需求量,试求:
(1) 和 的概率密度 ;
(2)接连三周中的周最大需求量的概率密度 .
解 以 表示第 周的需求量,则 的概率密度均为
,
而 , .三周中周最大需求量为 .
(1) 当 时显然 ;对于 由(3.22)式
于是,两周和三周的总需求量 和 的概率密度
(2) 设 是随机变量X的分布函数.由例3.45可见,连续三周中的周最大需求量 的分布函数为 .于是,有
例3.49(积的密度) 假设 是一矩形;连续型随机向量 在矩形 上的密度为常数,而矩形 之外为0.求边长为X和Y的矩形面积 的分布.
解法1 随机向量 的密度概率为
设 是面积 的分布函数,则当
时 =0;当 时 =1.对于 ,
曲线 将矩形 分为两部分(见插图):曲线的上方 ,曲线的下方 ;曲线 与矩形上边的交点为 .对于 ,有
最后,得 的概率密度
解法2 直接利用二随机变量之积的密度公式(3.23).设 是面积 的概率密度.显然,当 和 时 =0.对于 ,由公式(3.24),有
.
〖证明题〗
例3.51(独立性与相关性) 设X和Y相互独立都服从0-1分布: ,试证明 不相关,但是不独立.
证明 (1) 由协方差的定义和性质,以及X和Y相互独立,可见
于是, 不相关.
(2) 现在证明 不独立.事实上,由
可见 和 不独立.
例3.54(独立性) 对于任意二事件 ,考虑二随机变量
试证明随机变量 独立的充分与必要条件,是事件 相互独立.
证法1 记 ,而 是 的相关系数.有
由于 =0与 =0等价,而由 ,可见, =0的充分与必要条件,是 ,即事件 相互独立.
证法2 易见,随机变量 都服从0-1分布并且
(1) 必要性.设随机变量 独立,则
从而,事件 相互独立.
(2) 充分性.设事件 独立,则 也都独立,因此
从而,随机变量 独立.
作者:
haohao2046
时间:
2006-3-25 16:42
接上原命题组概率负责人周概容老师2005考研概率讲义
四、随机变量的数字特征
这一部分,"数学一"、"数学三"和"数学四"的考试大纲、内容和要求完全一致,.
Ⅰ 考试大纲要求
㈠ 考试内容 随机变量的数学期望(均值)、方差、标准差及其性质 随机变量函数的数学期望 切比雪夫(Chebyshev)不等式 矩、协方差、相关系数及其性质
㈡ 考试要求
1、考试大纲要求理解随机变量的数字特征(数学期望、方差,标准差、矩、协方差、相关系数)的概念,并会运用数字特征定义和基本性质计算具体分布的数字特征;掌握常用分布(二项分布、超几何分布、泊松分布、一维和二维均匀分布、指数分布、一维和二维正态分布)的数字特征(解题时可以直接利用这些数字特征).
2、会根据随机变量的概率分布求其函数的数学期望;会根据二维随机变量的概率分布求其函数的数学期望.
3、理解有关数字特征的概率意义,例如,对于指数分布,"平均无故障工作的时间"或"平均等待时间"……可以理解为相应时间的数学期望.
Ⅱ 考试内容提要
㈠ 数学期望 表征随机变量取值的平均水平、"中心"位置或"集中"位置.
1、数学期望的定义
(1) 定义 离散型和连续型随机变量X的数学期望定义为
(4.1)
其中Σ表示对X的一切可能值求和.对于离散型变量,若可能值个数无限,则要求级数绝对收敛;对于连续型变量,要求定义中的积分绝对收敛;否则认为数学期望不存在.
(2) 随机变量的函数的数学期望 设 为连续函数或分段连续函数,而X是任一随机变量,则随机变量 的数学期望可以通过随机变量X的概率分布直接来求,而不必先求出 的概率分布再求其数学期望;对于二元函数 ,有类似的公式:
(4.2a)
(4.2b)
2、数学期望的性质
(1) 对于任意常数c,有 .
(2) 对于任意常数 ,有 .
(3) 对于任意 ,有
.
(4) 如果 相互独立,则
.
㈡ 方差和标准差 表征随机变量取值分散或集中程度的数字特征.
1、方差的定义 称
为随机变量X的方差,称 为随机变量X的标准差.随机变量X的方差有如下计算公式:
(4.3)
2、方差的性质
(1) ,并且 当且仅当 (以概率1)为常数;
(2) 对于任意实数 ,有 ;
(3) 若 两两独立或两两不相关,则
.
㈢ 协方差和相关系数
考虑二维随机向量 ,其数字特征包括每个变量的数学期望和方差,以及 和 的联合数字特征--协方差和相关系数.
1、协方差和相关系数的定义
(1) 协方差 随机变量 和 的协方差定义为
, (4.4)
其中
(2) 相关系数 随机变量X和Y的相关系数定义为
. (4.5)
2、协方差的性质 设随机变量 和 的方差存在,则它们的协方差也存在.
(1) 若 和 独立,则 ;对于任意常数c,有 .
(2) .
(3) 对于任意实数a和b,有 .
(4) 对于任意随机变量 ,有
(5) 对于任意 和 ,有 .
(6) 对于任意 和 ,有 .
3、相关系数的性质 相关系数的如下三条基本性质,决定了它的重要应用.设 -- 和 的相关系数,
(1) .
(2) 若 和 相互独立,则 =0;但是,当 =0时 和 却未必独立.
(3) 的充分必要条件是 和 (以概率1)互为线性函数.
三条性质说明,随着变量 和 之间的关系由相互独立到互为线性函数,它们的相关系数的绝对值 从0增加到1,说明相关系数可以做两个变量统计相依程度的度量.
4、随机变量的相关性 假设随机变量 和 的相关系数 存在.若 = 0,则称 和 不相关,否则称 和 相关.
(1) 若两个随机变量独立,则它们一定不相关,而反之未必;
(2) 若 和 的联合分布是二维正态分布,则它们"不相关"与"独立"等价.
㈣ 矩 在力学和物理学中用矩描绘质量的分布.概率统计中用矩描绘概率分布.常用的矩有两大类:原点矩和中心矩.数学期望是一阶原点矩,而方差是二阶中心矩.
1、原点矩 对任意实数 ,称 为随机变量X的 阶原点矩,简称 阶矩. .原点矩的计算公式为:
(4.6)
2、中心矩 称 为随机变量X的 阶中心矩. .
㈤ 切比雪夫(切贝绍夫)不等式 设随机变量 的数学期望 和方差 都存在,则对于任意 ,有
. (4.7)
Ⅲ 典型例题分析
〖填空题〗
例4.1(函数的方差) 已知随机变量 的分布函数为:
则 = .
分析 由分布函数,可得随机变量 的概率分布
例4.2(函数的期望) 设随机变量 分布函数为F(x),则随机变量
的数学期望 .
分析 随机变量 只有 和1两个可能值.
例4.4(函数的期望) 设随机变量X服从参数为0.5的泊松分布,则随机变量 的数学期望 = .
分析 事实上,有
例4.6(标准差) 假设无线电测距仪无系统误差,其测量的随机误差服从正态分布.已知随机测量的绝对误差以概率0.95不大于20米,则随机测量误差的标准差 = .
分析 由条件"无系统误差"知,测量误差 服从正态分布 ,因此
,
例4.8(方差) 设随机变量 和 独立同正态分布 ,则 = .
分析 易见, = 0, = 1,故 ~N(0,1).因此,
例4.9 100次独立重复试验成功次数的标准差的最大值等于 .
分析 100次独立重复试验成功的次数X服从参数为 的二项分布.由于当p =0.5时, 取最大值.这时 ,可见标准差的最大值等于5.
例4.11(二项分布) 有若干瓶超过保质期的饮料,假设其中变质的期望瓶数为18瓶,标准差为4瓶.则变质饮料的瓶数 的概率分布是 .
分析 假设总共有n瓶超过保质期的饮料,p是其中变质饮料的瓶数所占的比重.显然变质饮料的瓶数X服从参数为(n,p)的二项分布.现在求n和p.由条件知
例4.12(协方差) 假设随机变量 和 的方差都等于1, 和 的相关系数为0.25,则随机变量 和 的协方差为 .
分析 已知 .因此,有
〖选择题〗
例4.19 对于任意随机变量 和 ,如果 ,则
(A) 和 独立. (B) 和 不独立.
(C) . (D) . [ D ]
分析 由 可见
例4.23 设X在区间[-1,1]上均匀分布,则 和 的相关系数等于
(A) . (B) 0. (C) 0.5. (D) 1. [ A ]
分析 由于 和 有明显的线性关系:
,
可见 和 相关系数 的绝对值等于1.因为 和 增减变化趋势恰好相反,所以立即可以断定 .
例4.26 假设试验E以概率p成功,以概率 失败,分别以 和 表示在n次独立地重复试验中成功和失败的次数,则 和 的相关系数 等于
(A) . (B) 0. (C) 1/2. (D) 1. [ A ]
分析 因为 + =n,即 和 互为线性函数,故 和 的相关系数 =±1.由于 =n- ,可见 和 为负相关,故 .
〖计算题〗
例4.29 (期望的应用) 自动生产线加工的零件的内径X(mm)服从正态分布 ,内径小于10或大于12mm的为不合格品,其余为合格品.每件产品的成本为10元,内径小于10mm的可再加工成合格品,尚需费用5元.全部合格品在市场上销售,每件合格品售价20元.问零件的平均内径 取何值时,销售一个零件的平均销售利润最大?
解 每件产品的销售利润L与自动生产线加工的零件的内径X(mm)有如下关系:
其中 是标准正态分布函数, --标准正态密度.因此,有
由此,可见当 mm时,平均利润最大.
例4.31(函数的期望) 假设某季节性商品,适时地售出1kg可以获利s元,季后销售每千克净亏损t元.假设一家商店在季节内该商品的销售量X(kg)是一随机变量,并且在区间 内均匀分布.问季初应安排多少这种商品,可以使期望销售利润最大?
解 根据条件随机变量X的概率密度为:
以表示 销售利润,它与季初应安排商品的数量h有关.由条件,知
为求使期望利润最大的h,我们计算销售利润 的数学期望.为此,首先注意到: ,销售利润 的数学期望为:
对求导并令其等于0,得
于是,季初安排 千克商品,可以使期望销售利润最大,
4.34(数学期望) 独立地重复进行某项试验,直到成功为止,每次试验成功的概率为p.假设前5次试验每次的试验费用为10元,从第6次起每次的试验费用为5元.试求这项试验的总费用的期望值a.
解 (1) 以X表示试验的总次数,首先求X的概率分布.设 ={第k次试验成功}(k=1,2,…),则 ;X的概率分布为
,
其中 .于是试验的总次数X服从参数为p的几何分布.
(2) 现在求试验的总费用的期望值a.由条件知,试验的总费用为
该项试验的总费用Y是一随机变量,其期望值为
;
例如,设p = 0.8, q = 0.2,得 12.498元;设p = q = 0.5,得 19.6875元;设p = 0.2, q = 0.8,得 41.808元;设p = 0.1, q = 0.9,得 70.4775元.
例4.35(变量和的期望) 假设n个信封内分别装有发给n个人的通知,但信封上各收信人的地址是随机填写的.以X表示收到自己通知的人数,求X的数学期望和方差.
解 (1) 记 ={第k封信的地址与内容一致}.第k个人的通知随意装入n个信封中的一个信封,恰好装进写有其地址的信封的概率等于1/n,故 =1/n.同理
.
引进随机变量
(k=1,…,n),
则 .从而,有
(2) 对于任意 ,乘积 只有0和1两个可能值,且
.
因此,对于任意 ,有
.
(3) 最后求方差DX.
注 该题的解法具有典型性:求解时并没有直接利用X的概率分布,仅利用数学期望和方差的性质.当然,也可以先求X的概率分布,然后再根据定义求数学期望.然而,求概率分布需要相当繁杂的计算,并且由此概率分布求数学期望并非易事.
例4.38(函数的期望) 求 ,假设随机变量 服从柯西分布,其概率密度为
.
解 由于
可见
例4.39(数学期望) 假设一种电器设备的使用寿命X(单位:小时)是一随机变量,服从参数为 =0.01的指数分布.使用这种电器每小时的费用为C1=3元,当电器工作正常时每小时可获利润C2=10元.此设备由一名工人操作,每小时报酬为C3=4元,并且按约定操作时间为h小时支付报酬.问约定操作时间h为多少时,能使期望利润最大?
解 以Y表示销售利润,则由条件知
由条件知,随机变量X的分布函数和概率密度相应为
和 .
其中 .期望销售利润为
.
将C1=3元,C2=10元.C3=4元,以及 =0.01代入,得 小时.
例4.41(最小值的期望) 一微波线路有两个中间站,其中任何一个出现故障都要引起线路故障.假设两个中间站无故障的时间都服从指数分布,平均无故障工作的时间相应为1和0.5(千小时),试求线路无故障工作时间X的数学期望.
解 设 是第i个中间站无故障工作时间,则 .由条件知,可以认为 和 独立,E =1,E =1/0.5=2;
解法1 根据(4.2b)式,有
解法2 先求X 的概率密度f(x).X的分布函数为
因此,有
例4.42(最小值的期望) 设随机变量X和Y相互独立,并且都服从正态分布 ,求随机变量 的数学期望.
解 设 , ,有
.
U和V服从标准正态分布 ,其联合密度为
.
因此根据(4.2b)式,有(见插图)
.
注 同样可以求得 .
例4.44(方差) 假设随机向量 在以点 为顶点的三角形区域上服从均匀分布.试求随机变量Z=X+Y的方差.
解 区域 是以点 为顶点的三角形区域(见插图).随机向量( X , Y )的概率密度为
解法1 首先求Z=X+Y的概率密度 :显然当z<1或z>2时 =0;设 ,当0≤x≤1而且0≤z-x≤1(即z-1≤x≤1)时, =2,否则 =0,故有
.
因此
解法2 设 是X的概率密度.当x<0或x>1时 =0;当0≤x≤1时, 有
.
于是,随机变量X的概率密度为:
同理可得:EY=2/3,DY=1/18.现在求 :
例4.45(相关系数) 假设随机变量X和Y的数学期望都等于1,方差都等于2, 其相关系数为0.25,求随机变量 和 的相关系数 .
解 首先求U和V的数学期望和方差.
,
由条件知
,
.
注意到, , , 有
从而,随机变量 和 的相关系数为
.
例4.47(相关系数) 假设随机变量 独立同分布,且方差存在.求随机变量
和
的相关系数 .
解 记 .由于 独立,可见( )和( )独立,以及( )和( )独立.因此
于是,由DU= DV=6b,可见
.
〖证明题〗
4.56(相关性和独立性) 对于任意二随机事件A和B,设随机变量
试证明"随机变量X和Y不相关" 当且仅当"事件A和B独立".
证明 易见事件A和B独立当且仅当事件A与 独立.记
, , .
有
; .
现在求EXY.显然,XY只有1和-1两个可能值.
由此可见,随机变量X和Y不相关的充分和必要条件是,事件A和 独立,即
.
由独立事件的性质知,若事件A与 独立,则事件A与B也独立.从而随机变量X和Y不相关当且仅当事件A和 独立.
作者:
peter93126
时间:
2006-7-18 22:14
标题:
dddddddddddddd
dddddddddddddddddddddddddddddd
作者:
peter93126
时间:
2006-7-18 22:17
标题:
dddddddddddddddddddd
dddddddddddddddddddddddddd
作者:
peter93126
时间:
2006-7-18 22:19
标题:
顶 顶 顶
顶 顶 顶
强烈支持
dddddddddddd
作者:
lyt8636
时间:
2007-5-25 15:48
顶顶
支持楼主
作者:
hilldy88
时间:
2010-6-2 11:21
ddddddddddddddddddddddddddd
作者:
1989jfy
时间:
2010-12-25 17:21
看一看
欢迎光临 政治学与国际关系论坛 (http://bbs.newslist.com.cn/)
Powered by Discuz! X3.2