就是z≤a的概率。中间的
区域是a与b之间的密度面积。如果我们把这部分面积加上a的累积分布,我们就得到
了到达b的总密度面积,也就是z落在b左边的概率。于是a、b之间的面积即为z落在a和
b之间的概率。
利用相同的逻辑,我们找到了z>b的概率。我们已经知道z≤b的概率为n(b)。由
于复合事件“小于等于b”和复合事件“大于b”是互斥的而且是完全的(指两个事件
包含了所有可能的结果),因此他们的概率之和为1 . 0;于是要计算z>b的概率,我们只
要简单地用1减去z≤b的概率即可。正式地,我们有:p r(z>b)=1-n(b)
让我们再来看图a - 1,密度函数下b到正无穷之间的区域面积就是密度函数整个面
积(等于1)与负无穷到b之间面积的差。
正态密度函数已经足够地复杂,以至于它的累积函数(即其积分)并没有一个很
精确的显式解。它必须求助于近似方法才能得到。就像本书中表2 1 - 2那样,我们已经
把任何z值所对应的n(z)值求了出来,并制成表供查询。
为了进一步说明问题,下面我们计算标准正态分布的概率:
p r (z≤-0 . 3 6 )=n(-0 . 3 6 )=z小于等于-0 . 3 6的概率
p r (z≤0 . 9 4 )=n( 0 . 9 4 )=z小于等于0 . 9 4的概率
p r (-0 . 3 6≤z≤0 . 9 4 )=n( 0 . 9 4 )-n(-0 . 3 6 )=z落在区间[-0 . 3 6,0 . 9 4 ]之间的概率
p r (z> 0 . 9 4 )=1-n( 0 . 9 4 ) =z大于0 . 9 4的概率
752 第八部分附录
下载
利用表2 1 - 2的标准正态累积函数(有时也称为正态分布面积)和图a - 2,我们得
到:
n(-0 . 3 6)=0.359 4
n(0 . 9 4)=0.826 4
如图a - 2所示,-0 . 3 6和0 . 9 4之间的面积就是z落在[-0 . 3 6,0 . 9 4 ]之间的概率,因此
有:
p r (-0 . 3 6≤z≤0 . 9 4 )=n( 0 . 9 4 )-n(-0 . 3 6 )=0 . 8 2 6 4-0.359 4=0 . 4 6 7 0
z大于0 . 9 4的概率就是图a - 2中0 . 9 4与正无穷大之间的面积。它等于整个面积与负
无穷大到0 . 9 4之间面积的差。因此有:
p r(z> 0 . 9 4)= 1-n(0 . 9 4)=1-0.826 4=0.173 6
最后,还有一个问题,如果z小于等于a的概率为p,那么a的值为多少?
我们假定得到a的函数为Ф(p),于是就有:
如果Ф(p)=a,则p=n(a) ( a - 7 )
比如说,假设现在的问题是:累积密度为0 . 5的值为多少?只要看一下图a - 2,我
们就知道负无穷到零(即期望值)之间的面积为0 . 5,于是我们就有:
Ф(0 . 5)=0 因为n( 0 )=0 . 5
同样地
Ф(0.826 4)=0 . 9 4
因为
n( 0 . 9 4 )=0.826 4和Ф(0.359 4)=-0 . 3 6
我们可以验证一下。从表2 1 - 2中得出Ф(0.655 4)=0 . 4,这意味着具有累积分布
密度为0.655 4的值是z=0 . 4 0。
图a-2 概率与累积正态分布
非标准正态分布:假定某种股票的月收益大致服从均值为0 . 0 1 5 (每月1 . 5%)、标准
差为0 . 1 2 7 (每月1 2 . 7%)的正态分布。那么在某月中收益率小于零的概率为多大?注意
由于收益率为服从正态分布的随机变量,它的累积分布密度就可以用数字方法得到。
标准正态分布表可以应用于任何一个正态分布的变量。
任一个随机变量x,可以通过下式而替换成一个新的标准化的随机变量x*:
x - e( x)
x* = a-8
(x )
注意,我们对x所做的步骤是:(1)减掉期望;(2)乘以标准差的倒数1 / [ (x) ]。
根据我们前面的讨论,对随机变量来说,加上和乘以一个常数的替换效果就是使替换
后的随机变量具有零均值和单位方差。
e(x) - e(x)
(x)
e(x*) == 0;
(x*) == 1
( x)
(x )
下载
附录a 定量计算的复习
753
从正态分布的固有性质我们知道,如果x服从正态分布,那么x*也服从正态分布。
一个正态分布的随机变量可以由两个参数完全确定:它的期望与标准差。对于x*来说,
它们分别为0与1 . 0。当我们对一个随机变量减去其期望然后再除以其标准差以后,我
们就把它标准化了。也就是说,我们把它转化成了一个服从标准正态分布的随机变量。
这个方法在对正态分布(近似正态分布)随机变量进行处理上应用得非常广泛。
回到我们先前考虑的股票。我们知道如果把月收益率减去0 . 0 1 5,然后再除以
0 . 1 2 7,所得的随机变量就是服从标准正态分布的。我们现在可以确定某月收益率小于
等于零的概率。我们知道,有
r - 0.015
z =
0.127
其中r为股票的收益率,z服从标准正态分布。所以,如果r=0,z就应该为:
0 - 0.015
z( r = 0) = =-0.1181
0.127
当r=0时,相应的标准化随机变量z=-11 . 8 1%,为一负数。“r小于等于零”的事
件应与“z小于等于-0 . 118 1 ”等价。计算后者的概率就能够解出我们要求的问题。它
的概率即为n(-0 . 118 1),利用标准正态表我们得到:
p r(r≤0)=n(-0 . 118 1)=0 . 5-0 . 0 4 7=0 . 4 5 3
结果很有意义。回忆起r的期望值为1 . 5%。所以,由于r小于等于1 . 5%的概率为0 . 5,
r小于等于0的概率应该接近于0 . 5,但可能会再低一些。
置信区间:由于我们的股票具有较大的标准差,因此我们有理由去怀疑月收益率
绝对数值的可靠性。对于这个问题,一种量化的回答方法可以解决:“如果某股票收
益率落在某区间的概率为9 5%,那么该区间是什么?”这个区间也被称作9 5%的置信
区间。
一种符合逻辑的区间是以期望值为其中心的,因为r本身就是关于期望值对称的
正态分布随机变量。把所求区间记为
[e(r)-a,e(r)+a]=[ 0 . 0 1 5-a,0 . 0 1 5+a]
它的区间长度为2a。r落在此区间内的概率可用下式表出:
p r ( 0 . 0 1 5-a≤r≤0 . 0 1 5+a)=0 . 9 5
要解决这个问题,我们首先从标准正态分布的随机变量入手。服从标准正态分布
的随机变量具有零期望与单位方差。
标准正态分布随机变量z的9 5%置信区间是什么?由于变量的分布关于零对称,因
此上面的计算式变为:
p r ( -a * ≤ z ≤ a 0 ) = n
(a*)-n(-a0)= 0 . 9 5
图a - 3有助于你对上式累
积分布差所代表的意义有更好
的了解。落于此区间外的概率
为1-0 . 9 5=0 . 0 5。由于正态分
布的对称性,z小于等于-a*的
概率为0 . 0 2 5,而且z≥a*的概
率亦为0 . 0 2 5。于是我们可以
用下式来解出a*:
-a*=Ф(0 . 0 2 5),其等价于n(-a*)=0 . 0 2 5
我们可以对这个解决思路作如下总结。如果我们要寻找一个置信水平为9 5%的置
信区间,我们可以定义为r落于置信区间之外的概率。由于具有对称性,
的一半就是
图a-3 置信区间与标准正态分布
下载
第八部分附录
754
其落于置信区间右端的概率。同时其落于置信区间左端的概率亦为
/ 2。所以与p之间
的关系为:
=1-p=0.05
/ 2=( 1-p) / 2=0 . 0 2 5
我们这里使用
/ 2的原因就是考虑到分布的两个尾部把r以外的区域平分了。不含r
值的任一尾部都具有
/ 2的面积。值
=1-p表示的是不含r值所有区域的面积。
为了确定标准正态分布随机变量的置信区间下边界z=Ф(a/ 2)。我们通过标准正
态累积分布值0 . 0 2 5来确定z 值。查表得z =-1 . 9 6 ,于是我们推断出-a*=-1 . 9 6 ,
a*=1 . 9 6,z的置信区间为:
é .
.êe(z) -f è2
.
., e(z) +f è
.
2 .
.
.
u
u =[-f(0.025),f(0.025)]=[-1.96,1.96]
为了得到非标准正态分布随机变量r的区间边界,我们只要利用关系式r=z
(r)+
e(r)=Ф(
/ 2 ) (r)+e(r)来转化z的边界即可。注意,我们迄今为止都是设期望值为置
信区间的中心,然后以其一定数量的标准差向两边拓展。标准差的数量取决于我们允
许其落于置信区间之外的概率(
),或者就是其落于置信区间的概率(p)。通过加减
1 . 9 6 (即z=±Ф(0 . 0 2 5)),我们得到期望值两边的距离为±1 . 9 6x0 . 1 2 7=0 . 2 4 9,于是
我们得到了置信区间:
é
(r)fè
.
.
. , e(r) + (r)f.
è .
.u
u =[e(r) -0.249, e(r ) +0.249] =[-0.234,0.264]
êe(r) -
.
22 .
é
以满足于p =1-= pr e(r) - ( r)fè
.
2 .
.
≤r ≤e(r) + (r)fè
.
2 .
.
.
u
u
.ê
对于我们的股票(期望值为0 . 0 1 5,标准差为0 . 1 2 7)来说,也就是:
p r [-0 . 2 3 4≤r≤0 . 2 6 4 ]=0 . 9 5
注意到由于股票收益率的标准差较大,9 5%的置信区间的宽度竟达到了4 9%。
利用该例的一个变体,我们再复习一下计算过程。假设我们要求一个资产组合年
收益9 0%的置信区间,其年收益率的期望值为1 . 2%。标准差为5 . 2%。
该例的解为:
pr
é
êe(r) - (r)fè
.1 -p
.
.
≤rp≤e( r) + (r)fè
.1 - p
.
.u
u
.
22 .
=pr[0.012-0.052 ′1.645≤rp≤0.012 +0.052 ′1.645]
= pr[ -0.073 5 ≤rp≤0.0975]=0.90
因为该资产组合的风险较低,而且我们要求落于所求区间的概率为9 0%(而非
9 5%),所以该置信区间的宽度仅为2 . 4%
对数正态分布:采用正态分布来描述股价及收益率存在着两个不足。首先,尽管
正态分布允许随机变量取任何值(包括负值),但实际的股价不可能为负。其次,正
态分布不适于计算复利。而对数正态分布解决了这两个问题。
对数正态分布描述了一个不断增长的随机变量,它的增长率为一正态随机变量。
因此,一个对数正态分布随机变量的生成过程反映了连续计算复利的特征。
假定某股票以年连续复利(annual continuously compounded,a