替换某些偏差,你就会看到这一点。此时,协
方差的结果就是该随机变量偏差平方的期望。
在表a - 5最后一列的前三个值就是我们已经熟悉的三种资产的方差,它们分别是
股票、看涨期权与看跌期权。该列最后三个数值是协方差,其中的两个呈负值。比如
说,我们考察股票与看跌期权的协方差。在情景1中,股票实现了负的偏差值,而看
跌期权则实现了正的偏差值。当我们把它们相乘时,符号为负。在情景3下,同样的
情况也会发生,只是现在股票实现的是正偏差,而看跌期权为负偏差。同样,乘积仍
为负,因此更加强了两者之间负的同步性。
对其他的情景或者其他的资产来说,偏差乘积可以在某些情景下为负,在另一些
情景下为正。这些乘积的值,再乘以它们各自实现的概率,决定了两个随机变量同步
性的性质。但是,如果我们发现不管各种情景的乘积符号怎样变化,各自的结果会大
致正负相抵,并最终得到一个很小的接近于零的协方差,那么我们就会推断各资产的
收益间存在着小的同步性,甚至根本就不存在同步性。
由于协方差就是两随机变量对期望偏差乘积的期望,要分析变量替换对协方差的
影响,我们可以从变量替换对其偏差影响的分析来入手。
假设在其中一个随机变量上加了一个常数,我们早就知道此时其期望也会增加同
样的常数,所以其对期望的偏差应该保持不变。就像对一个随机变量加上一个常数不
会影响其方差一样,这样做也不会影响它与其他变量的协方差。
把随机变量乘以一个常数后,它的期望也扩大了常数倍,于是其对期望的偏差也
扩大了常数倍。因此,这样做会使它与其他随机变量的协方差扩大该常数倍。利用协
方差的定义式,读者可以验证下式是否成立(该式是对上文讨论的总结)。
co v (a1+b1rs,a2+b2rc)=b1b2co v (rs,rc) (a-18)
下载
附录a 定量计算的复习
763
有了协方差,我们就可以计算随机变量和的方差,进而计算资产组合收益率的方
差了。
a.3.2 一个纯粹的关于相关性的指标:相关系数
假如我们告诉你,现在股票收益率与看涨期权收益率之间的协方差为0 . 2 4(见表a - 5)。
你能得出什么结果?因为符号为正,你可能会得出两种收益大致为同向变动的结论。但
是,对于股票与看涨期权同步性的具体程度来说,0 . 2 4这个数字实在毫无用处。
要得到一个关于描述同步性程度的相关性指标,我们可以把协方差再除以这两个
变量的标准差。每个标准差即为其方差的平方根。于是两个标准差的乘积就与方差具
有同样的测度单位,而且也与协方差的单位相同。所以,我们据此定义有相关系数
:
cov(rs ,rc )
sc = (a - 1 9)
s
c
其中
的下脚标标明了两个随机变量。由于在协方差的表达式中变量顺序的变换
与其数值结果无关,式( a - 1 9 )表明相关系数的数值也与字母顺序无关。
我们利用表a - 5,得到了三个随机变量的协方差矩阵。
名称股票看涨期权看跌期权
股票1 . 0 0 0 . 9 4 -0 . 9 7
看涨期权0 . 9 4 1 . 0 0 -0 . 8 4
看跌期权-0 . 9 7 -0 . 8 4 1 . 0 0
最高的(绝对值)相关系数是股票与看跌期权之间的相关系数
s p =-0 . 9 7,尽管它
们之间协方差的绝对值为最小。原因很明显,它们两者的标准差乘积也很小。接下来
就是几条关于相关系数的重要性质:
. 如式( a - 1 9 )所示,相关系数完全由随机变量对其期望的偏差所决定。因此我们
推得相关系数并不会因为其中的随机变量加减某个常数而改变。但是,当随机变量乘
以一个常数后,相关系数仍保持不变。你可以通过把协方差与标准差各乘以一个常数
后的效果来验证这一性质。
. 就像协方差一样,相关系数只是关于两个变量相关性的指标,它并不能反映两
者之间的因果性。因果性必须要得到理论及特定实证结果的支持。
. 相关系数的取值范围为[-1 . 0 , 1 . 0 ],-1 . 0表示完全的负相关,1 . 0表示完全的正相
关。这可以从计算一个随机变量与其自身相关系数得到。其结果应为1 . 0,因为随机变
量与其自身的协方差即为其方差,你可以用式( a - 1 9 )来验证1 . 0的结果。你甚至还可以
验证一个随机变量与其负的自身之间的相关系数为-1 . 0。从式( a - 1 7 )你可以看到随机
变量与其负的自身之间的协方差等于负的方差。然后代入式( a - 1 9 ),即可得到这一结
果。
因为x与y之间的相关性和y与x之间的相关性没有区别,所以相关系数矩阵是对称
阵。对角线上的元素全为1 . 0,因为它们是各随机变量与其自身的相关系数。因此,习
惯上我们仅须写出相关系数矩阵的下三角部分。
再考察一下式( a - 1 9 )。你可以重新整理一下,得到式( a - 2 0 )。该式把协方差表示
成相关系数与标准乘积的形式:
c o v (rsrc) =
( a - 2 0 )
s c
sc
这个公式很有用,因为许多人习惯用相关系数来考虑问题,而不是用协方差。
从收益样本中估计相关系数假设一个样本由互相独立的观测值构成,于是我们
对所有的观测值赋以相同的权重,并用它们的简单平均来估计其期望。当估计方差与
协方差时,我们把平方和除以总观测数减1,所得的平均值即为估计值。
假定我们现在希望对股票与长期无风险政府债券之间的相关系数进行估计,我们
下载
764 第八部分附录
仍以表a - 3为例。假定现有从1 9 2 6年到1 9 9 3年这6 8个年超额收益的样本观测值。利用式( a - 1 9 )中相关系数的定义式,你可以对下面的统计量进行估计(脚标s表示
股票,b表示债券,t表示时期):
rs = 1 .(68) rs ,t = 0.085 7;rb = 1 .rb, t = 0.162
68 t =1 68
=é 1 .(r- r )2 u1/2
= 0.2090
ss,ts
.67 .
=é 1
- rb )2 u1/2
= 0.085 0
b . 67 .(rb, t .
cov( rs , rb ) = 1 .[(rs,t - rs )(rb,t - rb )] = 0.00314
67
cov( rs , rb )
== 0.17916
sb
s
b
现在我们想说明一个有可能产生错误估计的例子。回忆一下,我们利用该样本进
行参数估计的前提假定是它们的概率分布在整个样本期内没有变化。为了考察这个假
定是否成立,我们现在对1 9 6 5~1 9 8 7年这段较近时期内股票、债券的相关系数进行重
新估计。这段时期正好是政府为越战与星球大战计划而大规模举债的时期。
如前面的计算过程,我们计算1 9 6 5年至1 9 8 7年的数据。我们得到:
rs = 0.031 2; rb =-0.003 17
=0.155 65
b= 0 . 112 17
c o v (rs,rb)=0.00 57
s
s b=0.326 47
两组数据的差别说明随机变量的概率分布很有可能随着时期的改变而改变,虽然
这个论断并不十分肯定,收益率与样本容量的变化正是我们不能确信的原因。所以我
们应该把注意力放在短期样本统计量的研究上。
a.3.3 回归分析
我们以注册金融分析师( c fa )考试(水平i,1 9 8 6)中的一个题目为例来代表理解
回归分析所需的基础水平。但是,我们先需要了解一些背景知识。
对相关性进行了这么多的分析,我们其实忽略了因果性的问题。在因果性的分析
中,变量被分为被解释变量与解释变量。假定理论(以其最基本的结构式)告诉我们
所有资产的超额收益都由同一个经济力量所决定,而这个经济力量又由宽广的市场指
数运动所体现(比如说标准普尔5 0 0指数的超额收益)。
假定我们的理论预言,在任何资产与市场指数的收益率之间存在着一个简单的线
性关系。一个线性关系,即可以被一条直线所刻划,一般具有如下的形式:
rj , t =aj+bjrm , t+ej , t ( a - 2 1 )
式中下标j表示任何资产,m表示市场指数(在下面的叙述中,我们将尽可能地省
略下标)。在式( a - 2 1 )的左边,资产j的超额收益是被解释变量;右边分为两部分,即
被解释变量中的可被解释部分与随机部分。
rj可被解释部分为a+b rm。它被绘于图a - 7。数值a,有时也被称为截距,给出了
当解释变量为零时rj的取值。在该关系中,我们假设其为常数。可被解释部分中的第
二项代表rm这种市场趋动力,当乘以敏感系数b后就把rm的运动传递给了rj。同样,我
们也假设b为常数。图a - 7中b就是回归直线的斜率。
rj 中不可被解释部分以扰动项ej表示。我们假定扰动项与解释变量rm无关,而且
具有零期望的特征。这样的变量也被称为“白噪声”变量,因为它仅仅能够加大被解
下载
附录a 定量计算的复习
765
释变量rj的波动性,而对其期望却没有任何影响。
我们把数据代入式( a - 2 1)所示的关系,然后对其系数进行估计,所得的方程即
为回归方程。仅含有一个解释变量的关系称为简单回归。参数a、b被称为回归系数。
因为每一个rj的值都由回归方程所解释,rj的期望值与方差也由该回归方程所决定。
利用式( a - 2 1 )中的期望表达式,我们有:
e(rj)=a+b e(rm) (a-22)
常数a不会对rj的方差产生影响。因为变量rm和ej不相关,所以两随机变量和b rm+e
的方差为两个随机变量各自方差的和。由于rm乘上了参数b,所以rj的方差将为:
+
e2( a - 2 3 )
2j=b2m2
式(a - 2 3)告诉我们,rj波动性中rm部分取决于回归系数(即斜率)b。(b
m)2这
一项被称为可被解释方差,扰动项的方差构成了不可被解释方差。
rj与rm之间的协方差也可由回归方程得到。利用前文的定义式,我们有,
c o v (rj, rm)=c o v (a+b rm+e, rm)
= c o v (b rm, rm)=bc o v (rm, rm)=b
2m( a - 2 4 )
截距a之所以没有出现在最后的表达式中,是因为在随机变量上加一个常数后,
它与其他随机变量的协方差将保持不变。另外,由于假设随机扰动项e与市场收益无
关,所以它也没有出现在最后的表达式中。
式( a - 2 4 )列出了回归参数b的另一个表达式:
cov( rj , rm )
b =
2
m
于是,斜率b就成为了一个比例的测度,这个比例就是j与m的同步变动在解释变
量m这一趋动力的运动中所占的比例。
对回归方程解释能力到底如何的一种测度方法是看rj的总方差中可被方程解释的
方差所占的比例。这个比值称为确定系数
2:
b22 b22
m
m
2jm= 2
j
=
bm
2m2+ e2( a - 2 5 )
注意,确定系数与1 . 0之间的差由不可解释方差
e2组成。因此,表示确定系数的
另一种方法是:
2
2 e
jm 2
=1 -
j
运用代数知识,我们可
知确定系数即为相关系数的