【基金从业基础知识084】随机变量与描述性统计量

余生

余生

普通会员  文章:84

发布于:2017-10-12 15:49:08


随机性是金融市场的重要特征之一。公司是否对其发行的债务违约,经营、投资项目的到期收益率,未来的资产价格等都是难以预测的。研究这些不确定事件的一般方法是将它们与数值联系起来,然后运用统计量来描述它们的特点。

(一)随机变量

1.定义

我们将一个能取得多个可能值的数值变量X称为随机变量。比如我们规定对于某A公司发行的债券,定义违约变量:

Default={1 债券违约债券不违约

那么Default就是一个随机变量;再比如,A公司发行的普通股股价在未来某一天的收盘价S可以是5元,可以是10元,也可以是5一10元的任意一个数值,于是S同样是一个随机变量。

如果一个随机变量X最多只能取可数的不同值,则为离散型随机变量;如果X的取值无法一一列出,可以遍取某个区间的任意数值,则为连续型随机变量。在上面的例子中,Default只能取0或1,因而是离散型随机变量;而S的取值可能是任意一个大于0的数,因而是连续型随机变量。

2.随机变量的分布

【基金从业基础知识084】随机变量与描述性统计量

如果X是一个连续型随机变量,由于无法列出X取每个特定值的概率,我们改用概率密度函数来刻画X的分布性质。概率密度函数是用来衡量随机变量X取值在特定范围内的函数,其图像称为概率密度函数曲线。

画出某连续型随机变量的概率密度函数曲线,其中的阴影部分面积就是该变量取值在(0, 10)的概率P{0<X≤10}

【基金从业基础知识084】随机变量与描述性统计量

(二)随机变量的数字特征与描述性统计量

知道随机变量的分布之后,我们需要进一步研究分布的特点和规律,比如取值的平均水平、离散程度等。用来衡量这些分布特点的数值统称为数字特征,如均值、方差等。在现实世界里我们面对的随机变量通常是未知分布的,无法直接求得其数字特征,因而我们采取抽样的方法来估计它们,即选择X的一组样本X1,.…,Xn,然后构造适当的函数g ( XI,…,Xn)来作为X分布的数字特征的近似值,这样的g ( X1,…,Xn)便是描述性统计量。常用的一些数字特征和它们的描述性统计量有下面几种。

1.期望(均值)

随机变量X的期望(或称均值,记做E(X))衡量了X取值的平均水平;它是对X所有可能取值按照其发生概率大小加权后得到的平均值。

【基金从业基础知识084】随机变量与描述性统计量

【基金从业基础知识084】随机变量与描述性统计量

【基金从业基础知识084】随机变量与描述性统计量

【基金从业基础知识084】随机变量与描述性统计量

【基金从业基础知识084】随机变量与描述性统计量

【基金从业基础知识084】随机变量与描述性统计量

【基金从业基础知识084】随机变量与描述性统计量

【基金从业基础知识084】随机变量与描述性统计量

【基金从业基础知识084】随机变量与描述性统计量

正是由于中位数能够代表一般水平,在基金投资管理领域中,我们经常应用中位数来作为评价基金经理业绩的基准。基金经理的个人回报也往往取决于其管理基金的表现相对于中位数基准有多好。例如,选取净值年增长率这个指标来考察基金的业绩,我们把2013年度国内336个股票型基金的净值增长率按从高到低排列,其中排名第168,169位的中邮核心优选股票和银华价值优选股票2013年度净值增长率分别为13.69%和13.64%。这组数据的中位数为(13.69%+ 13.64% ) /2=13.665%。于是,我们将13.665%作为评价国内股票型基金2013年度业绩的基准,净值增长率高于13.665%的基金表现优于行业一般水平;而净值增长率低于13.665%的基金表现劣于行业一般水平。

与另一个经常用来反映数据一般水平的统计量一均值相比,中位数的评价结果往往更为合理和贴近实际。例如,某债券投资者近年的年收益率由低到高分别为一16%.4%, 5%, S%, 6%, 8%。则该投资者收益率的中位数为5%,均值却只有2%。进一步考察可知,一16%的收益率其实是受到金融危机的影响而发生的小概率极端事件;剔除掉这一异常值之后,该投资者的投资策略可以取得平均5.6%的收益率。因而在这种情况下,中位数能够免疫极端值的影响,较好地反映投资策略的真实水平;而平均数(或均值)则很容易受到极端值的冲击,使其对于数据的判别效果产生较大的误差。

二、正态分布

正态分布是最重要的一类连续型随机变量分布,当一个随机变量的取值受到大量不同因素作用的共同影响,并且单个因素的影响都微不足道的时候,这个随机变量就服从或近似服从正态分布。在金融市场上,以股票为例,当没有任何决定性的消息发布的时候,股价走势很多时候呈现出“随机游走”的特点,这里的“随机游走”就是指股价的波动值服从正态分布。接下来将介绍芷态分布的性质以及应用。

【基金从业基础知识084】随机变量与描述性统计量

【基金从业基础知识084】随机变量与描述性统计量

正态分布密度函数的显著特点是中间高两边低,由中间(X=})向两边递减,并且分布左右对称,是一条光滑的“钟形曲线”。

正态分布距离均值越近的地方数值越集中,而在离均值较远的地方数值则很稀疏;这意味着正态分布出现极端值的概率很低,而出现均值附近的数值的概率非常大。同时图像越“瘦”,正态分布集中在均值附近的程度也越大。

检验一个随机变量是否服从正态分布,可以绘制它的样本频率直方图,如果频率直方图呈现出钟形特征,可认为该变量大致服从正态分布。例如,我们抽取沪深300指数在2013年连续240个交易日的日涨跌幅数据作为样本,绘制出其分布的频率直方图如图6-9所示。

直观上来看,该频率直方图的形状基本具有中间最高,自最高点处向两边递减的钟形特征,所以判断沪深300指数的日涨跌幅近似服从正态分布。

正态分布的分位数可以用来评估投资或资产收益限度或者风险容忍度,我们用下面的例子来说明这点。

【基金从业基础知识084】随机变量与描述性统计量

【基金从业基础知识084】随机变量与描述性统计量

【基金从业基础知识084】随机变量与描述性统计量

【基金从业基础知识084】随机变量与描述性统计量

三、随机变且的相关性—相关系数

上面我们讨论的都是单个随机变量的问题。但在金融市场上,我们时常想要知道多个不同随机变量之间的联系,比如利用期货与现货资产价格的相关性实现套期保值;再比如分析持有的投资组合内各项证券的价格联动性,以及组合整体表现与市场组合收益的数量关系等。在此,我们利用相关变量来对随机变量的相关性进行描述。

【基金从业基础知识084】随机变量与描述性统计量

【基金从业基础知识084】随机变量与描述性统计量

【基金从业基础知识084】随机变量与描述性统计量

【基金从业基础知识084】随机变量与描述性统计量

市场上的不同证券之间经常会显示出明显的相关性。我们以A股市场的股票为例,分别选取2013年1月1日至2014年4月30日之间共317个交易日的中国工商银行

(简称“GS" )、中国银行(简称“ZG")、中石油(简称“ZSY")与宝钢股份(简称“BG’,)四只股票的每日收盘价数据,对比分析它们的走势后发现,工商银行与中国银行的股价高度正相关,相关系数达到0.89;而中石油与宝钢股份的股价高度负相关,相关系数达到-0.72。如图所示。

【基金从业基础知识084】随机变量与描述性统计量

【基金从业基础知识084】随机变量与描述性统计量


  • 风险声明:本文代表原作者观点,阳财网仅提供发布平台,不构成任何投资操作建议,请谨慎参考,若据此操作风险自担!