标准差(Standard Deviation)一词经常出现在华尔街见闻网站的文章中,例如:
对于部分非金融专业出身的读者来说可能不太理解这句话代表着什么意思,到底什么是标准差?
当我们面对一堆数字的时候,我们可以很简单的找出这组数字的中值,也可以很容易算出平均值。但是只有这两个数字还不够,因为这样无法勾勒出这一堆数字整体的“shape”。此时,标准差的作用就可以体现出来了。
标准差是一组数值自平均值分散开来的程度的一种测量观念。一个较大的标准差,代表一组数据里大部分的数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。( 标准差就是用来衡量一组数据的离散度,标准差越大,离散度越大,越小,离散度越小。)
例如上图,两组数的集合 {1, 4, 9, 14} 和 {5, 6, 8, 9} 其平均值都是7,但第二个集合里的数字明显与7距离“更近”,通过公式算出第一个集合的标准差约为4.9,第二个约为1.5。
计算流程如下:首先计算出该组数据里每一个数字与平均值的差,然后将所有的得出差进行平方,接下来求出均值,最后再开方。
为什么用这么复杂的方法来计算标准差呢,这是因为在实践中,我们发现相当多的数据都呈现近似于“正态分布”,如下图,正态分布的概念在统计学中具有重要意义:
标准正态分布又称为u分布,是以0为均数、以1为标准差的正态分布,正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线。
简单的说就是呈现正态分布的一组数据中,靠近中间高点的数字出现的概率要远大于在两侧更远地方出现的概率。
在很多情况下统计数据都会呈现正态分布的构造,比如在样本很大、每一个样本又是类似的独立随机事件。例如能力的高低,学生成绩的好坏,人们的社会态度,行为表现以及身高、体重等身体状态都呈现正态分布。
理解正态分布对理解标准差具有重要的意义,回到上面那张钟形曲线图,如果说平均值可以告诉我们这条曲线最高点在什么位置,那么标准差就可以告诉我们这条曲线的宽窄程度。
反过来正态分布也可以用来解释标准差:在一个标准正态分布中,数字出现的概率是固定的。
如下图,约68.3%数值分布在距离平均值有1个标准差之内的范围,约95.4%数值分布在距离平均值有2个标准差之内的范围,以及约99.7%数值分布在距离平均值有3个标准差之内的范围。称为“68-95-99.7法则”或“经验法则”:
好的,到这里你应该已经理解了关于标准差的两个重要概念。那么回到金融领域中,标准差经常被用来描述价格的波动性,标准差越大说明其偏离均值程度越大,也越罕见,之后回归常态的可能性也在升高。
回到文章开头提到的黄金价格波动率达到6个标准差,这意味着在完美情況下每5亿天的波动中,只有1天有机会出现当前这样极端的情况,几率约等于为0.0000001973%,大约139万年一次(只算交易日则为202万年)!
所以路透社分析师John Kemp当时感叹如果价格波动按照正态分布进行,这将是黄金200万年一遇的黑天鹅。
这时你应该可以更形象理解这种情况有多罕见了吧。当然,如果前面你全都没看懂,那么只要记住下面这组数字就行了:
假设有一组按天采样的正态分布数据,简单的概括:
出现等于1个标准差的概率约为3天一次
出现等于2个标准差的概率为约22天一次
出现等于3个标准差的概率约为370天一次
出现等于4个标准差的概率约为43年一次
出现等于5个标准差的概率约为4779年一次
出现等于6个标准差的概率约为139万年一次
出现等于7个标准差的概率约为10亿年一次
转自http://wallstreetcn.com/node/211672