相关系数 相关系数怎么来的

相关系数在金融研究员的研究中恐怕是最常用的一个统计工具了,但是据笔者的观察,多数报告中对相关系数的理解和应用也仅仅限于计算出相关系数,而对相关系数的理解和进一步分析都是不够的。本文中将系统的解读相关系数。

严格意义上讲,相关系数是一个概率上的概念而不是统计的概念。这句话的意思是说,相关系数是针对随机变量来定义的而不是针对样本来定义。但是在应用中,我们通常忽略了所得到的样本对应的随机变量,关注的和考量的都是样本本身。从统计学本身来看,这是从样本来推断总体的,也就是说我们认为样本的相关系数可以作为随机变量相关系数的一种近似。


相关系数 相关系数怎么来的

相关系数的几何解释:如果空间想象能力稍好一些,很容易想想到这里的相关系数是什么意思?不就是两个向量夹角的余弦么,也即是两个向量X和Y的夹角。这种解释不仅仅限于统计的定义,对于随机变量来说也可以有这样的解释,不过把随机变量看成向量的时候,对应的空间是随机变量在平移不变下的等价类组成的,而在这个空间中标准差是向量的模,而协方差是向量的内积。根据平面上的经验我们知道,两个向量的夹角余弦的绝对值越大表明两个向量越接近共线,这也解释了相关系数的含义:两组数据的相关系数绝对值越大,表明两者的线性关系越明显。

线性回归分析对相关系数的依赖:线性回归分析也是我们常用的一种统计分析手段,从我们对相关系数的解读来看,线性回归分析效果要好的前提是样本的线性相关度要高,最好是1或-1,但是这个从统计角度来说是没有意义的,因为数据本身带有随机误差,相关系数是1不见得就比0.99分析更精确。使用Excel做相关性分析的时候,输出结果有一个参数,这一个参数其实就是反应样本直接线性相关程度的,值越大线性回归分析的效果越可靠。

相关性分析的再认识:(1在金融分析中,比如比较两个资产走势的相关性常用的做法有两种:一是计算收盘报价的相关性,二是计算涨跌价格(或者幅度)的相关性,通常这些数据都是按日采集的。如果两个资产走势的相关系数绝对值比较接近1,那么这两个资产是我们感兴趣的,是对冲和套利重点关注对象,这一点可以从马科维茨的投资组合的理论来解释。就马科维茨的理论来说,相关系数的计算是必要的。但是高相关性的要求是偏严格一些,因为从上面的分析可以知道,两个高相关性的资产不仅仅是涨跌上要求较高的一致性,而且涨跌的幅度也要求具有较高的一致性[1]在很多实际问题上,我们可能更关注两个资产的联动性,看两者是否具有同涨跌性而不太关注两者涨跌幅度的一致性,这种情况下不管是收盘价的相关性还是涨跌幅度的相关性都显得不够合适。一种比较适当的做法是将涨跌数值化而忽略涨跌幅度,比如与前一日相比上涨的话记为1,下跌的话记为-1,震荡的话记为0(震荡的标准通常是[-0.5%,0.5%])。涨跌数值化之后再做相关性分析即可。

2具有高度相关性的两组样本,我们可以认为对应的随机变量之间能够通过线性函数较好的模拟,即写成函数Y=AX+B的形式。虽然从函数上来说,X是自变量,Y是因变量,但是从逻辑上来说两者并不一定具备因果关系,数学上也可以反映出这一点,具有高度相关性的两组样本对应的随机变量线性关系也可以写成X=aY+b的形式。举两个例子来说明这一点。比如在11年8月至11年12月,LLDPE的收盘价与上证指数的收盘价的相关性大约为0.88,这个高相关性对应有逻辑关系,即LLDPE的走势受到系统性风险的影响非常大,LLDPE表现出比较强的金融属性。另一例子是这段时间LLDPE的收盘价与同一板块也比较活跃的PTA相关性也比较高,但是这个相关性并没有逻辑上的因果对应,即既不是PTA导致了LLDPE的下跌也不是LLDPE导致了PTA的下跌。在比较复杂的情况下表现出来的高相关性是否具有因果关系是很难确定的,统计学上的因果检验是解决这一问题的手段之一。

3在上文中我们提到的都是线性相关系数,感兴趣都是X和Y具有高度线性相关性从而可以做线性回归分析。但是如果我们把(X,Y)在坐标系里做出图来,显示两者可能具有某种形式的非线性关系,比如Y可能可以较好的表达成X的二次函数。那么一个很自然的问题就产生了,能不能有和线性情况类似的手段来检验两者是否具有二次关系?很遗憾的是,没有直接的办法将相关系数推广到非线性的情况,一些常见的思路都不可避免的遇到Y的一个样本对用多个X样本的情况。线性回归分析可以很自然的推广到这种具有特定形势的非线性情景,因为从回归分析的角度来看,这还是个线性问题,可以通过最小二乘计算出二次函数的三个系数。显而易见这种方法也可以推广到n次函数的情况,当n比较大的时候,有效的矩阵计算工具是需要的,但是就逼近论的一些结果暗示n通常不需要太大就会有比较好的结果。自然这种推广局限性是我们事先需要知道Y和X关系的可以表达成什么形式,虽然从逼近论的结果来解释,这个做法有一定的合理性。最近几年流行起来的学习理论(learning theory)中核方法也是对着问题的一个探索,其基本思想是通过一个非线性映射把X映射到一个无穷维的Hilbert空间(不知道这个空间的可以把这个相信成无穷维的欧式空间),则X在这个空间中的像和Y是具有高度的线性关系的,是可以使用线性回归等分析技术的。



[1] 这里主要是指正相关,负相关的情况类似。

  

爱华网本文地址 » http://www.413yy.cn/a/25101017/362922.html

更多阅读

余额宝怎么使用 余额宝是怎么来的

余额宝怎么使用——简介淘宝已经新推出了余额宝功能,可是余额宝是什么呢,该怎么使用呢,是不是有很多收益呢?下面就由小编来为大家细细讲解。余额宝怎么使用——工具/原料电脑余额宝怎么使用——方法/步骤余额宝怎么使用 1、

WOW传家宝装备武器哪里买怎么来的? wow7.0荣誉装备哪里买

魔兽世界传家宝:WOW传家宝装备武器哪里买怎么来的?  购买与兑换传家宝:魔导师拉姆布莉丝<英雄纹章军需官>,该NPC出现在达拉然 .使用英雄纹章可兑换具体装备.  联盟传家宝:由250个岩石守卫者的碎片换取    部落传家宝:由250个岩石

英雄联盟符文怎么弄 英雄联盟符文怎么来的

英雄联盟符文怎么弄——简介英雄联盟的符文,是为玩家英雄能力的加成,不同的英雄、不同的打法,适合不同类型的加成,所以有天赋页和符文页的设置,每一页可以保存一套天赋或者符文,天赋页和符文页默认都是两页,天赋页可以随意增减,不需任何花费

DNF中菠萝丁的称号怎么来的 dnf菠萝丁在哪

DNF中菠萝丁的称号怎样来的?2010-12-22|Tag:标签:菠萝,称号,dnf是否是先把赛丽亚任务中把全部王的看守珍爱称号全做了,下面便可以发与菠萝丁称号?45级后去赛琳娜那边代替职务务,这个图要45级才出的,进那个图要10个灵魂(往金灌中间的NP

声明:《相关系数 相关系数怎么来的》为网友有种狼会披羊皮分享!如侵犯到您的合法权益请联系我们删除