α 三要素

发布时间:2017-01-05  |   来源: 川总写量化

作者:石川


1 三要素


主动投资管理的先驱之一 Richard Grinold 写过一篇著名的文章,题为《α = Volatility × IC × Score》。这篇文章标题直白醒目,简明扼要的说明了在主动管理中寻求股票 α 收益率的三要素。

 

Grinold 对 α 的定义为个股收益率中无法被与市场收益率相关的 β 部分解释的残余部分。假设 r 为个股相对无风险收益率的超额收益,r_m 为市场相对无风险收益率的超额收益,那么有


image.png


如果个股的 α 都是零(就像 CAPM 假设的那样),那么我们买个指数就万事大吉,所有主动型基金经理都会失业。但现实并不是这样,一些股票的确存在正的 α,而另一些存在负的 α。主动投资管理就是从所有的股票中选出拥有超额 α 收益的那些优秀股票。


让我们假设为了挖掘有真正 α 的优秀股票,某主动型基金经理有一个模型(咱们先甭管这个模型是怎么得到的,也许是靠着手底下众多研究员的深度研究,也许是靠着科学的量化分析,也许是靠打听内部消息,也许是靠猴子扔飞镖,whatever,you name it)。每当这个基金经理要预测个股下一期的 α 收益时,这个模型便给出一个预测,记为 f。


这样 α 的三要素为 IC、Volatility 以及 Score:


IC:它是对 α 的预测(即 f)和实际 α 的相关系数,在这里被称为信息系数 Information Coefficient。显然,这个相关度越高越好,它最直接的反映基金经理在主动管理中的预测能力。

 

Volatility:代表的是个股 α 本身的波动。α 本身的波动越大,说明越有机会可图。举个极端的例子,如果 α = 0 或者一个恒定的常数,那么这支个股对所有人来说都是一样的,根本没有 α 可以挖掘。

 

Score:这是一个把当期对 α 的预测值 f 按照过去的预测进行标准化后的一个标准化分数。它代表了在此时此刻,该基金经理对这支股票的看好的程度。这么说也许不够直白。举个例子来说,假设这个基金经理有一个非常厉害的模型,每次都能预测个八九不离十,这次的预测值 f 为 -1%,假设它标准化后的分数为 -2。因此score就等于 -2,说明该模型在当期对这支股票相当不看好。


2 数学含义


在这篇文章中,Grinold 虽然使用了大量的例子来阐述这三要素在解释 α 时发挥的作用,但它并没有具体给出公式 α = Volatility × IC × Score 的推导。下面我们就来从数学上说明这个公式的美妙之处,它可以通过对 α 收益率以及它的预测值f的历史时间序列进行线性回归来得到。


用时间序列 f 对时间序列 α 做线性回归模型有:


image.png


其中,a 和 b 是回归系数,ε 是回归误差,一般假设 ε 的期望为 0。通过历史数据,利用最小二乘法对上述模型求解可以得到参数 a 和 b 的最优值:


image.png


将得到的 a 和 b 的最优参数带回到上面的回归模型中,并舍去回归误差项,可得:


e3.png

由于 E[α] 是 α 的历史均值,对任何一期的 α 都是一样的,因此真正影响 α 的是后面这三项的乘积,即 α = IC × Volatility × Score。如果用一句话来说清楚这个 α 公式的含义就是:如果股票本身有 α 可以挖掘(α 的 Volatility 波动率大)、我有一个准确的预测方法(在历史上预测值 f 和 α 之间的 IC 高),并且当期我的预测值 f 非常好(我对这个股票非常有信心),那么我就可以预期这支股票在未来有不错的超额收益 α。


在这三要素中,α 自身的波动由股票所处的行业和公司的性质所决定。更能反映基金经理本事的是长期的预测能力(IC)以及在当前的判断(Score)。在我看来,高IC是最重要的条件,否则不管 Score 多高,如果模型压根就不能有效的预测 α(低 IC),那么一切都是枉然。当然,如果有了高的 IC,那么我们只需要找到在当前时刻的预测中 Score 高的那些股票买入即可。所以,所有靠选股为生的主动型基金经理大概都在较劲脑汁的想找到一个可以提高 IC 的 α 预测模型或者方法。


3 另一种形式


Grinold 最初提出的 α 三因素公式就如同前面小节所说明的那样,我们预测的是 α 本身,回归时是在时间维度对预测值f的时间序列和实际 α 的时间序列进行回归。然而预测 α 本身终究是困难的,更常见的做法是寻找能够挖掘 α 收益率的因子,使用因子本身的值对 α 建模,并通过截面回归来分析这类模型是否具有挖掘 α 的能力,这就是 α 三因素公式的变种。


截面回归是在给定的时间节点,使用所有股票在该时点在某一因子上的取值对下一时刻股票的 α 收益进行回归分析。令向量 d 为所有股票在时刻 t 的因子暴露,α 为所有股票在 t+1 时刻的 α 收益率向量,利用线性回归便可以得到与本文第二节中相似的结果:


e4.png

虽然公式看起来很相似,但这里的解释略有不同:E[α] 是所有股票在 t+1 时刻的期望 α 收益,它应该近似的等于 0。IC 是该因子和 α 的截面相关系数,它衡量在 t 时刻,该因子是否具备优秀的选股能力。Volatility 是所有股票 α 收益的截面波动率,它描述的是个股 α 收益率的差异性。Score 衡量个股在因子上取值的强弱。


总结来说,因子和 α 收益率的相关性越高,个股 α 的差异性越大,我们的选股基础就越好。在这个基础上,只需要按照该因子选出分数高的股票就可以预期得到超额的 α 收益。如果所有股票的 α 都一样(Volatility = 0)或者所有股票的因子取值都一样(Score = 0),那么上式就相当于 α = 0,也就是说根本无法通过该因子选出含有超额 α 收益的股票;只有因子和 α 收益率的相关性越高,股票的差异性越大(α 和因子的差异性都是越大越好),才越有可能找出 α。


截面回归方法往往是一种事后验证。即我们在已知 t+1 时刻所有股票的 α 的前提下,用 t 时刻的因子取值对 α 进行回归,以此来衡量该因子在t时刻的选股能力。然而,由于不同因子之间有相关性,这种衡量方法其实也是有一定缺陷的。此外,t 时刻的选股能力更不能保证在 t+1 时刻该因子仍然有同样的选股能力。要正确判断一个因子的选股能力仍然需要从时间维度上的考察通过该因子构造的纯因子投资组合(即排除其他因子对目标因子的干扰)是否可以持续的获得超额收益。



免责声明:入市有风险,投资需谨慎。在任何情况下,本文的内容、信息及数据或所表述的意见并不构成对任何人的投资建议。在任何情况下,本文作者及所属机构不对任何人因使用本文的任何内容所引致的任何损失负任何责任。除特别说明外,文中图表均直接或间接来自于相应论文,仅为介绍之用,版权归原作者和期刊所有。