出色不如走运?

发布时间:2016-12-07  |   来源: 川总写量化

作者:石川


1 巴菲特的类比


1984 年,沃伦•巴菲特在介绍格伦厄姆和多德的价值投资流派时,举了下面这个例子:


I would like you to imagine a national coin-flipping contest." Let's imagine all 268 million people in the United States are asked to wager one dollar on their ability to call the flip of a coin. "If they call correctly, they win a dollar from those who called wrong." After each flip the losers drop out, and on the subsequent flip the stakes multiply. Each person has a 50-50 chance of calling each flip and approximately half of the people will lose and drop out each round. After ten flips there would be approximately 260,000 people that had successfully called ten consecutive coin flips. After 20 flips, based purely on chance, there would be approximately 250 people that had called 20 consecutive coin flips - a seemingly miraculous feat


它的意思是说:假设全美国 2.7 亿人都下注 1 美元来猜扔硬币的结果(猜对的概率是50%),猜对的人得到 2 块钱,猜错的人出局。在此后的每一轮中,仍未被淘汰的人继续押注它们的所有赌资,猜对后赌资翻倍,猜错出局,以此类推。这样,10 轮过后,大概还会剩下 26 万人(即 10 轮全部猜对);20 轮后,2.7 亿人中还会剩下 250 人左右(即 20 轮全部猜对)。有 250 人连续猜对 20 轮扔硬币的结果,多么不可思议!


连续猜对 20 轮后,剩余的这些人将会有超过 1 百万美元!连续猜对 20 次,打败了剩下的近 2.7 亿人,从 1 元轻松赚到 100万,这些人听起来简直就像是天选之人!但他们的成就真的是出于他们自身的某种特质,还仅仅是依靠运气呢?


巴菲特想通过这个故事表达的道理还没有讲完,但让我们先把它放下,先来看看下面这个简单的计算。


2 仅靠运气胜出的“牛人”


如果你从大街上随便抓一个人,然后让他连续猜 20 次硬币的正反,那么他全部猜对的概率微乎其微(顺便说一句,如果你真的碰上这么一个全猜对的牛人,那么他很可能是真牛逼!)。但是,如果许多许多人一起猜硬币,那么是否一定会从中脱颖出来一个“牛人”呢?这样找出来的“牛人”是否可信呢(即他是真牛还是仅仅是运气呢)?这些问题可以通过下面的概率模型来回答。


对于一个人来说,假设他猜扔硬币的结果 n 次,每次猜对的概率为 p(p = 0.5),不同次猜的结果相互独立。那么,这个人在 n 次中猜对 k 次的概率符合二项分布。令 X 表示这个人猜对的次数。显然,它是一个随机变量,满足以下概率质量函数(probability mass function):


image.png


如果以这个人猜对个数的多少来衡量他是否厉害,那么我们关心的则是他在 n 次中至少猜对 k 次的概率,即:


image.png


接下来,我们找来了好多好多人,一共有 m 位。我们想看看这 m 个人里面最厉害的人猜对次数的概率分布。根据我们对厉害的定义,这 m 个人里面最厉害的一定是在这些人中猜对次数最多的那一个。因此,如果用 Y 代表这个最厉害的人在 n 次中猜对的个数,那么不难发现,Y 和每个人猜对次数 X 的关系为 Y = max(X_1, X_2, …, X_m)。这其中 Xi 是第 i 个人猜对的次数。在这种关系下,不难推导出 Y 的累积分布函数(cumulative distribution function):


image.png


由此不难计算出最厉害的人至少猜对 k 次的概率,即 Y ≥ k 的概率:


image.png


同样,我们也可以从 CDF 反推出 Y 的PMF:


image.png


得到 PMF 后,我们可以求出 Y 的期望和方差:


image.png


下面我们就来看看,随着人数的增多,最厉害的人猜对 k 次的概率,即 prob(Y = k),是如何随人数 m 变化的。令轮次 n = 20,猜对概率 p = 0.5,下图分别表示了当我们有 1 个人,100 个人,以及 10000 个人猜硬币时,Y 的概率分布。


f1.png


可以明显的看出,随着参与人数的增多,Y 的概率质量函数(pmf)在横坐标轴上向右移动,且变的越来越窄。Y 的 pmf 向右平移说明随着人数的增多,最厉害之人的水平越来越高:当只有 1 个人猜时,他猜对 10 次的概率最高(因为每次有二分之一的概率猜对,一共猜 20 次);当人数上升到 100 人时,他们之中猜的最好的那个人最有可能猜对 15 次;当有 10000 人同时猜时,最好的那个最有可能猜对 18 次。这正所谓“水涨船高”。Y 的 pmf 变窄说明它的标准差越来越小;换句话说,随着人数的增多,我们对于这其中最厉害人猜对的个数的判断将越来越有信心。


下面再让我们来看看最厉害的人至少猜对 k 次的概率,即 prob(Y ≥ k),是如何随人数 m 变化的。下图分别为 k 取 18,19 以及 20 的情况(轮次仍然是一共 20 轮)。比如,绿色曲线表示的是 prob(Y ≥ 19) 是如何随 m 变化的。可以看到,在参与的人数大约为 30 万人时,最厉害之人至少猜对 19 轮的概率就已经非常接近 1。换句话说,我们可以断言,如果有 30 万人同时参与猜硬币的游戏,那么一定会至少有一个人从中脱颖而出,猜对至少 19 轮。当 k = 20(即 20 轮全部猜对)时,prob(Y ≥ 20) 的概率也是随 m 单调递增的,虽然速度比起 k = 19 时要慢得多。当 1 百万人同时猜硬币的时候,最厉害的那个人有超过 60% 的概率猜对全部的 20 轮。


f2.png


从上面的结果不难发现,当越来越多的人参与猜硬币的游戏后,总会出现一个或者多个最厉害的“天选之人”,会全部猜对,令众粉丝惊呼。这些人也许会将这种幸运误以为是自己的天生神力;也许还会开始在自媒体上大肆曝光、出书、给迷信的人讲座、开启网红之路、站上人生巅峰。殊不知这这种结果的出现仅仅是靠运气(pure luck),一切皆枉然。


3 投资界


上面这个例子在证券投资界也有着完美的体现。下面这类场景你一定不陌生:每年末在各大基金或者阳光私募排行的榜单上,都有收益率嗷嗷牛叉的 top 10。又或者在民间量化平台(诸如果仁网)首页上的推荐策略中,各种上榜的策略那无论从回测还是到实盘,其业绩让人看来都啧啧称奇,感叹这些人赚钱简直如探囊取物一般简单。


相信看过猜硬币的例子后你能够明白,这些上榜的例子和猜硬币中的那些最厉害的人并没有太大的差异。为了进一步说服你,让我们假设一个股票型投资策略的年化收益率 X 符合均值为 10%,标准差为 20% 的正态分布。假设市场中有 m 支股票型基金,则它们中最好的那个的收益率 Y 是 X 的函数,Y = max(X_1, X_2, …, X_m)。类似上节中的计算不难得到关于 Y 的概率分布和各种统计值。比如,下图是当有 3000 支基金时,其中最好的那个的收益率分布和单独一支基金收益率分布的比较:和猜硬币的例子一样,最好的那支的收益率分布在横坐标上向右移动且变的更窄。


f3.png


下图为 prob(Y ≥ 0.7) ——最好的那个基金的年化收益率超过 70% 的概率——随基金个数 m 变化的结果。同时,我们也给出了 Y 的均值和标准差随 m 的变化。随着 m 的增大,prob(Y ≥ 0.7) 向 1 逼近(即我们越来越确定总会有一些基金脱颖而出,年化收益率超过 70%)。这种判断也同样可以被 Y 的均值和方差来证明:随着基金个数的增大,最好的基金的年化收益率的均值也在增加,且标准差在减小。


f4.png


这个结果告诉我们,看到各种榜单上无敌的产品根本不足为奇。但我们内心真正关心的问题是:这些上榜的基金取得的优异业绩靠的到底是运气(比如评比的当年的市场恰好适合它们的策略),还是一套真正的科学投资体系?看看基金的排名,不禁让人心灰意冷。


下图为 2015 年净值增长最高的前 12 支偏股混合型基金。这些在 2015 年风光无限的基金在 2014 年如何呢?可谓惨不忍睹。我不想不负责任的基于此就认为这些基金 2015 年的表现纯粹是来自运气。但同样的,如果让我来选基金,我也不会把投资人的钱轻易的就交给它们管理。毕竟,短期的“运气”无法说明任何“能力”。这不是“实力强”,而是“人生状态比较好”。


f5.png


4 巴菲特的深意


下面我们回头来看巴菲特的例子。他通过猜硬币的例子真正想说明的是,如果猜对的 250 个人仅仅凭借的是运气,那么按照随机性,这些人应该来自美国的各个不同的地方。但是,如果这些人里面有大一部分(远超过随机性所对应的数字)来自一个名为“格伦厄姆和多德的小镇”呢?那就要好好看看这些出自该小镇的人拥有哪些共同的特质。


众所周知,格伦厄姆和多德是价值投资的开山鼻祖,而巴菲特无异于最好的继承者。他通过这个例子想要说明的是,价值投资是一个经过风雨考验的科学投资系统,这些真正掌握该系统的人会长屹立于证券投资之林,这些人在投资界可以做到靠真正的能力来持续的“猜对硬币”(赚到钱)。


时间才是检验一个基金或者一个基金经理是否优异的唯一标准。


为此,我们从时间维度再做最后一个实验。我们仍然假设一个基金年化收益率 X 的分布符合正态分布。此外,我们考虑该基金在连续 T 年内中最差的那一年的收益率作为评价该基金水平的一个标准,令 Z 代表这个收益率,因此我们有 Z = min(X_1, X_2, …, X_T)。


假设该基金的年化收益率为 N(0.2, 0.3),并令 T = 5 年。Z 的分布如下图所示。Z 的均值为 -14.4%,标准差为 20.0%。最差年份中,期望收益为亏损 14% 以上。面对 20% 的期望收益,恐怕没有人想遇到这样的年景。


f6.png


这支基金年化收益率的期望有 20%,似乎足够吸引人。但是,之所以产生这么差的结果是因为该基金年化收益率分布的标准差太大(我们假设 0.3)。标准差是用来衡量一支基金的稳定程度,那自然越小越好;越小说明年与年之间,它的表现越稳定。


这个结论不难证明。假设其他条件不变而仅改变收益率标准差后,得到的 Z 的均值如下图所示,可见标准差越小(即基金的水平越稳定),最差年份的收益率才会越高。


f7.png


时间永远是稳定性最大的敌人。上面的实验仅仅考虑了 5 年的情况。如果我们把时间拉长又会怎样呢?不同的收益率标准差能否禁得起时间的考验呢?下图显示了标准差分别为 2%,5%,以及 10% 的情况(收益率期望仍然为 20%),时间跨度从5年到30年。当一个基金足够稳健(标准差为 2%),它在 30 年内的最差收益的期望也不会差到哪里。但如果它不够稳健(标准差为 10%),它的表现一定是会在时间面前褪色的。


f8.png


时间又从来都是一个科学投资体系的朋友。上图同时说明,随着时间的正常,这三个不同 sigma 的曲线之间的差距逐渐增大。这说明,如果仅仅看短期(3 到 5 年),我们还无法准确的判断滥竽充数者,但它们一定会在时间的冲刷下原形毕露的。但是,我们国内的基金又有多少有 10 年甚至更长的历史呢?那些“著名”的基金经理又有多少有记载可回溯的 track record 呢?在这种背景下就来大搞 MOM 和 FOF,在我看来是国内投资界所面对的困扰。再来看看巴菲特的表现。下图是美国拥有 30 年以上历史的基金的信息率(类似夏普率)分布图。在 30 年尺度的丈量下,巴菲特的表现有目共睹(排名第二)。这也许是对来自“格伦厄姆和多德小镇”的投资者最好的褒奖。


f9.png


5 结语


优秀的业绩是靠运气还是来自实力?时间是评判这一切的唯一标准。面对一个潜在的好的策略或者基金产品,我们切记不要被它完美的业绩所迷惑双眼,必须时刻保持理智,冷静的对其历史业绩进行业绩归因,客观的考量投资团队以及风控体系。这一切有不得半点马虎,来不得半点急躁。



免责声明:入市有风险,投资需谨慎。在任何情况下,本文的内容、信息及数据或所表述的意见并不构成对任何人的投资建议。在任何情况下,本文作者及所属机构不对任何人因使用本文的任何内容所引致的任何损失负任何责任。除特别说明外,文中图表均直接或间接来自于相应论文,仅为介绍之用,版权归原作者和期刊所有。