随笔

发布时间:2021-10-25  |   来源: 川总写量化

作者:石川

摘要:我们需要什么样的学术研究?


论文看多了总会有些想法。


而当一个适当的契机出现,引燃了这些想法时,就总想说点什么。


这个契机就是 [因子动物园] 园长发给我的两张图。


下面是第一张,它按学校统计了 2015 到 2020 年这六年间发表在金融学 Top 3 顶刊(JF、JFE 以及 RFS)+ JFQA 上的论文数。



再来看第二张图,它和第一张很像,只不过统计的时候去掉了 JFQA,因此它展示了不同学校在这六年间发表在 Top 3 上的论文数。



怎么样?发现什么没有?


有小伙伴发现 UChicago 高居第一,这并不意外。但是,真正让人吃惊的是,无论是否考虑 JFQA,UChicago 的总论文数是一样的,都是 91 篇!也就是说,UChicago 在过去六年没有发过 JFQA,要发只发 Top 3![1]


BTW,这个统计的地址为 http://apps.wpcarey.asu.edu/fin-rankings/rankings/results.cfm,感兴趣的小伙伴可以自行查看。即便我们看考察 1990 年到 2020 年的数据,UChicago 也仅在 JFQA 上发表了 6 篇。


这样的结果真的给我很大的震撼,伴随而来的是深深的共鸣。因为每当有人问我阅读论文的建议时,我给出的答案都是:只看 Top 3 顶刊 + 顶级学者的 SSRN + 顶会(例如 AFA,EFA,SFS,WFA 等)。


最近几年,我的一个越来越强烈的感受就是,真正好的文章一定只会发在 Top 3 上。而且对于功成身就的大佬来说,如果一些文章一时不足以发顶刊,宁愿挂 SSRN 也不会凑合。所以才有上面的建议,看顶刊 + 顶级学者的 SSRN。(顶会部分稍后再说。)


说完了从哪里看,自然要接着说看什么。在这方面,下面这张图又把我震撼了。


众所周知,美国金融协会(AFA)每年当值主席卸任前都会发表一个主席演讲,而主席演讲之后都会刊发到 JF 上。下图展示了 2011 年到 2020 年十年间 AFA 主席演讲论文的 google scholar citations 次数。你能不能猜到引用最高的是哪些我们耳熟能详的文章?我给你一个 hint:2015 年的那篇和资产定价无关。



OK!如果不看 2015,剩下的无疑是 2011 和 2017,而 2011 又以压倒性优势胜出。即便考虑了发表年限的差异,它的领先优势也足够明显。2011 是哪篇?Cochrane (2011)!John Cochrane 对因子的铿锵三问,他首次提出的 zoo of factors 直击人心。2017 又是哪篇?Harvey (2017)!Campbell Harvey 对 p-hacking 的灵魂拷问,他主张学术界正视并解决 publication bias 问题的担当令人钦佩。


这两篇文章的高引用表明了两点:(1)资产定价是一个重要的课题;(2)传统资产定价研究中发现的各种异象和因子可能存在很大问题。


对于量化投资来说,资产定价无论是方法论进展还是实证发现都颇具价值。但是当我们意识到 p-hacking 和 publication bias 的存在大大“污染”了实证结果时,这些研究自然也就大打折扣。所以,对看什么的问题,我的建议是看方法优于看实证。(关于最新理论前沿的 review 见《实证资产定价理论新进展》。)


在理论方面,我前不久在知乎上回答了一个 2020 年印象最深刻的金融学论文的问题,推荐了两篇我心中好的研究:Harvey and Liu (2020)[2] 以及 Kozak, Nagel, and Santosh (2020)。


Harvey and Liu (2020) 提出了一个基于双重 bootstrap 的类贝叶斯多重假设检验框架。该方法通过引入参数      控制先验中真实异象的比例,并通过双重 bootstrap 让人们在控制 Type I error rate 的同时也能够权衡 Type II error rate。此外,该文的灵活性在于它可以自如的应对具体的问题。不同的候选异象、不同的      的选择(来自研究者的经验)、不同的分析目标(Type I vs Type II)会得到不同的 t-statistic 阈值。因此,该框架让人们解决最关心的问题,而不是不加区分的使用某个统一的阈值(比如 3.0)。


Kozak, Nagel, and Santosh (2020) 获得了 2020 JFE Fama-DFA best paper award,实至名归。资产定价理论告诉我们,传统多因子模型、mean-variance efficient frontier 以及 SDF 三者之间的等价关系[3][4]。一旦找到了 SDF,就相当于找到了 mean-variance efficient frontier,就相当于找到了多因子模型。


在求解 tangency portfolio 时,有两个难点需要考虑:(1)选择哪些 assets;(2)如何以获得样本外最高 SR 为目标来求解 MVO 问题。Kozak, Nagel, and Santosh (2020) 直接回答了这两个问题。在 assets 方面,该文使用了大量因子投资组合。在最优化方面,由于因子太多导致的过拟合和维数灾难问题,因此该文使用了 elastic net 方法对 variance 进行了 shrinkage,并获得了很好的样本外效果。


不过,有意思的是,就在当时我刚在知乎上回答完这个问题后几分钟,有小伙伴留言说,因为见刊往往很慢,所以这两篇文章其实早就出来了。


True。


所以我后来又更新了个 working paper 版本的回答,推荐了 Harvey and Liu (2021b)[5] 以及 Bryzgalova, Pelger, and Zhu (2020)[6]。


无论是学术界还是业界,大家共同的认知是所有异象预期收益联合为零这个原假设一定会被拒绝,即人们都认可有一部分异象是显著的。因此,研究 p-hacking 时,关注于以下这两个真正需要被回答的问题:(1)在 p-hacking 以及 publication bias 的影响下,有多少比例的异象是真实的?人们认同 p-hacking alone 无法解释 t-statistics 超过 6.0 或者 8.0 的异象,但也知道它会造成很多 t-statistics 为 2.0 或者 3.0 的异象。而所有异象中,到底有多少是真实的?(2)对于通过检验的异象(即被认为是真实的),它们样本外收益率的收缩系数是多少?Harvey and Liu (2021) 通过对发表过程建模和参数校准,正面回答了这些问题。


Bryzgalova, Pelger, and Zhu (2020) 则是 Kozak, Nagel, and Santosh (2020) 的拓展。首先在 assets 方面,Bryzgalova, Pelger, and Zhu (2020) 以给定的 firm characteristics 为划分依据,通过构建 asset pricing tree 构成了大量的 portfolios,然后从中挑选出最能代表股票收益率截面差异的 portfolios 作为 basis assets。在最优化方面,该文额外加入了对 mean 的 shrinkage。整体来看,Bryzgalova, Pelger, and Zhu (2020) 较 Kozak, Nagel, and Santosh (2020) 使用了更优的 assets 以及更稳健的 MVO,取得了更好的效果。


说到 working papers,不妨插一句。公众号在过去几年也解读了很多彼时令我眼前一亮的 working papers。据不完全统计,介绍(或点评)过的很多文章最终都发表或者即将发表在顶刊上(下表),令人欣慰。


f5.png


再回到从哪看的问题,上面的例子说明了 working papers 的重要性。由于最具潜力的 working papers 都会去金融学顶会上报告,因此在本文开头的阅读论文建议中,我还加入了各大金融学顶会。最后能发表在顶刊上的论文,十有八九都会在各大顶会上被讨论个底儿朝天,所以看顶刊 + 顶级学者 SSRN + 看顶会,几乎不会错过任何真正有价值的研究。


以上就是 UChicago 的“降维打击”令我引发的思考。希望各位小伙伴能够从好的研究中获得更多的灵感。


最后“蹭个热点”。2021 年新科诺贝尔经济学奖获得者 Joshua Angrist 在 2013 年接受 MIT News 采访时曾说过:


It’s the combination of a cool tool applied to a central question that leads to good research.


这不正是我们需要的学术研究?



备注:

[1] 发文只发 Top 3 的表述并不严谨,因为 UChicago 的教授也会因为特殊原因而受邀在其他期刊上发文,比如 Ray Ball,见《致敬经典:Ball and Brown (1968)》

[2] 见《出色不如走运 (V)?》

[3] 见《FF3 们背后的资产定价理论》

[4] 见《寻找 Mean-Variance Frontier》

[5] 见《出色不如走运 (VI)?》

[6] 见《Which Test Assets ?》



延伸阅读:公众号之前介绍的 working papers,后来发表或即将发表于顶刊的文章如下:

[1]《出色不如走运 (II)?》

[2]《Anomalies, Factors, and Multi-Factor Models》

[3]《一个加入行为因子的复合模型》

[4]《BAB vs BABAB》

[5]《前景理论与股票收益(II)》

[6]《Factor War 外传》

[7]《False In-Sample Predictability ?》

[8]《出色不如走运 (VI) ?》



参考文献

Barberis, N., L. J. Jin, and B. Wang (2021). Prospect theory and stock market anomalies. Journal of Finance 76(5), 2639 – 2687.

Bryzgalova, S., J. Huang, and C. Julliard (2021). Bayesian solutions for the factor zoo: We just run two quadrillion models. Journal of Finance conditionally accepted.

Bryzgalova, S., M. Pelger, and J. Zhu (2020). Forest through the trees: Building cross-sections of stock returns. Working paper.

Cochrane, J. H. (2011). Presidential address: Discount rates. Journal of Finance 66(4), 1047 – 1108.

Daniel, K. D., D. A. Hirshleifer, and L. Sun (2020). Short- and long-horizon behavioral factors. Review of Financial Studies 33(4), 1673 – 1736.

Harvey, C. R. (2017). Presidential address: The scientific outlook in financial economics. Journal of Finance 72(4), 1399 – 1440.

Harvey, C. R. and Y. Liu (2020). False (and missed) discoveries in financial economics. Journal of Finance 75(5), 2503 – 2553.

Harvey, C. R. and Y. Liu (2021a). Lucky factors. Journal of Financial Economics forthcoming.

Harvey, C. R. and Y. Liu (2021b). Uncovering the iceberg from its tip: A model of publication bias and p-hacking. Working paper.

Hou, K., C. Xue, and L. Zhang (2020). Replicating anomalies. Review of Financial Studies 33(5), 2019 – 2133.

Jensen, T. I., B. T. Kelly, and L. H. Pedersen (2021). Is there a replication crisis in finance? Journal of Finance forthcoming.

Kozak, S., S. Nagel, and S. Santosh (2020). Shrinking the cross-section. Journal of Financial Economics 135(2), 271 – 292.

Martin, I. and S. Nagel (2021). Market efficiency in the age of big data. Journal of Financial Economics forthcoming.



免责声明:入市有风险,投资需谨慎。在任何情况下,本文的内容、信息及数据或所表述的意见并不构成对任何人的投资建议。在任何情况下,本文作者及所属机构不对任何人因使用本文的任何内容所引致的任何损失负任何责任。除特别说明外,文中图表均直接或间接来自于相应论文,仅为介绍之用,版权归原作者和期刊所有。