Augmented Fama-MacBeth Regression
发布时间:2023-06-05 | 来源: 川总写量化
作者:石川
摘要:增强版 Fama-MacBeth Regression 是研究 nontradable factor 的利器。
1
因子有 tradable factors 和 nontradable factors 之分。对于前者而言,常见的做法是直接用公司特征构造 managed portfolios;而对于后者,Fama-MacBeth two-pass regression 往往是首选,即在第一步中在时序上用资产(超额)收益率对因子取值回归来估计
式中
2
在上述过程中,如果 nontradable factors 数量众多(比如远远超过 ad-hoc 模型中通常使用的 3 – 5 个因子)且高度相关,那么回归估计就会有巨大的误差。因此,一个自然的想法就是对因子进行降维处理。这时,我们便可以请出这几年非常火的 IPCA(工具变量 PCA)方法(Kelly, Pruitt, and Su 2019)。该方法将
其中
在实际应用中,
值得一提的是,虽然上述最优化问题中的变量包括
3
在第二节中,我们将 IPCA 加入到 Fama-MacBeth 中,将原始
为此,在估计
式中
目标函数中第一个罚项(式中第二项)可理解为 column-wise group lasso。如果第
其中
Okay!以上就完成了“augmented”部分的介绍。即我们从 Fama-MacBeth two-pass regression 出发,首先加入了 IPCA 实现了降维,然后又在 IPCA 基础上进而使用 Sparse IPCA 从而确保聚焦于只和
4
前面三节简单说了方法论,本文最后一节来说说应用以及本文的动机。我写今天这篇文章时之所以没有上来就介绍动机,是因为我认为这个 augmented Fama-MacBeth regression 的价值更大,而非下面要介绍的实证结果。这个方法出自 Bybee, Kelly, and Su (forthcoming) 这篇题为 Narrative Asset Pricing 的文章。介绍该文之前,先来简单说一下 Bybee, et al. (forthcoming)。Bybee, et al. (forthcoming) 使用 LDA 将 1984 至 2017 年间华尔街日报的文章分析出了 180 个 topics,并且给每个 topic 计算了一个 attention 的时间序列。(例如,下图展示了 Commodities, Mortgages 以及 Small caps 三个 topics 的 attention 的时间序列。)
再来说 Bybee, Kelly, and Su (forthcoming)。这篇文章的动机是从 ICAPM 出发,猜想财经新闻揭示了投资者关于未来投资机会的信念,从而能够影响资产的价格。为此,该文利用 Bybee, et al. (forthcoming) 构造的 180 个 topics 构造了基于新闻报道的多因子模型,这也是该文题为 Narrative Asset Pricing 的原因。
在实证细节方面,该文使用资产收益率和新闻 topics 时序
在实证结果方面,无论是对 test assets 的定价能力还是因子构造的 OOS 最大夏普比率,该方法构造的新闻因子在和传统基于公司特征的 ad-hoc 多因子模型相比都是不落下风的。以夏普比率而言,当使用 6 个因子时,该模型 OOS 的夏普比率为 1.31,而 FF5 + Carhart 动量的 OOS 夏普比率只有 0.67。仅从实证结果来看,该新闻因子模型构造的最大夏普比率确实不如近年来各种公司特征 + 机器学习所构造的因子。但不要忘了,该模型中的因子仅仅来自资产收益率和新闻的协方差,而没有使用任何公司特征。此外,Bybee, Kelly, and Su (forthcoming) 除了我详细介绍的 return model 之外,还有 news model 的部分。通过它可以反推出 state variables,从而提供公司特征之外的 insights。
而对我而言,该文 Fama-MacBeth regression + IPCA + Sparsity + OOS SR based tuning 这个清晰的框架才是最大的收获。它可以成为分析 nontradable factors 的有力工具之一。
最后,我再忍不住“吐个槽”。Bybee, Kelly, and Su (forthcoming) 如今已经 RFS forthcoming。在 2022 年某个会议上 Kelly 作报告时,他在实证部分几乎每页 slide 都强调他们的结果是 OOS 的。但是,他们使用的 180 个 topics 可是用 1984 到 2017 全局的新闻数据构造出来的(180 这个取值就是通过全局数据最优化选定的)。因此,这样的 asset pricing 结果真的是 100% OOS 吗?鉴于国内顶刊无脑照搬海外顶刊不可阻挡的大趋势,还想对国内的某些(伪)一流学者说一句,如果这篇文章在你的 to replicate list 之上,那么请你在照搬之前至少先搞清楚 Bybee, Kelly, and Su (forthcoming) 最核心的内容是什么。
参考文献
Bybee, L., B. T. Kelly, A. Manela, and D. Xiu (forthcoming). Business news and business cycles. Journal of Finance.
Bybee, L., B. T. Kelly, and Y. Su (forthcoming). Narrative asset pricing: Interpretable systematic risk factors from news text. Review of Financial Studies.
Kelly, B. T., S. Pruitt, and Y. Su (2019). Characteristics are covariances A unified model of risk and return. Journal of Financial Economics 134(3), 501 – 524.
免责声明:入市有风险,投资需谨慎。在任何情况下,本文的内容、信息及数据或所表述的意见并不构成对任何人的投资建议。在任何情况下,本文作者及所属机构不对任何人因使用本文的任何内容所引致的任何损失负任何责任。除特别说明外,文中图表均直接或间接来自于相应论文,仅为介绍之用,版权归原作者和期刊所有。