一个混合四因子模型

发布时间：2021-09-14 | 来源: 川总写量化

作者：BetaPlus 小组

摘要：本文针对 A 股市场，在市场和规模因子的基础上，加入来自行为金融学的反应过度与反应不足因子，提出一个混合四因子模型。

终于能够介绍 BetaPlus 小组自己的多因子模型[1]。

为了推动行为金融学在 A 股市场的应用，少数派投资今年举办了首届“少数派”行为金融主题征文活动。BetaPlus 小组以《反应过度、反应不足与股票收益》一文参与了该活动，得到了主办方和评委的肯定[2]。

该项研究首先定量刻画了 A 股市场的反应过度和反应不足程度。接下来，考虑到 A 股市场个人投资者占比高、错误定价普遍存在，我们将二者和市场以及规模组合在一起，构造了一个混合四因子模型。实证数据显示，该模型能够解释诸多异象，并优于学术界针对美股市场提出的 Stambaugh and Yuan (2017) 以及 Daniel, Hirshleifer, and Sun (2020) 行为多因子模型。

下面就来介绍这个模型。此外，该模型的因子收益率数据已被上传到《因子投资：方法与实践》的配套网站 www.factorwar.com（细节见本文附录 A），供感兴趣的小伙伴下载。

1 研究动机

经典资产定价理论认为，异象的超额收益源于承担某种系统性风险的补偿。然而，大量实证数据显示，仅靠风险补偿无法解释全部异象。另一方面，行为金融学认为投资者有限理性，人们的系统性偏差导致资产的价格和内在价值的偏离，造成了股票收益率的共同运动（即异象）。对于 A 股市场来说，投资者结构以个人投资者为主。因此，如何从行为金融学角度理解投资者行为对股票预期收益的影响？能否基于此构造更有效的投资策略？这些都是亟待探索的问题。

为了回答上述问题，能否直接照搬美股的经验呢？众所周知，针对美股，已有 Stambaugh and Yuan (2017) 以及 Daniel, Hirshleifer, and Sun (2020) 这两个从行为金融学角度研究资产定价的开创性研究。但对于 A 股，出于以下两个原因，我们认为应该寻找新的切入视角：

1. Stambaugh and Yuan (2017) 对 PERF 和 MGMT 跟投资者行为偏差的关联阐述地并不十分清晰；另一方面，Daniel, Hirshleifer, and Sun(2020) 强调长期融资相关的行为偏差和资产定价解释，在 A 股回购等不普遍的情况下，FIN 因子在 A 股的影响十分有限。

2. 行为金融学研究表明投资者对信息的反应并非如理性预期模型那样恰到好处，而是存在预期中的偏差，导致反应过度或反应不足。A 股市场中投资者的反应过度被人们广泛接受。

除上述原因外，大量实证研究表明，反应过度和反应不足能够解释股票市场中的诸多异象（Chen et al. (2020), He, Wang, and Yu (2020)），例如中期动量（Barberis, Shleifer, and Vishny (1998)）、长期反转（Hong and Stein (1999)）、价值（Daniel, Hirshleifer, and Subrahmanyam (1998, 2001)）以及 PEAD（Hirshleifer, Lim, and Teoh (2009)）。综上考虑，本文选择反应过度和反应不足作为在 A 股研究行为金融学的切入点。除了定量刻画反应过度和反应不足之外，研究关注的另一个问题就是基于二者的行为因子与股票预期收益之间的关系。换言之，从行为金融学出发能否提出适合于 A 股市场的多因子模型。

近年来，针对美股的两个行为因子模型的接连发表说明它们有益的补充了传统的风险因子。而我们也可以通过和风险因子的类比来理解行为因子。风险因子指的是公司共同暴露的各种系统性风险，可以通过和风险相关的公司特征来构造，例如 Fama and French (1993) 三因子模型；而行为因子则刻画了公司共同暴露的投资者行为偏差造成的错误定价，可以通过和错误定价相关的公司特征构造，例如前文提到的两个模型。所以，研究的第二个目标是检验基于反应过度和反应不足的多因子模型在 A 股的定价能力。

2 反应过度与反应不足

研究投资者反应过度和反应不足的难点在于它们是不可观测的，因此需要使用合适的代理变量。由于反应过度和反应不足造成的错误定价是很多股票市场异象背后的根源，因此可以通过寻找适当的异象来刻画投资者对股票反应过度或反应不足的程度。综合学术文献、数据可得性以及异象在 A 股的合理性，本文为反应过度和反应不足分别选择了 5 个代表性异象。下表汇总了异象的构造变量、文献出处以及计算方法。

由于绝大多数异象都是针对美股提出的，因此首先检验它们在 A 股市场的有效性。在以下实证中，数据来源为 Wind 和 Tushare，实证区间是 2000 年 1 月 1 日到 2021 年 5 月 31 日，通过投资组合排序法（portfolio sort）构造的频率为月频。在每月末，对给定的异象变量，依照如下步骤构造投资组合：

1. 剔除黑名单、不可交易股票以及剔除异常值[3]；

2. 将股票在截面上根据变量和预期收益的金融学先验相关性分成 10 组，使得排序后第 10 组的预期收益最高，第 1 组的预期收益最低；

3. 第 10 组和第 1 组的收益率之差即为异象的超额收益，多空两组内股票同时考虑等权和市值加权。

在实证区间内，反应过度异象月均超额收益检验结果为：

反应不足异象月均超额收益的检验结果为：

有结果可知，所选的异象在 A 股中的实证结果均满足月均超额收益为正。对于反应过度异象来说，所有异象在等权构造下均可获得显著的超额收益；当采用市值加权时，它们的表现有所减弱，说明受到小市值的影响。反观反应不足异象，它们在 A 股获得超额收益的能力不如反应过度异象。由于 A 股市场中个人投资者的占比较高，反应过度较反应不足更加严重，因此上述结果符合预期。虽然个别异象在 A 股市场并不显著，但后文依然选择保留全部异象变量，而非根据实证结果进行进一步筛选，从而避免样本内的 p-hacking（Harvey (2017)）。另一方面，综合多个变量构造综合指数也有益于保证实证结果的稳健性。

利用上述异象并参考 Stambaugh and Yuan (2017)，我们通过综合每类的 5 个异象构造综合得分，以此评价投资者对每支股票反应过度或反应不足的程度。在每月末，将股票在截面上根据每个异象变量和预期收益的相关性分成 10 组，正相关则从小到大排序，负相关则从大到小排序，排名越靠后排名得分越高。接下来，将每一类的五个异象的排名取平均，便得到各自的综合得分。值得强调的是，反应过度和未来收益负相关，而反应不足和未来收益正相关。因此，对于反应过度，其综合得分高（低）的股票是投资者反应过度最微弱（最严重）的股票；反观反应不足，综合得分高（低）的股票是投资者反应不足最严重（最微弱）的股票。

下表展示了按照综合得分高低划分成 10 组的描述性统计，考察的对象包括市值、换手率、波动率、估值（市净率）以及盈利水平（ROA）。以市值为例，这二者的综合得分都均和市值正相关。对于前者，得分低说明反应过度严重，因此该结果说明小市值的股票中更容易出现反应过度；反观后者，得分高说明反应不足严重，因此该结果说明大市值股票中更容易出现反应不足。

利用综合得分，通过 portfolio sort 检验反应过度和反应不足的月均收益率。反应过度检验结果如下：

反应不足检验结果：

从结果可知，等权时两个效应均非常显著，其中反应过度的月均超额收益率为 2.01%（t-statistic 高达 7.45），反应不足的月均超额收益率为 1.16%（t-statistic 高达 4.29）。市值加权时，二者均有不同程度的减弱，反应过度的月均超额收益率为 1.24%（t-statistic 为 3.20），而反应不足的月均超额收益率为 0.91%（t-statistic 为 2.39）。但尽管如此，它们依然是在经济上和统计上显著的。

另一方面，上述结果显示二者的多头组合（High）的绝对收益也同样在统计上和经济上显著。结合描述性统计中所显示的多头组合往往以大市值股票为主因而具有较好的流动性的结果，这表明反应过度与反应不足效应对于投资实践极具价值。投资者可以充分利用它们获得风险溢价，而不必担心卖空约束或流动性不足。为了考察 A 股市场中其他风格是否对这两者有潜在影响，我们同时考察了双重（独立）排序的结果。用来排序的常见变量包括市值、换手率、波动率以及账面市值比。无论是等权还是市值加权，无论是反应过度还是反应不足，双重排序得到的月均超额收益率都十分显著。最后，通过计算反应过度和反应不足各自的多空对冲投资组合的累计收益率，便能够刻画这二者在 A 股市场强弱的时序变化（越强预期收益越高）。下图给出了结果。

3 混合四因子模型

自 CAPM 被提出之后，使用线性因子来研究资产定价得到了长足的发展。自 Fama and French (1993) 三因子开始，学术界的主流多因子模型均是从风险角度提出，直到 Stambaugh and Yuan (2017) 和 Daniel, Hirshleifer, and Sun (2020) 出现。基于美股的实证数据也显示，行为因子的加入可以提升 mean-variance efficient frontier，说明了行为因子的必要性。反观 A 股，专门针对 A 股提出的多因子模型当属 Liu, Stambaugh, and Yuan (2019)[4]。该文使用 Earnings-to-Price ratio 代替了 Book-to-Market ratio 构造价值因子，并从股票池中剔除了市值最小的 30% 的股票以排除壳价值污染的影响。由于延续了 Fama and French (1993) 的思想，该模型并非从行为金融学的角度去理解 A 股市场。因此，弥补这方面的空缺就显得尤为重要，这也成为本文提出四因子模型的动机。

我们在市场和规模的基础上，加上反应不足和反应过度，构造了如下混合四因子模型：

$\begin{array}{rll} \mbox{E}[R_i^e]&=&\beta_{i,\mbox{MKT}}(\mbox{E}[R_M]-R_f)+\beta_{i,\mbox{SMB}}\mbox{E}[R_{\mbox{SMB}}]\\ &&+\beta_{i,\mbox{over}}\mbox{E}[R_{\mbox{over}}]+\beta_{i,\mbox{under}}\mbox{E}[R_{\mbox{under}}] \end{array}$

仿照 Fama and French (2015) 的做法，市场因子即为市场组合，其超额收益为市场收益率减去无风险收益率；规模、反应过度以及反应不足三因子的构造方法如下（所有因子的调仓频率均为月频）：

1. 以主板股票总市值中位数为断点将所有股票分成小市值（S）和大市值（B）两组；

2. 以所有股票反应过度综合得分的 30% 和 70% 分位数为断点，将所有股票分为低（LO）、中（MO）、高（HO）三组；

3. 以所有股票反应不足综合得分的 30% 和 70% 分位数为断点，将所有股票分为低（LU）、中（MU）、高（HU）三组；

4. 将两个市值组分别和三个反应过度组以及反应不足组做交叉，共得到12个组合，即 S/LO、S/MO、S/HO、B/LO、B/MO、B/HO、S/LU、S/MU、S/HU、B/LU、B/MU 和 B/HU，每个组合按月再平衡，组内股票按市值加权。

值得一提的是，在本文研究 A 股市场的定价模型中，我们并没有从股票池中剔除市值最低的 30% 股票，且主张这种以“规避壳污染”为由对数据的处理不应成为一种理所当然。相反，按某种给定方式对股票的剔除应成为针对全 A 股实证结果的稳健性检验。利用上述组合，反应过度（Over）、反应不足（Under）以及规模（SMB）因子的构造方式如下：

$\mbox{Over}=\displaystyle\frac{1}{2}(\mbox{S/HO}+\mbox{B/HO})-\frac{1}{2}(\mbox{S/LO}+\mbox{B/LO})\$

$\mbox{Under}=\displaystyle\frac{1}{2}(\mbox{S/HU}+\mbox{B/HU})-\frac{1}{2}(\mbox{S/LU}+\mbox{B/LU})$

$\begin{array}{rll} \mbox{SMB}&=&\displaystyle\frac{1}{2}(\mbox{SMB}_{\mbox{over}}+\mbox{SMB}_{\mbox{under}})\\ \mbox{where SMB}_{\mbox{over}}&=&\displaystyle\frac{1}{3}(\mbox{S/HO}+\mbox{S/MO}+\mbox{S/LO})\\ &&\displaystyle-\frac{1}{3}(\mbox{B/HO}+\mbox{B/MO}+\mbox{B/LO})\\ \mbox{SMB}_{\mbox{under}}&=&\displaystyle\frac{1}{3}(\mbox{S/HU}+\mbox{S/MU}+\mbox{S/LU})\\ &&\displaystyle-\frac{1}{3}(\mbox{B/HU}+\mbox{B/MU}+\mbox{B/LU})\\ \end{array}$

下表汇报了这四个因子月均超额收益率的检验结果。无论是反应过度还是反应不足因子，在实证区间内的月均超额收益都非常显著，其中前者为 1.14%（t-statistic 为 5.53），后者为 0.77%（t-statistic 为 4.20）。市场因子和规模因子的月均超额收益分别为 0.79% 和 0.65%。

为检验该模型的定价能力，下面考察两种方法。首先，根据 Barillas and Shanken (2017) 的思路，考察这四个因子所构造的最大夏普率组合的夏普率。为了让数值有个参照，我们针对 A 股复现了 Stambaugh and Yuan (2017) 以及 Daniel, Hirshleifer, and Sun (2020) 并以它们作为基准[5]。需要说明的是，这两个因子并非针对A股提出，因此面临水土不服的问题。尽管如此，它们仍然是最近接本文的多因子模型。

下表汇报了三个模型各自的因子能够构造的最大年化夏普率。相对于较美股市场提出的模型，本文的四因子模型中的因子能够构造成更高的夏普率，四因子构造的最大年化夏普率高达 2.02，比另两个模型高出一倍多。

除此之外，我们还使用了一系列常见的异象作为测试资产（test assets）来检验模型的定价能力。为了使实证结果尽可能全面，检验中采用了来自包括价值、低风险、盈利、基本面成长、基本质量等 11 大类近 150 个异象，涵盖了学术界发现的所有类别，因而能够充分的检验该模型。

在传统的 t-statistics = 2.0 阈值下，有 35 个异象是显著的。然而，考虑到多重假设检验问题，需要考虑更高的阈值。为此，我们使用 Harvey and Liu (2020) 提出的双重自助法[6]确定适合上述 test assets 的 t-statistic 阈值。在实证中，选择 15% 的先验概率并以 5% 的伪发现率为约束，最终算出的 t-statistic 阈值也是 3.0，这一结果也和 Harvey, Liu, and Zhu (2016) 相符合。依照上述分析，接下来选择 t-statistics 超过 2.0 的异象作为 test assets，并分别检验在 2.0 和 3.0 的 t-statistic 阈值下，三个定价模型下依然显著的异象个数。无论使用哪个阈值，显著的异象个数在混合四因子模型下均要少于其他两个针对美股提出的模型。

综合上述结果，混合四因子模型能够解释绝大多数异象，它为研究 A 股市场中个股预期收益率的截面差异提供了新的思路。

4 结语

A 股市场以个人投资者为主导的投资者结构意味着股票价格中有很多潜在的错误定价。本文研究了反应过度与反应不足现象，以及它们如何影响股票预期收益率的截面差异。由于反应过度和反应不足难以被观测，本文分别选择代表性异象的变量作为它们各自的代理变量，定量刻画了二者的强弱。实证结果显示，这二者在 A 股均能获得显著的超额收益。在上述结果的基础上，本文进而提出一个包括市场、规模、反应过度以及反应不足的混合四因子模型。该模型弥补了行为金融学在 A 股市场定价研究方面的空缺。实证结果显示，该模型具有较好的定价能力，为今后研究 A 股市场的实证资产定价提供了新的思路。

近日，Journal of Finance 上刊载了一篇对于行为金融学来说非常重要的文章（Barberis, Jin, and Wang (2021)）。与其他使用行为金融学解释异象的论文不同，该文从前景理论出发提出了模拟真实世界中投资者投资决策的模型，讨论了均衡状态以及模型参数在市场出清条件下应满足的条件，并使用实际数据进行了参数校准[7]。该文指出通过该模型计算的异象收益率和市场中诸多异象的真实收益率相符，从而解释了异象。可见，该文不再将行为金融学视为获得超额收益的渠道，而是将它视为市场中众多异象产生的根源。相信这篇发表在 Journal of Finance 上的文章能够继续深入推进行为金融学的理论研究和实证应用，我们也再次感谢少数派投资为普及行为金融学而举办的这场活动。期待今后看到更多将行为金融学理论应用于 A 股市场的精彩研究。

A 因子数据下载

本文介绍的混合四因子模型收益率序列（截至 2021 年 8 月 31 日）已经上传到：https://www.factorwar.com/data/factor-models/ 。 混合四因子模型的详细构造方法也已经添加到了更新后的算法说明文档中。

除此之外，有小伙伴反馈，希望除了因子收益率序列外，也能提供构造因子的 basis portfolios 的收益率序列。因此，它来了！在上述因子数据下载页面的最下方，添加了除 CAPM 之外全部多因子模型的 basis portfolios 月均收益率数据下载（是一个 zip 文件，里面同时包含经典算法和极简算法）。

备注：

[1] 关于针对美股提出的主流多因子模型，见《主流多因子模型巡礼》。

[2] 评比结果见此处。

[3] 数据处理方式参考《因子投资：方法与实践》第 3.1 章。

[4] 见《中国版 Fama-French 三因子模型》。

[5] 因子收益率序列见 www.factorwar.com。

[6] 见《出色不如走运(V)?》。

[7] 见《前景理论与股票收益(II)》。

参考文献

Ang, A, R. J. Hodrick, Y. Xing, and X. Zhang (2006). The cross-section of volatility and expected returns. Journal of Finance 61(1), 259 – 299.

Asness, C. S., A. Frazzini, N. J. Gormsen, and L. H. Pedersen (2020). Betting against correlation: Testing theories of the low-risk effect. Journal of Financial Economics 135(3), 629 – 652.

Bali, T. G., L. Peng, Y. Shen, and Y. Tang (2014). Liquidity shocks and stock market reactions. Review of Financial Studies 27(5), 1434 – 1485.

Barberis, N., L. J. Jin, and B. Wang (2021). Prospect theory and stock market anomalies. Journal of Finance 76(5), 2639 – 2687.

Barberis, N., A. Shleifer, and R. Vishny (1998). A model of investor sentiment. Journal of Financial Economics 49(3), 307 – 343.

Barillas, F. and J. Shanken (2017). Which alpha? Review of Financial Studies 30(4), 1316 – 1338.

Chen, X., W. He, L. Tao, and J. Yu (2020). Media coverage and underreaction-related anomalies. Working paper.

Daniel, K. D., D. A. Hirshleifer, and A. Subrahmanyam (1998). Investor psychology and security market under- and overreactions. Journal of Finance 53(6), 1839 – 1885.

Daniel, K. D., D. A. Hirshleifer, and A. Subrahmanyam (2001). Overconfidence, arbitrage, and equilibrium asset pricing. Journal of Finance 56(3), 921 – 965.

Daniel, K. D., D. A. Hirshleifer, and L. Sun (2020). Short- and long-horizon behavioral factors. Review of Financial Studies 33(4), 1673 – 1736.

Fama, E. F. and K. R. French (1992). The cross-section of expected stock returns. Journal of Finance 47(2), 427 – 465.

Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds. Journal of Financial Economics 33(1), 3 – 56.

Fama, E. F. and K. R. French (2015). A five-factor asset pricing model. Journal of Financial Economics 116(1), 1 – 22.

Foster, G, C. Olsen, and T. Shevlin (1984). Earnings releases, anomalies, and the behavior of security returns. The Accounting Review 59(4), 574 – 603.

Harvey, C. R. and Y. Liu (2020). False (and missed) discoveries in financial economics. Journal of Finance 75(5), 2503 – 2553.

Harvey, C. R. (2017). Presidential address: The scientific outlook in financial economics. Journal of Finance 72(4), 1399 – 1440.

Harvey, C. R., Y. Liu, and H. Zhu (2016). … and the cross-section of expected returns. Review of Financial Studies 29(1), 5 – 68.

He, W., Y. Wang, and J. Yu (2020). Time variation in extrapolation and anomalies. Working paper.

Hirshleifer, D., S. S. Lim, and S. H. Teoh (2009). Driven to distraction: Extraneous events and underreaction to earnings news. Journal of Finance 64(5), 2289 – 2325.

Hong, H. and J. C. Stein (1999). A unified theory of underreaction, momentum trading, and overreaction in asset markets. Journal of Finance 54(6), 2143 – 2184.

Jegadeesh, N. (1990). Evidence of predictable behavior of security returns. Journal of Finance 45(3), 881 – 898.

Jegadeesh, N. and S. Titman (1993). Returns to buying winners and selling losers: Implications for stock market efficiency. Journal of Finance 48(1), 65 – 91.

Liu, J., R. F. Stambaugh, and Y. Yuan (2019). Size and value in China. Journal of Financial Economics 134(1), 48 – 69.

Newey, W. K. and K. D. West (1987). A simple, positive semi-definite, heteroskedasticity and autocorrelation consistent covariance matrix. Econometrica 55(3), 703 – 708.

Novy-Marx, R. (2013). The other side of value: The gross profitability premium. Journal of Financial Economics 108(1), 1 – 28.

Sloan, R. G. (1996). Do stock prices fully reflect information in accruals and cash flows about future earnings? The Accounting review 71(3), 289 – 315.

Stambaugh, R. F. and Y. Yuan (2017). Mispricing factors. Review of Financial Studies 30(4), 1270 – 1315.

免责声明：入市有风险，投资需谨慎。在任何情况下，本文的内容、信息及数据或所表述的意见并不构成对任何人的投资建议。在任何情况下，本文作者及所属机构不对任何人因使用本文的任何内容所引致的任何损失负任何责任。除特别说明外，文中图表均直接或间接来自于相应论文，仅为介绍之用，版权归原作者和期刊所有。

合格投资者声明

一个混合四因子模型