Risk-Return Tradeoffs (II)
发布时间:2023-12-21 | 来源: 川总写量化
作者:石川
摘要:隐性多因子模型如何成为研究资产定价的重要范式?且听 Kelly and Xiu (2023) 娓娓道来。
本文继续翻译 Bryan Kelly 和修大成两位教授的 Financial Machine Learning (Kelly and Xiu 2023) 第四章(Risk-Return Tradeoffs)的剩余部分,即 4.4 到 4.6 节。(第一部分请见此处。)
再次感谢王熙和刘洋溢对内容的反馈。本翻译仅供学习交流使用,禁止一切商业行为,未经授权,禁止转载。
以下是正文部分。
4.4 复杂因子模型
许多论文拓展了隐性条件因子模型 (4.8) 中关于 beta 的设定。IPCA 可以被视为使用可观察特征数据的线性变化来近似风险暴露。尽管许多资产定价模型预测预期收益率和状态变量之间存在非线性关系,但在筛选条件变量和挑选函数形式方面,理论文献能够提供的指引十分有限。机器学习的出现使人们能够用一系列的非线性方法来应对函数形式的模糊性。
在早期的研究中,Connor et al. (2012) 和 Fan et al. (2016b) 通过将 beta 视为条件特征的非参数函数,从而实现 beta 的非线性设定(但与 IPCA 不同,为了可解释性,这些特征在时间维度上是固定的)。利用这一框架,Kim et al. (forthcoming) 研究了能够对冲掉因子风险的“套利”组合的行为。
Gu et al. (2021) 利用神经网络将 beta 表述为特征的非线性函数,从而扩展了 IPCA 模型。图 4.3 展示了他们的“条件自编码器”(CA)模型。图 4.3 揭示了其基本结构,该结构与 (4.8) 的不同之处在于,它通过非线性激活函数传递输入数据(工具变量
Gu et al. (2021) 是一个高度复杂的模型。其出色的实证表现暗示着,对于因子模型而言,复杂性提升带来的好处可能与 Kelly et al. (2022a) 在市场择时研究中所发现的效果类似(译者注:即复杂度可以提升样本外表现。)。Didisheim et al. (2023) 正式提出了上述观点并证明了因子定价模型中复杂性的优越性。他们的分析是基于条件随机贴现因子(SDF)视角展开。一般而言,SDF 可以被表述为一组风险资产的投资组合:
其中,
其中
其中每个“因子”
4.5 高频模型
随着可交易资产越来越多的以及它们的高频交易数据越来越多,数据可得性的提升为估计单个资产的风险及其相互依赖性提供了独特的机会。通过简单的非参数化波动率和协方差,Andersen and Bollerslev (1998)、Andersen et al. (2001) 以及 Barndorff-Nielsen and Shephard (2002) 展示了如何利用丰富且及时的日内价格数据更好地了解资产市场的波动。使用高频指标有助于解决研究低频时间序列时面对的若干挑战。例如,它帮助研究者在无需依赖太多假设的前提下,来处理结构性变化和时变的参数。此外,对于日内数据建模而言,经典时间序列分析中关于线性、平稳性、依赖性和异方差性的许多标准假设往往是不必要的。
在最新的文献中,我们发现存在两大流派,它们均采用机器学习技术来估计高维协方差矩阵,并利用高频数据提高波动率预测的准确性。
对于成功构建投资组合而言,准确的协方差估计至关重要。但是,由于维数灾难问题,估计高维协方差矩阵是一个极具挑战性的统计问题。许多方法依赖于各种形式的收缩以改进估计(Bickel and Levina 2008a; Bickel and Levina 2008b; Cai and Liu 2011; Ledoit and Wolf 2012; Ledoit and Wolf 2004)。受 APT 启发,Fan et al. (2008) 考察了包含可观测因子的严格因子模型,并提出了基于因子模型的协方差矩阵估计量,而 Fan et al. (2013) 则转而研究了包含隐性因子的近似因子模型,并提出了相应的估计量。
当面板数据的(横截面)维度接近样本大小时,在高频数据中使用因子结构式必要的。然而,低频和高频数据中的计量经济学方法在本质上存在差异。后者通常基于一个通用的连续时间半鞅模型,允许收益率的变化中出现随机变化和跳跃。针对日内数据,Ait-Sahalia and Xiu (2019) 提出了非参数 PCA 的渐近理论,为在连续时间中应用因子模型铺平了道路。此外,基于连续时间因子模型,Fan et al. (2016a) 和 Ait-Sahalia and Xiu (2017) 使用高频数据提出了个股高维协方差矩阵的估计量。
一个充满前景的研究方向是将关于高频风险度量的文献与关于预期收益率横截面的文献相结合,从而利用更丰富的风险信息来获得有关风险-收益权衡的深入见解。在这个方向上的一些相关研究包括 Bollerslev et al. (2016)。他们在连续时间框架下计算了个股对单一市场因子运动中连续和跳跃两部分各自的 beta 值,然后在离散时间框架中将研究了上述 beta 估计值和股票预期收益率的截面关系。Ait-Sahalia et al. (2021) 在统一的连续时间框架下为风险溢价提供了统计推断。他们在第一步考虑多个因子和随机 beta 值,并将通过第一步估计得到的 beta 应用于第二步中,进而扩展了 Shanken (1992a) 的经典推断方法。在实证方面,他们使用 Ait-Sahalia et al. (2020) 使用 15 分钟收益率构造的 Fama-French 和动量因子,检验了日内收益率的因子模型。
利用高频数据测量波动率的想法也使得有关波动率预测的研究充满前景。Corsi (2009) 提出的测量历史已实现波动率的异质自回归(HAR)模型已是当前学术研究和业界实践中领先的波动率预测模型。最近,有许多论文研究如何通过机器学习进行波动率预测,包括 Li and Tang (2022) 以及 Bollerslev et al. (2022)。但与收益率预测时机器学习预测的有效性体现为更高的夏普比率不同,对于波动率预测而言,人们尚不清楚机器学习模型能否以及在多大的经济学意义上超越了已有的 HAR 模型。这是研究中一个有趣的开放性问题。
4.6 Alphas
本节讨论关于 alpha 检验和机器学习的相关文献。Alpha 是预期收益率中未被因子暴露所解释的部分,因此它是一个依赖模型(以及测试资产)的对象。由于经济理论通常过于简化、不能指明所有的因子,且数据量也不足以让人们通过数据驱动的方式推断出所有真正的因子,模型设定偏误的存在使得区分 alpha 和因子暴露的“公平”补偿充满挑战。例如,alpha 可能是因子 beta 偏弱的表现,这让人想起回归中的遗漏变量问题。换句话说,一个模型的 alpha 可能是另一个模型的 beta。在一个隐性因子模型中,alpha 和 beta 最终是由一个区分因子与特质性噪声的因子强度阈值来区分的。
我们主要从非条件隐性因子模型的角度分析 alpha。之所以强调非条件而不是条件 alpha 是因为前者是学术研究的重点。此外,我们关注隐性因子模型是因为对隐形因子模型来说,模型设定偏误问题没那么严重。
4.6.1 Alpha 检验和经济重要性
长久以来,实证资产定价的焦点是原假设,即所有的 alpha 都等于零
众所周知的 GRS 检验(Gibbons et al. 1989)是针对
他们还推导了 alpha 的必要渐近展开,为在隐性因子模型中检验 alpha 铺平了道路。
GRS 检验统计量基于
APT 假设套利者知道收益率生成过程的真实参数。只要样本量足够大,该这假设可能是成立的。因为在这种情况下,参数能够被(渐近地)准确估计出来,且套利者的行为(近似地)表现得好像他们确切地知道了这些真实参数。但问题是,在 APT 的设置中,套利者必须知道越来越多的 alpha,因此,横截面维度相对于典型的样本大小来说是太大。因此,即使是在
Da et al. (2022) 重新审视了 APT,并放宽了参数已知的假设。在他们的设定中,套利者必须使用一个基于样本大小为
其中
其中当
很显然,
这个结果表明,alpha 的后验估计决定了可行的最优夏普比率以及统计套利利润的上限。任何机器学习策略,无论简单还是复杂,都需要遵循这个可行的夏普比率上限。
一般来说,
可行和不可行策略之间的“夏普比率差距”刻画了统计学习的难度。学习难度越高,则差距就越大。图 4.4 考虑了假想的收益率生成过程并报告了这两个夏普比率之比,其中
Da et al. (2022) 展示了如何定量刻画可行和不可行夏普比率之间的差距。他们基于一个包含 27 个因子的模型来评估 APT,其中 16 个公司特征和 11 个 GICS 行业哑变量被用作可观测的 beta。使用 1975 年 1 月到 2020 年 12 月的数据,不可行夏普比率的估计值超过 2.5,是机器学习算法获得的可行夏普比率估计值 0.5 的四倍有余。可行夏普比率(在考虑交易成本之前)低于 0.5 恰恰表明 APT 在实证上十分有效。从理论上讲,如果套利者面临更多的统计困难,如模型设定偏误、非稀疏的残差协方差矩阵等,可行和不可行夏普比率之间的差距会进一步扩大。
4.6.2 多重假设检验
自从 CAPM 以来,金融经济学界便开始共同寻找异象;即能获得 CAPM 无法解释的 alpha 的投资组合。其中的一些,如规模、价值和少数其他因子已被纳入基准定价模型中(Fama and French 1993;Fama and French 2015)。之后,一旦研究者发现这些基准模型无法解释的 alpha 时,就宣布找到了新的异象。Harvey et al. (2016) 对此进行了综述并整理了一个超过三百个异象的清单。他们提出了一个重要的批判观点,即在检验新异象的显著性时未能正确考虑多重假设检验的影响。
在这个背景下的多重假设检验是指同时检验一组原假设:
设
对于任何预先选定的水平
虽然资产定价文献中早就谈到了一般的数据窥探问题(Lo and MacKinlay 1990; Sullivan et al. 1999),但早期的建议是另选单一的原假设,例如
归根结底,多重假设检验在本质上是一个统计问题。前述统计方法通常满足一个好的统计检验所需具备的标准,例如控制第一类错误或伪发现率等。然而,比起统计标准,经济效益才是经济主体最关心的。但是,这两个目标通常是相互冲突的。Jensen et al. (2023) 和 Da et al. (2022) 指出,尽管传统多重假设检验方法能有效防范 FDR,但以此选择 alpha 会导致极其保守的交易策略。Jensen et al. (2023) 证明,相比于使用传统方法控制 FDR 的投资者,使用贝叶斯分层多重假设检验方法作为评判因子标准的投资者将能够获得更大的经济效益。
参考文献
Ait-Sahalia, Y., J. Jacod, and D. Xiu (2021). Continuous-time Fama-MacBeth regressions. Tech. rep. Princeton University and the University of Chicago.
Ait-Sahalia, Y., I. Kalnina, and D. Xiu (2020). High frequency factor models and regressions. Journal of Econometrics 216(1), 86-105.
Ait-Sahalia, Y. and D. Xiu (2017). Using principal component analysis to estimate a high dimensional factor model with high-frequency data. Journal of Econometrics 201(2), 384-399.
Ait-Sahalia, Y. and D. Xiu (2019). Principal component analysis of high frequency data. Journal of the American Statistical Association 114(525), 287-303.
Andersen, T. G. and T. Bollerslev (1998). Answering the skeptics: Yes, standard volatility models do provide accurate forecasts. International Economic Review 39(4), 885-905.
Andersen, T. G., T. Bollerslev, F. X. Diebold, and P. Labys (2001). The distribution of exchange rate realized volatility. Journal of the American Statistical Association 96(453), 42-55.
Bajgrowicz, P. and O. Scaillet (2012). Technical trading revisited: False discoveries, persistence tests, and transaction costs. Journal of Financial Economics 106(3), 473-491.
Barndorff-Nielsen, O. E. and N. Shephard (2002). Econometric analysis of realized volatility and its use in estimating stochastic volatility models. Journal of the Royal Statistical Society Series B (Statistical Methodology) 64(2), 253-280.
Barras, L., O. Scaillet, and R. Wermers (2010). False discoveries in mutual fund performance: Measuring luck in estimated alphas. Journal of Finance 65(1), 179-216.
Benjamini, Y. and Y. Hochberg (1995). Controlling the false discovery rate: a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society Series B (Methodological) 57(1), 289-300.
Bickel, P. J. and E. Levina (2008a). Covariance regularization by thresholding. Annals of Statistics 36(6), 2577-2604.
Bickel, P. J. and E. Levina (2008b). Regularized estimation of large covariance matrices. Annals of Statistics 36(1), 199-227.
Bollerslev, T., S. Z. Li, and V. Todorov (2016). Roughing up beta: Continuous versus discontinuous betas and the cross section of expected stock returns. Journal of Financial Economics 120(3), 464-490.
Bollerslev, T., M. C. Medeiros, A. Patton, and R. Quaedvlieg (2022). From zero to hero: Realized partial (co)variances. Journal of Econometrics 231(2), 348-360.
Cai, T. and W. Liu (2011). Adaptive thresholding for sparse covariance matrix estimation. Journal of the American Statistical Association 106(494), 672-684.
Connor, G., M. Hagmann, and O. Linton (2012). Efficient semiparametric estimation of the Fama–French model and extensions. Econometrica 80(2), 713-754.
Corsi, F. (2009). A simple approximate long-memory model of realized volatility. Journal of Financial Econometrics 7(2), 174-196.
Da, R., S. Nagel, and D. Xiu (2022). The statistical limit of arbitrage. Tech. rep. Chicago Booth.
Didisheim, A., S. Ke, B. Kelly, and S. Malamud (2023). Complexity in factor pricing models. Tech. rep. Yale University.
Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and bonds. Journal of Financial Economics 33(1), 3-56.
Fama, E. F. and K. R. French (2015). A five-factor asset pricing model. Journal of Financial Economics 116(1), 1-22.
Fama, E. F. and K. R. French (2010). Luck versus skill in the cross-section of mutual fund returns. Journal of Finance 65(5), 1915-1947.
Fan, J., Y. Fan, and J. Lv (2008). High dimensional covariance matrix estimation using a factor model. Journal of Econometrics 147(1), 186-197.
Fan, J., A. Furger, and D. Xiu (2016a). Incorporating global industrial classification standard into portfolio allocation: A simple factor-based large covariance matrix estimator with high frequency data. Journal of Business and Economic Statistics 34(4), 489-503.
Fan, J., Y. Liao, and M. Mincheva (2013). Large covariance estimation by thresholding principal orthogonal complements. Journal of the Royal Statistical Society Series B (Statistical Methodology) 75(4), 603-680.
Fan, J., Y. Liao, and J. Yao (2015). Power enhancement in high-dimensional cross-sectional tests. Econometrica 83(4), 1497-1541.
Fan, J., Y. Liao, and W. Wang (2016b). Projected principal component analysis in factor models. Annals of Statistics 44(1), 219-254.
Gibbons, M. R., S. A. Ross, and J. Shanken (1989). A test of the efficiency of a given portfolio. Econometrica 57(5), 1121-1152.
Giglio, S., Y. Liao, and D. Xiu (2021a). Thousands of alpha tests. Review of Financial Studies 34(7), 3456-3496.
Gu, S., B. T. Kelly, and D. Xiu (2021). Autoencoder asset pricing models. Journal of Econometrics 222(1), 429-450.
Harvey, C. R. and Y. Liu (2020). False (and missed) discoveries in financial economics. Journal of Finance 75(5), 2503-2553.
Harvey, C. R., Y. Liu, and H. Zhu (2016). ... and the cross-section of expected returns. Review of Financial Studies 29(1), 5-68.
Jensen, T. I., B. Kelly, and L. H. Pedersen (2023). Is there a replication crisis in finance? Journal of Finance 78(5), 2465-2518.
Kelly, B. T., S. Malamud, and K. Zhou (2022a). Virtue of complexity in return prediction. Tech. rep. Yale University.
Kim, S., R. Korajczyk, and A. Neuhierl (forthcoming). Arbitrage Portfolios. Review of Financial Studies.
Kosowski, R., A. Timmermann, R. Wermers, and H. White (2006). Can mutual fund “stars” really pick stocks? New evidence from a bootstrap analysis. Journal of Finance 61(6), 2551-2595.
Ledoit, O. and M. Wolf (2004). Honey, I shrunk the sample covariance matrix. Journal of Portfolio Management 30(4), 110-119.
Ledoit, O. and M. Wolf. (2012). Nonlinear shrinkage estimation of large-dimensional covariance matrices. Annals of Statistics 40(2), 1024-1060.
Li, S. Z. and Y. Tang (2022). Automated risk forecasting. Tech. rep. Rutgers, The State University of New Jersey.
Lo, A. W. and A. C. MacKinlay. (1990). Data-snooping biases in tests of financial asset pricing models. Review of Financial Studies 3(3), 431-467.
Pesaran, H. and T. Yamagata (2017). Testing for alpha in linear factor pricing models with a large number of securities. Tech. rep.
Ross, S. A. (1976). The arbitrage theory of capital asset pricing. Journal of Economic Theory 13(3), 341-360.
Shanken, J. (1992a). On the estimation of beta pricing models. Review of Financial Studies 5(1), 1-33.
Sullivan, R., A. Timmermann, and H. White (1999). Data-snooping, technical trading rule performance, and the bootstrap. Journal of Finance 54(5), 1647-1691.
White, H. (2000). A reality check for data snooping. Econometrica 68(5), 1097-1126.
免责声明:入市有风险,投资需谨慎。在任何情况下,本文的内容、信息及数据或所表述的意见并不构成对任何人的投资建议。在任何情况下,本文作者及所属机构不对任何人因使用本文的任何内容所引致的任何损失负任何责任。除特别说明外,文中图表均直接或间接来自于相应论文,仅为介绍之用,版权归原作者和期刊所有。