报告摘要
★主要内容
基于我们对不同择时方法的实证分析,不同方法论的择时效果有一定差异但均体现出一定的择时效果,基于我们选择的景气度、金融条件以及利率利差因子进行国债收益率的预测是有效的,但不同方法论在具体应用中存在比较大的差异。
首先,单因子滚动窗口筛选与预测适用于较为精简的指标库,其优点在于单因子在不同时间区间上的有效性可以进行非常清晰明了的展现,缺点在于对于等权合成的方法没有考虑到指标间相关性的差异,且对于数据量大的情况处理效果可能不佳。单因子滚动窗口筛选法基于五年期国债期货三倍杠杆回测,实现年化收益率7%,夏普比率1.47;基于十年期实现年化收益率14%,夏普比率2.91。
其次,主成分分析法更适合处理板块内指标的相关性问题,采用主成分分析的方法无法解决降维所得结果对因变量是否具有解释能力的问题,因而还需要对各个降维成分进行预测能力的验证,实际应用过程中可能存在因验证标准选择而对样本外预测结果产生较大影响的情况,实际应用难度较高。基于五年期国债期货三倍杠杆回测在包括样本集与预测集的全部时间区间上,实现年化收益率12%,夏普比率1.24;相应的基于十年期国债期货,实现年化收益率17%,夏普比率1.26。
最后,基于偏自相关回归框架的三阶段回归法整体的实用性最强,模型在滚动窗口内基于指标对因变量的解释能力进行赋权,无需再对降维结果与因变量的相关性进行验证则可直接用于预测,模型应用方面的主要缺点在于降维结果缺乏实际经济含义支撑,模型对于指标选择与参数选择具有一定的敏感性。基于五年期国债期货三倍杠杆回测实现年化收益率7%,夏普比率2.01;相应的基于十年期国债期货,实现年化收益率8%,夏普比率1.58。
★风险提示
指标的有效性基于历史数据得出,不排除失效的可能。
报告全文
1
国债期货择时框架介绍
1.1.数据指标介绍
本文择时模型采用的数据整体上是相对较为基础、普遍关注度较高的宏观经济与价格价差指标,我们将影响国债收益率的指标初步整理分类主要涵盖景气度、金融条件指标以及货币市场利率利差三个主要模块。我们尝试在经济景气度月度指标中加入较多的高频数据进行补充,目前市场上对于景气度先行指标研究也比较多,我们观察一些价格数据也能够表征经济景气度,主要是受宏观影响较大的部分大宗商品价格以及航运价格等走势与PMI具有较高的一致性,为便于分析我们将高频数据整理为周度均值并计算同比。金融条件指标对利率走势往往具有一定的领先作用,我们主要考虑社融、流动性以及信贷方面的指标。此外今年以来我们明显观察到央行对货币市场利率的调节对债市的影响大大加强,存单利率、市场利率与政策利率利差、利率互换利差等对国债期货择时的指导意义在今年整体表现也比较突出。
文本择时实证研究共基于31个指标初步分为三大类五个子类,分别为经济景气度之经济指标(E1)、经济景气度之高频指标(E2)、金融条件指数之流动性(F1)、金融条件指数之信贷规模占比(F2)、货币市场利率利差(IR)。
数据指标的选择本身肯定具有“幸存者偏差”的,随着研究体系的升级,我们以现在研究体系中的关键指标去进行历史回溯往往是更容易取得好的结果的,即便侧重“样本外”结果的呈现也难免结果上仍然具有一定的偏差。本文重心主要在于构建框架,将不同的择时体系的难度、效果、可行性进行比较分析,对于影响利率指标体系的研究我们也将进一步不断丰富与完善。
1.2.建模方法论
我们在择时框架的构建方面主要基于三种方法进行探讨,首先是对单因子进行有效性检验,对于各个指标整体的择时能力进行初步的研究,并基于滚动窗口进行单因子筛选与样本外预测。单因子的验证与预测结果非常直观,可以在样本集内对各个指标的择时有效性进行排序与对比,并且便于同逻辑分析相结合。但单因子滚动区间筛选与等权预测信号的合成方法终归还是较为粗糙,不能够较好地解决指标间相关性强弱差异的影响,且该种方法也相对更适合处理小样本的数据指标。
对于数目较多相关性较强的宏观数据,建模应用还是首先需要解决降维的问题,我们在此前的基本面量化研究中应用偏自相关回归的方法论,在较为繁杂的基本面数据中基于指标对被解释变量的解释能力进行赋权降维,总体上可以实现较好的预测效果。本文用到较多低频率的宏观数据,我们希望在建模过程中对数据本身的主要成分进行深入分析,而非仅仅根据数据的预测能力进行筛选,因此我们首先还是基于传统的主成分分析对于不同大类的因子进行降维,分析前几个主要成分对国债收益率的预测能力。即本文在降维模型方面将分别探讨主成分分析与偏自相关回归两种方法论在国债择时方面的效果与实用性等方面比较。
对于降维模型的原理我们先进行一个简单直观的介绍。主成分分析(PCA)的基本思路是基于解释变量方差最大的原则,提取全新的正交特征即主成分。具体做法是,首先从原始数据中找方差最大的方向作为第一主成分,从正交平面中继续寻找使得方差最大的主成分,依次类推。主成分分析得到的第一主成分接近均值的概念,后续成分可能代表指标价差等维度,具体涵义是不确定的。主成分分析的优势是可以有效解析大量相关性强的解释变量的主要特征,而对于预测回归应用而言,并非所有的“特征”都对我们的待预测指标有解释能力,因而对于PCA的主成分应用与预测之前需要进行进一步的分析与筛选。
由于方差最大的变量组合并不一定是预测能力最强的变量组合,我们基于Kelly(2015)提出的三阶段回归模型(3PRF)进行偏自相关回归框架的实证应用,三阶段回归模型的降维目标是因子和预测目标变量的协方差最大,因而采用该模型可以在时间序列滚动窗口上动态捕捉对收益率贡献较大的因子,可以应对预测过程中常面临的驱动因子失效与逻辑切换的问题,降维结果按照指标的解释能力进行加权所得,因而所得“主成分”可直接应用与预测回归,无需进一步验证因子与因变量的相关性,模型使用方面相对PCA更为高效。其缺点主要是在寻找对Y有解释能力的因子与权重的过程中,降维结果可能与解释变量本身的主要特征已产生了较大的偏离,难以解释降维结果反应的经济涵义。具体实现方法上,首先模型引入了代理变量,代理变量可通过经济理论设置或算法迭代生成。共包含三步回归:
第一步运行N个独立的时间序列回归,在第一步回归中,预测因子是因变量,代理变量是自变量,估计系数描述了预测因子对代理变量(代理变量与Y相关)的敏感性;
最后基于第二步所得降维后的预测因子对目标收益率进行时间序列上的预测回归,第三步回归拟合得到最终的预测结果。
1.3.策略构建说明
1.3.1.数据处理
a)建模采用的数据指标包含宏观月度指标也包含利差日度指标,我们将数据统一转换成周度,对于没有数据指标用前值代替。所有数据纳入模型进行回测前均进行归一化处理,避免数据量纲不同的影响。
b)考虑数据可得性宏观数据统一滞后一个月,价格价差类日度数据滞后一日,作为生成信号时点的可得信息,对于周度频率数据我们统计周度可得信息基于下周第一个交易日结算价作为建仓价格。
c)国债期货的移仓换月处理方面,我们基于持仓量最大的规则进行主力合约切换,主力合约切换时剔除移仓换月价差,得到复权后的收益率时间序列。
1.3.2.数据平滑
对于宏观数据进行模型应用前,一般需要进行适当的平滑,去除噪音得到趋势性特征,平滑的方法有很多,最简单的移动平均、指数移动平均,以及HP滤波器等工具均是较为常用的,我们本篇文章中选取低延迟趋势线(LLT),主要是因为在此前的择时策略实证研究中发现该方法对于趋势的把握相对而言更为灵敏、择时效果较佳。该方法的主要思路是基于一阶改进的指数移动平均(EMA)滤波器函数串联一个二阶低通滤波器的传输函数得到,二阶滤波器的特点是原始信号中相对高频一些的信号也能保留下来。在相同的衰减因子下,趋势线LLT 相比于MA 和EMA 具有更低的延迟性。其表达式为如下公式,其中为平滑参数,取值与选取的数据窗口有关。
1.3.3.策略设计
a)模型解释变量为上文展示的宏观经济与利差等指标或指标降维结果,被解释变量为五年期和十年期国债收益率(中债估值),为方便多空策略回测我们选取五年期和十年期国债期货为交易标的,即我们预测的是现券收益率而策略落地到国债期货。由于国债波动较小保证金占用仅0.5%-2%左右,策略回测包括国债期货多头基准净值的计算均使用三倍杠杆,不再考虑保证金利息、剩余资金的投资收益与交易成本。
b)单因子方面,我们逐个进行预测效果检验,并基于滚动窗口进行指标筛选与样本外合成。在主成分分析模型下,我们把2015至2018年作为样本集,把2019至2020年作为预测集,预测成分的选取方法是在样本集上表现较好的主成分进行等权合成,并在预测集上进行验证。在三阶段回归模型下,我们基于1年(52周)的滚动窗口进行动态的因子合成与预测,即在每周我们均基于前52周的历史表现进行因子的赋权与降维,将所得成分进行对下一周的预测,3PRF模型整体就是在一个滚动窗口下进行动态演化的,因而不需要专门去设置样本集与预测集。
2
基于国债期货多空择时策略回测
2.1.单因子预测效果分析
我们针对每个单因子对国债收益率预测效果进行全样本测算,整体看来利率利差因子、景气度因子以及金融条件因子均可以对利率方向起到较好的预测效果,对于五年期国债期货与十年期国债期货预测效果较好的单因子整体差异不大,我们以五年期为例,对预测效果较佳的单因子进行简要分析。
首先,若我们以净值夏普率从高到低排序,货币市场利率利差因子(例如存单利率与政策利率利差、利率互换与国开收益率利差等)位居前列,部分利率利差因子由于数据长度的原因回测区间较短(2018年至今),今年国债行情较大而利差类因子对于今年行情的上涨与下跌普遍均把握较好,使得整体回测夏普率较高,而对于18-19年利差类因子相对表现其实是较弱的。其次,对于景气度因子与金融市场条件因子长期具有较为明显的择时效果,但在今年的行情下择时效果较为一般,主要原因或由于新冠影响下市场波动幅度整体较大,而经济金融数据可能有一定的滞后性对于应对短期突发的事件驱动性质的行情把握能力较弱,长期依然来看依然具有显著应用价值。
在实际择时应用中,我们除了验证因子在样本内的预测效果还需要检验我们所选数据对未来利率走势的解释能力是否稳健,也就是我们在样本内发现的预测能力是否能够向外推演。逻辑上讲,我们认为我们文章中所选取的基础的经济金融与利差数据与国债收益率的关系应该是稳定的,例如金融周期上行景气度上行往往带动利率走高。为了在数据上进行检验,同时也基于单因子设计一个简单的可执行择时策略,我们以年为节点筛选与更新历史上表现较佳的单因子,进行等权合成作为下一个年度的指标集,具体而言,我们基于2014至2016年中净值夏普比率(期债三倍杠杆回测)高于1.0的因子作为2017年的预测因子,以2014至2017年表现较好的因子作为2018年的预测因子,以此类推。基于单因子滚动筛选,以五年期国债期货三倍杠杆回测,实现年化收益率7%,年化波动率3%,胜率68%,夏普比率1.47;基于十年期国债期货三倍杠杆回测,实现年化收益率14%,年化波动率4%,胜率72%,夏普比率2.91。
2.2.基于主成分分析法的实证分析
前文基于单因子滚动窗口筛选可以在一定程度上解决基本面量化中面临的有效指标的筛选问题,但随着数据量增加,单因子等权的处理方法也显得较为粗糙,因纳入因子的相关性不同直接等权生成信号也可能会对数据中存在的某一特征的影响过于强化。对于处理较为繁杂的基本面与宏观数据,对于建模而言更为简洁有效的方式是对数据进行降维,将数据中的主要成分即可以概括数据主要特征的抽象结果纳入模型。但数据经降维处理后,其原本的经济意义也将被打破,我们得到的主要特征向量是数据维度的与从逻辑出发对数据关注的要点往往不完全相同。
我们首先对主成分分析(PCA)的降维方法进行实证,相对更为复杂的降维模型,主成分分析相对而言还是可以更好地保留数据本身的特征。我们以前文三大类五个子类的指标数据为例,在PCA模型下得到前三大主成分,分别记为pca1、pca2、pca3,并在展示中将经后文测算在子类别中在测试集合预测效果相对较好的成分我们以深红色高亮显示。
我们基于历史效果推演未来主要的逻辑基础是经济指标与利率之间变动的逻辑长期来看具有稳定性,因而对于PCA成分在预测中的应用时可以定期进行回测验证与更新迭代。经过对不同模块降维主成分的观察,第一主成分普遍反映了数据的长周期趋势项,一般相对其他成分波动更小代表更长周期的信息,而其次的成分可能代表二阶或者价差等方面的信息,波动性相对较高。经测算具有显著预测能力的成分不一定是第一主成分,可能原因在于我们预测频率偏高频,长周期的变化不一定可以对短期波动起到较好的预测作用,反而其后的二三主成分可能起到更好的预测效果。此外,由于方法决定了我们将为所得的主成分尽可以代表解释变量的特征而不保证与被解释变量有关,因而对于主成分分析的结果,我们依然需要用到类似于单因子的方法划分用于因子有效性筛选的样本集与验证因子样本外预测作用的测试集。具体做法是基于2015至2018年作为样本集进行有效性筛选,得到样本上预测效果较佳的成分(选择每个子类别中预测净值夏普率最高的成分)用于2019至2020年测试集上的样本外预测。
在主成分分析模型框架下,我们对降维得到的主成分分别基于LLT模型进行周度数据12期的平滑,再进行预测验证。对于每一个模块不同主成分对利率的影响方向不尽相同,我们根据因子变动与下一期利率变动的相关性系数正负值作为各因子影响方向,再进行回测分析,基于历史样本集中的表现选择对利率具有择时能力的因子。根据我们的测算,金融条件流动性因子(F1)和货币市场利率利差因子(IR)的第一主成分对于利率走势具有显著的择时效果,金融条件信贷规模占比因子(F2)和经济景气度基础指标(E1)的第三主成分相对预测效果更为显著,景气度高频因子(E2)的第二主成分效果较好。基于上述因子,在五年期国债期货三倍杠杆的回测框架下,包括样本集与预测集的全部时间区间上,实现年化收益率12%,年化波动率8%,胜率63%,夏普比率1.24;相应的基于十年期国债期货,实现年化收益率17%,年化波动率12%,胜率63%,夏普比率1.26。
2.3.基于三阶段回归法的实证分析
相对主成分分析,基于偏自相关回归框架的三阶段回归(3PRF)模型对数据降维的依据则是基于对因变量的解释能力确定各个因子的权重,我们可以设定滚动窗口进行自变量的动态降维合成并进行预测,操作模式类似于单因子模型滚动窗口筛选,但基于3PRF模型的降维合成对于指标的相关性的处理明显更为科学。具体处理方法我们将全部指标依然基于LLT模型进行平滑,将平滑后的指标以及指标的环比变化均纳入3PRF模型,分别将十年期/五年期国债收益率左右被解释变量,得到相应的降维结果与预测信号。
预测效果方面,由于模型较为灵活可以明显降低择时净值波动性,但同时信号切换也更为频反应到策略换手率的上升,模型对于参数选择具有一定的敏感性,由于数据长度可回测区间的限制,我们把滚动时间窗口的长度设置为1年(52周)不做调整,测算不同数据平滑窗口下模型的预测效果,发现基于LLT模型以3~6个月左右的时间窗口进行平滑后预测效果相对较佳。在LLT模型12期平滑的情景下,基于五年期国债期货在三倍杠杆下,实现年化收益率6%,年化波动率3%,胜率69%,夏普比率1.36;相应的基于十年期国债期货,实现年化收益率7%,年化波动率4%,胜率65%,夏普比率1.13。在LLT模型16期平滑的情景下,基于五年期国债期货在三倍杠杆下,实现年化收益率7%,年化波动率3%,胜率72%,夏普比率2.01;相应的基于十年期国债期货,实现年化收益率8%,年化波动率4%,胜率67%,夏普比率1.58。相比较PCA降维方法而言,基于3PRF模型降维在收益风险比方面是更优的选择,且在实际操作上也更加简洁高效。
3
结论
基于我们对不同择时方法的实证分析,不同方法论的择时效果整体而言有一定差异但均体现出一定的效果,基于我们选择的景气度、金融条件以及利率利差因子进行国债收益率的预测是有效的。不同方法论在具体应用中存在比较大的差异,首先,单因子滚动窗口筛选与预测适用于较为精简的指标库,其优点在于单因子在不同时间区间上的有效性可以进行非常清晰明了的展现,缺点在于对于等权合成的方法没有考虑到指标间相关性的差异,且对于数据量大的情况处理效果可能不佳。其次,主成分分析法更适合处理板块内指标的相关性问题,采用主成分分析的方法无法解决降维所得结果对因变量是否具有解释能力的问题,因而还需要对各个降维成分进行预测能力的验证,实际应用过程中可能存在因验证标准选择而对样本外预测结果产生较大影响的情况,实际应用难度较高。最后,基于偏自相关回归思路的三阶段回归法整体的实用性最强,模型在滚动窗口内基于指标对因变量的解释能力进行赋权,无需再对降维因子与因变量的相关性进行验证则可直接用于预测,模型应用方面的主要缺陷在于降维因子缺乏实际经济含义支撑,模型对于指标选择与参数选择具有一定的敏感性。
4
风险提示
王冬黎 高级分析师(金融工程)
从业资格号:F3032817
投资咨询号Z0014348
Email:dongli.wang@orientfutures.com
长按二维码关注