请 [注册] 或 [登录]  | 返回主站

量化交易吧 /  数理科学 帖子:3364712 新帖:0

分析指标统计参数

Peace发表于:5 月 13 日 17:01回复(1)

简介

交易者中广泛使用那些能够“更清楚”显示基本报价的指标,从而能够让他们执行分析并预测市场价格变动。转换有效性与所得结果可信度的相关问题通常不予考虑,最多也就是替换成基于指标的交易系统测试。

我很清楚,除非我们可以解决初始报价转换以及所得结果可信度的相关问题,否则使用这些指标没什么意义,更不用说将其应用于交易系统的创建了。我们将在本文中讲述,得出这样一个结论,是经过严格推理的。我们会利用三个指标来研究潜在问题:趋势直线、指数移动平均线及 霍德里克-普雷斯科特过滤器。


1. 理论浅析

为方便读者,我会讲述一些以后将用到的概率理论与数学统计学方面的术语。我不会提供链接,因为这里用到的术语,与教科书中的概念完全一致。

1.1. 经济观察的概率描述

我们观察的报价是某些基本随机过程的间接选择性测量值(总数量未知),其中包括:

  • 精确测得的确定型分量,比如,已执行的货币买入或卖出交易;
  • 带误差测得的确定型分量,比如在某个时间区间内(如一天)卖出的货币量;
  • 不能测得的随机型分量 - 群体心理。大多数时间里,此分量的主要特性都是带漂移的随机变化。

这些分量的相互作用生成了一个随机过程,其中包括:

  • 趋势(确定型和随机型);
  • 带固定与随机周期长度的循环;
  • 带漂移随机变化。

非定常性是随机过程的一项共有特性,于货币报价中体现。对我们而言,非定常性随机过程的概念之所以重要,就是因为它几乎未提供任何自身的分析方法,所以必须将其划分为一系列可行分析的单独过程。应用指标时,交易者并不考虑指标对于某具体交易品种报价的适用性。但有经济学工具可以评估某指标应用的可能性以及应用结果。


1.2.随机事件。概率

随机事件(本例中为买入和卖出货币)是指可能发生、也可能不发生的事件。我们都知道,不同日期和一天中不同时间的成交数量都会不同 - 实际上是一个随机值,但最常见的情况却是仅将离散时间点(比如分钟、小时、天等)的事件纳入考虑范围。

随机事件的相对频率是指该事件发生次数 M 与已完成查看总数 N 的比率。随着查看次数的增长(理论上可到无穷大),此频率会越来越接近所谓的随机事件概率数。根据定义,概率是指一个从零到一的值。本文中一般都会用术语“概率”来替代相对频率。

随机值是指一个利用特定概率取不同值的量。

总集代表的是随机可取的所有值。我们始终是处理市场中总集的一个样本,通常使用某时段的报价。使用样本获取的统计数据当然会与根据总集计算得出的统计数据有所区别,因为相对频率和概率是有区别的。再执行进一步的计算,评估使用样本获取的统计数据与根据总集计算得出的统计数据之间的差异。如是指标,则此方法不可行,因为价格(比如收盘价)在计算期间会被指标视为确定型值。

还观察到另一有趣现象。因为我们要试着观察总集,所以,可以忽略由不同交易中心提交的报价之间的差异,因为更改报价值容易,而更改其统计属性却非常难。


1.3. 随机变量的特性

1.3.1. 描述性统计

随机量集(本例中为货币报价)均以大量的参数为特征。其中某些参数进一步也会用到。

直方图是一种显示随机值频率的图表。极端情况下,它就是一个显示概率分布密度的图表。

算术平均值(平均)是所有观察点的和,除以观察点数量(本例中为时段数量)。它并非适用于所有分布,而最常见的,就是与中间值一致时可用于正态分布。严格来讲,这就意味着,如果报价具有平均值存在所依据的分布法,则可应用最受欢迎的移动平均线指标。

中间值会将一个样本中的所有观察点一分为二:第一种情况下,所有观察点均低于中间值;而在第二种情况下,观察点则高于中间值。任何分布都存在中间值,且对离群值不敏感。如果平均值等于(或近似)中间值,则其为正态分布法特征之一。

偏离平均值是一个非常有趣的问题。离差是从其数学期望值中随机值方差平方的平均值。离差的平方根是一个均方(标准)方差

标准方差与离差不排斥离群值。

一个名为不对称率(偏斜度)的无量纲量会充当分布密度曲线不对称度的指标。如果偏斜度值小于«6 除以观察点数量»,则随机值的概率分布取决于正态律。

具备分布密度特征的另一值是峰度。通常它都等于 3。如果峰度大于 3,则顶部尖锐,且«厚» 尾以小角度下滑。

可以看出,有大量适用于具有正态分布律的随机变量的概念。也不算太糟糕,因为虽然观察数量值增长了,但却有大量的分布律被变成了正态分布律。

1.3.2. 正态分布

正态(高斯)分布是几乎所有真实概率分布的一种极端情况。

李雅普诺夫的极限定理为理论基础,该定理称:在有观察点丢失且其作用很小的情况下,拥有任何初始分布的独立随机值之和的分布都会是正态的。因此,它被广泛应用于众多的概率理论实际应用中。

正态分布是一个对称的钟形曲线,遍及整个数轴。高斯分布取决于两个参数:μ (数学期望值)和 σ (标准方差)。

数学期望值和给定分布的中间值等于 μ,而离差则等于 σ2。概率密度曲线与数学期望值相对称。不对称率与超出值分别为 γ = 0、ε = 3。

正态分布密度通常不作为 x 变量函数描述,而是作为具有零数学期望值和等于 1 的离差 z = (x − μ) / σ 变量函数来描述。

μ = 0 且 σ = 1 的分布,称为标准正态分布 (i.i.i)。

图 1. 正态分布

图 1. 正态分布

1.3.3. 学生的分布(t-分布)

主参数为自由度(样本中的元素数量)。随着自由度数的增长,学生的分布会渐趋标准化的正态分布。而如果 n > 30,学生的分布可用正态分布替换。如果 n < 30,则学生的分布的尾更厚。

图 2. 学生的分布

图 2. 学生的分布

t-统计被广泛应用于统计假设检验。

1.3.4. 卡方(皮尔逊分布)

如果 Хi 是拥有 i.i.i 的独立随机值,则其平方和受 χ2-分布的约束。密度取决于一个单独参数 ν (通常被称为自由度数),与独立随机变量的数量相等。如果自由度数 ν →∞,χ2-分布倾向于具有中心 v 和离差 2ν 的正态分布。分布密度为非对称、单峰型,它还会变得更平,且与渐增的自由度对称。

图 3. 皮尔逊分布(卡方)

图 3. 皮尔逊分布(卡方)

1.3.5. F - 费歇尔分布

费歇尔 F 分布是一种离差关系分布,即两个离差系列的比率。

如果两个独立的随机变量具备带自由度的卡方分布(V1V2),则其比率具备费歇尔分布。

图 4. 费歇尔分布

图 4. 费歇尔分布


1.3.6. R 平方决定系数

决定系数会显示由独立变量影响解释的结果离差的比例。如是两个变量,则为皮尔逊相关平方。它显示了完全处于这两个变量之间的离差量。

相关比率的显著性,取决于观察点数量和费歇尔 F 统计数据。如果报价中的烛形图数超过 100,即便观察点于零有非常小的偏差,亦足以确认指标的显著性。

1.4. 确定假设

如果我们有该参数的一个选择值,那么就一些常规设置参数,我们可以得出什么结论?此问题的答案,取决于我们是否拥有关于常规参数大小的先验信息。

如果没有该参数常规量级的相关先验信息,我们则可以利用一个选择值来评估该参数,为其设置置信区间(即范围),其值位于其中,且带有特定的置信概率。

在实际情况中,我们通常需要检查一些特定的、大多数情况下都是简单的假设But。此假设被视为空。为测试假设,采用 标准以接受或拒绝它。下面列出的各类统计数据,通常都会用作标准:t-统计数据、F-统计数据和卡方统计数据。使用某些特定的统计软件(比如 STATISTICA)或经济学软件(如 EViews),计算得出的标准伴有此标准的显著性值 - p-值。比如说,p-值为 0.02 (2%) 则意味着对应标准于 1% 显著性水平时为不显著,而于 5% 显著性水平时为显著。同样,如果概率等于“1 - p-值”,则可以假设零假设不显著。

p-值为主观选择,由某特定标准错误评估后果的严重性确定。


1.5. 报价统计特征

1.5.1. 描述性统计

描述性统计包括:

  • 一个必须在某报价的烛形量增加时接近分布律的直方图;
  • 主趋势测量值:均值,中值;
  • 离差测量:标准方差;
  • 形态测量:偏斜度与峰度;
  • 雅克-贝拉正态定则。

雅克-贝拉定则。零假设 But:分布为正态。比如说,伴随标准值的概率则等于 0.04。似乎可得出下述结论:零假设接受的概率为 4%。但是不完全对,因为计算得出值是一个标准 p 值,而零假设接受的概率等于 96%。


1.5.2. 自相关与 Q 统计

自相关是对两个变量之间关系的一种测量。相关比率的变化范围为 -1.00 到 +1.00。值 -1.00 是指完全负相关,而值 +1.00 则指完全正相关。值 0.00 是指无相关。

一个报价中各元素之间的相关,被称为自相关。它在寻找趋势时非常有用。自相关的存在,向作为随机变量的报价的所有相关结论提出了挑战。因为确定随机值过程中最重要的因素,就是不同时段时各个价格的独立性。

在统计分析软件中,自相关伴随有带 p-值的 Ljung-Box Q 统计数据。零假设为:自相关不存在,即,如果 p-值等于零,我们可能得出报价中某限定烛形之前不存在相关的结论。

获取使用数理统计方法功能的过程中,第一步就是从报价中排除自相关(趋势)。


1.5.3. 报价平稳性

如果报价的数学期望值和离差取决于时间,我们则认定其为平稳。即便这个平稳性定义过于严谨,并且不太适合实际应用。如果某个时间范围内,数学期望值的方差与(或)离差由几个百分点(通常不超过 5%)构成,那么,将报价视为平稳的情况非常常见。

外汇市场中的实际报价并不平稳。它们拥有下述方差:

  • 存在一个由期内各个观察点之间的依赖性生成的趋势。依赖性是货币报价与经济观察点共有的一个明显特色;
  • 循环性;
  • 变离差(异方差性);

偏离平稳的报价被称为非定常性。它们均通过连续分解为分量进行分析。一旦得到某平稳序列的平衡,且期望值与(或)离差几乎恒定,该分解过程即终止。

有数项针对报价平稳性的检验。最基本的一类为单位根检验。而其中最著名的,就是迪基-福勒检验。零假设 But:报价非稳定(它们有一个单位根),即平均值与离差取决于时间。因为几乎恒定地取决于时间(某趋势),执行该检验时,必须指出报价中存在的趋势。此阶段要靠眼睛确定。


1.6.  指标规范(回归)

粗略看一下利用 MQL5 等语言编写的指标文本,即可识别其设置的两种形式:分析式(最普遍)和表格式(应用于那些被称作过滤器的指标,比如克拉夫朱克指标)。

但我们会使用“回归”这个术语 - 数理统计学与计量经济学中的一个常用术语。

清楚自己想要从报价中获取什么之后,我们需要设置下述参数,以表示(指标)回归:

  • 用于指标计算的独立变量列表;
  • 独立变量比率;
  • 将用于独立变量计算的指标计算方程。

尽管在创建多货币指标的过程中存在一些困难,但在回归中,这些困难都不复存在。

有了这三个头寸,则有必要调整回归以适应报价。与交易者论坛不同的是, «拟合»一词在计量经济学中并非什么令人不快的词语,而是标准流程,而在这个流程中(指标)回归到报价的一致性,也是利用多种评估方法中的一个计算得出的。普通最小平方法 (OLS) 是已知最佳的评估方法。

评估结果揭示出两个兴趣点:

  • 带报价指标的合规性 – 剩余误差的值;
  • 计算得出的未来回归参数的稳定性。

这些问题的答案,均已在指标诊断期间给出。


1.7. 指标诊断

指标(回归)诊断分为三组:

  • 比率诊断;
  • 余数诊断;
  • 稳定性诊断。

下述每个验证流程中,都包括用作验证假设的零假设规范。验证结果由一个或多个统计数据及其随附 p 值的选择构成。后者会指明零假设条件执行的概率,作为验证统计的基础。

由此,小 p-值会导致零假设拒绝。比如说,如果 p-值位于 0.05 到 0.01 之间,则零假设偏离 5%,而不是 1%。

要注意的是,与每个验证相关的建议和分布结果多种多样。比如说,有些统计具备准确、有限的检验分布(通常为 t 或 F 分布)。其它的则是带有非对称 χ2 分布的检验统计的大样本。


1.7.1. 比率诊断

比率诊断会提供相关信息,并定义已评估比率的限制,其中包括缺失与冗余变量的验证特例。下述回归方程比率的验证会被用到:

  • 置信椭圆允许揭示方程比率之间的相关性;
  • 缺失变量的检验,则允许确定回归方程中额外变量的必要性;
  • 冗余变量检验允许揭示过多变量;
  • 中断检验允许确定回归方程对于趋势变化的反应。需要创建这样一种回归方程,它要能同样擅长体现上升、下降及扁平报价段的报价。


1.7.2. 余数诊断

关于研究余数在将非定常性报价转换为平稳报价时的重要性,我们已经提到过。

单位根检验可显示与基本报价相比,余数的分布更接近正态律。“更接近”一词表明,余数具有取决于时间的平均值和离差,可导致回归方程比率的不稳定。

用交易者论坛的术语来说,就是我们不应“过度优化(这里是指我们名声不佳的拟合!)”某个交易系统,即,在接下来的各段中其特性不得放宽。该系统不适于未来报价段,因为数学期望值与离差会随着时间变化。

会针对余数执行下述检验:序列相关性、正态性、异方差性以及自回归余数异方差。

相关图 - Q-统计会显示余数自相关图,并针对更带有 p-值指示的相应延迟,计算 Ljung-Box Q-统计数据。

直方图 - 正态性检验会在正态性测试时,显示包括雅克-贝拉统计在内的直方图与描述性余数统计。如果余数为正态分布,则直方图应为钟形,且雅克-贝拉统计不应显著。

异方差性检验会验证方程余数异方差性。如有有迹象出现异方差性,则有必要要么更改回归规范(更改指标),要么模拟异方差性。

我们使用带有零假设、涉及到异方差性缺失的怀特异方差性检验,来对照某未知、常见形式的异方差性检验。

怀特将他的方法描述成为针对模型误差规范的一个通用检验,因为该检验的零假设,就是以误差既于独立变量同方差、亦于其独立、且线性模型规范正确为前提。排除其中任何参数,都会导致一个显著检验统计量。反之,不显著的检验统计量则意味着上述三个参数均无出错。


1.7.3. 稳定性诊断

这种情况下,诊断稳定性最有趣也最重要,因为诊断的结果会揭示指标的预测能力。在 MT4 或 MT5 中,稳定性可通过策略测试程序执行诊断。我们会进一步发现,策略测试程序并不能诊断利用指标创建的交易系统的未来稳定性。它只能基于历史数据,提供某交易系统的一些评估。

与交易系统检验期间类似,稳定性诊断的通用方法就是,将 Т 报价柱划分为观察点 Т1 (将用于评估) 和 Т2 = Т Т1 柱(将用于检验与评估)。

如果交易系统于两段检验,则其未来稳定性的问题不能得到解决。因为第二段的检验只会显示出该新段以其未知统计参数与前一段类似。同时,交易系统创建期间已经解决的统计问题仍属未知。

当然,交易系统检验期间会选择不同的报价段,但却不可能靠眼睛来检测,也就是说,回归比率不稳定的异方差区域或报价段。

几种检验(不全是稳定性检验)已列出如下。通过这些检验,如果未来某报价中出现检验条件,我们或能确保交易系统显示平稳结果。

比如说,趋势方向从下降到上升(或者反过来)的变化就是一次断点检验。如果该检验未找到断点,我们则可以确定该指标会在趋势有任何变化的情况下显示平稳结果。

夸特-安德鲁斯断点检验

零假设:两个观察点之间无断点,与样本端相距 15%。

夸特-安德鲁斯断点检验会针对给定方程的某个样本中的一个或多个未知结构断点执行验证。夸特-安德鲁斯检验的基本概念,就是针对两个日期或观察点 t1t2 之间的每次观察,执行独立的邹断点检验。之后,再将来自邹检验的检验统计 k 值,汇总到针对 t1t2 之间没有断点的零假设的检验统计中。

拉姆齐 RESET 检验

零假设:管理回归过程中的误差,是一个带有零平均值的正态分布值。

所有情况的序列相关、异方差性或非正态分布律违背了噪声正态分布这一假设。

RESET - 针对下述类型规范误差的一种通用检验:

  • 缺失的变量;X 并不包含所有适合变量;
  • 函数形式错误:y 和 X 中的一些或所有变量,都必须通过对数、幂、逆值或其它方式进行转换。
  • X 与 e 之间的相关性可由几项因素导致,其中包括 X 测量误差,或是存在一个延迟值和噪声序列中的相关性。

如有这种规范误差,OSL 评估就会偏移(系统误差非零)且无效(不适合在观察点数量增加时按其概率估算的量),由此,常规的输出流程可能会不正当。

递归余数

递归余数检验是以柱数方面逐渐增长的多次回归评估为基础的。

提前一步预测检验

如果我们注意看之前呈现的递归余数的定义,就可以看出,每个递归余数都是一个提前一步预测误差。如果我们想检查因变量顺着直到时间点 t 的所有数据经过合适模型的可能性,则必须将每个误差与其来自完整样本的标准方差进行对比。

比率递归估值

当某样本中的评估数据数量增加时,此类型允许追踪任何比率估值中的变化。下图显示的是所有可执行递归估值方程中的已选比率。这些图表会显示接近已评估比率的两个标准区间。

如果在将数据添加到评估方程时,该比率呈现出显著变化,则是必然不稳定的信号。比率图像有时会因公设方程尝试克服结构断点而呈现猛然突变。

技术分析拥有广泛的所谓“自适应”指标,尽管还没有谁尝试过为这样的自适应确定实际需求。比率递归估值可以解决这一问题。


2. 准备初始数据

我们取 2010 年 11 月 11 日至 2011 年 3 月 23 日之间的 EURUSD 每日报价的收盘价格进行分析。按 F2 可由 MT4 终端接收报价,并导出到 Excel。

报价线性图表显示如下:

图 5. EURUSD 图表

图 5. EURUSD 图表

本示例会显示出控制指标中缺失数据的必要性。我们不要认为所示的报价只是低质报价的一个特例。有多种原因可导致数据遗漏。此外,我们还要注意美国假日期间缺失的数据。根据各种经济因素(比如汇率与股票指数的相关性等)构建交易系统时,缺失数据的问题就变得尤其重要,它们并非全天候地进行交易。

在我们的简单示例中可以执行线性插值,而且至少可以在一定程度上减少缺失数据对于计算的影响。

此外,还有个离群值的问题。离群值问题要比缺失数据的问题复杂得多。在我们开始研究离群值之前,要先回答下面的问题:什么是离群值?我将离群值视为一个超出三个标准方差、且未跟随更大价格变动的价格变动。

离群值的确定不是靠报价,而是其余数:我们通过从下一个价格值中减去前一个价格值的方式来计算序列 – eurusd(i) – eurusd(i+1) (以 MQL 计数)。针对该值的英语计数法有多个名称。其在图表上都有“区别”。最常用的词语就是“返回”。这里和下文中,我都会使用“余数”一词。它是移除报价中的某个趋势之后获得的值。EURUSD 余数图表显示如下:


图 6. EURUSD 余数

图 6. EURUSD 余数

EURUSD 报价的标准方差等于 0.033209。因此,根据公式化的离群值标准,我们的报价中没有离群值。

如果存在离群值,则可以利用缺失数据的值代替,再进行内插。

所提供的移除离群值的方法不是唯一的一种,而且更重要的是,它是不正确的。如果余数由移除某趋势后的报价余数构成,那么,显而易见,离群值的大小取决于所确定趋势的方法,也就是说,离群值问题必须要在趋势确定问题解决之后再行考虑。

到这时,进一步分析基本数据的准备工作才算是完成。


3. 统计参数的分析

执行外汇报价统计参数的分析,尤其是 EURUSD 报价的分析,以检查应用指标以供分析及交易系统创建的可能性。

创建一个交易系统的典型算法显示如下:

  1. 选择一个指标(比如,移动平均线),并在其基础上创建一个交易系统;
  2. 因为通常来讲,不可能基于一个单独指标构建一个交易系统,所以,要在其中实施更多的指标以避免错误入市。

而且,在此阶段,还要虔诚地碎碎念“不要过度拟合,千万不要过度拟合”咒语。


3.1. 描述性统计

通过统计数据得知,如果报价像随机值一样受正态分布律约束,则平均计算误差的值会在期间数量有变化时出现变化,且会在无穷远处与正态律恒定的数学期望值一致。报价可利用一条水平直线替代,而止损与获利可设置为标准方差水平。但情况并非如此。检查一下原因。

我们会检查报价与正态分布律的顺应性。

我们创建显示如下的 EURUSD 报价直方图:

图 7. EURUSD 直方图

图 7. EURUSD 直方图

此直方图会显示出某固定价格在我们选定范围内出现的次数。

看其外观,分布为正态,两个顶破坏了整个图形。我们来执行带有 H0 零假设的雅克-贝拉正态性检验:分布为正态。结果显示如下:

参数 值(事实) 理论值
平均值
1.3549
平均值应与中间值相等
中间值
1.3580
中间值应与平均值相等
标准方差
0.0332
-
不对称(倾斜)
0.0909
0.0
峰度
2.1052
3.0
雅克-贝拉
3.5773
0.0
概率
0.1671
1.0


表 1. 分布正态性检验结果

根据雅克-贝拉标准,有关不符合正态性的结论并非太过武断,因为:

  • 平均值与中间值几乎一致
  • 不对称接近于零
  • 峰度接近于三
  • 现有的背离已由最后的“概率”线很好地体现,该线表明分布为正态,概率为 16.7186%。

我们对此图表可能会持不同的态度。一方面,我们不能在惯例显著层面(比如 95%)拒绝零假设(一个正态分布的报价)。另一方面,又不可能认为分布于 16% 属正态。

由于平均值几乎与中间值一致(正态分布特征之一),我们来看看是否可以信赖计算得出的平均值。我们通过将报价划分为多个段,来执行平均相等的检验。

结果如下:

EURUSD
 量平均值
标准方差
 平均误差
[1.25, 1.3)
4
1.2951
0.0034
0.0017
[1.3, 1.35)
42
1.3262
0.0125
0.0019
[1.35, 1.4)
48
1.3740
0.0133
0.0019
[1.4, 1.45)
9
1.4131
0.0083
0.0027
全部
103
1.3549
0.0332
0.0032


表 2. 各段平均值对比

如该检验所示,计算得出的带误差的平均值,有着最典型的 19 点值,且可上至 32 点。

有鉴于此,我们得出不能使用该平均值的结论。

0.033209 的标准方差值看起来非常可疑。竟然有 332 点!一般说来,这么大的标准方差明显表明:EURUSD 报价有一个趋势,它实际上会是一个常规的确定型分量,会令报价的所有统计特性失真。


3.2. 检验报价自相关

“随机性”的概念,基于某随机量值相对于彼此的独立性。报价外观允许查找定向移动段 - 趋势。

决定论(存在趋势)意指相邻 EURUSD 值的依赖性,该值可通过计算自相关 (ACF) 进行检查,也就是相邻 EURUSD 值之间的相关性。

结果显示如下:

图 8. EURUSD 报价的自相关函数

图 8. EURUSD 报价的自相关函数

加入到 Q-统计的概率在哪里都一样为零。

据计算值显示:

  • 自相关函数的值会平滑递减,而递减很有可能是规律性的。

计算得出的概率指的是带有零假设、但直至延迟 16 无相关性(本例中)的检验。由于此概率针对所有延迟均等于零,我们严格拒绝报价中没有自相关(趋势)的零假设。


3.3. 报价平稳性分析

我们会利用三个版本的迪基-福勒检验,来执行 EURUSD 报价平稳性分析:带偏移、带趋势;不带偏移和不带趋势。

检验结果由两部分构成:针对 EURUSD 以及针对分化 EURUSD 报价、被标示为 D(EURUSD) 的结果。

该检验的零假设为 EURUSD 非稳定(有一个单位根)。我们不仅会执行某单位根的计算,还包括 EURUSD 分化结果的统计特性的计算。分化图表所示如下:

图 9. EURUSD 报价余数

图 9. EURUSD 报价余数

可以看出:EURUSD 分化报价是接近于零的随机振荡。

我们来查看计算 EURUSD 报价平稳性检验的三种方法。

1. 无偏移(一个常量)和趋势的报价,其回归如下所示

D(EURUSD) = С(1) * EURUSD(1) + С(2) * D(EURUSD(1))

接受零假设的概率(序列非稳定): 0.6961

 变量比率
t-统计等于零的概率
 EURUSD(1)
3.09E-05
0.0488
0.9611
 D(EURUSD(1))
0.2747
2.8759
0.0049

表 3. 不考虑偏移与趋势的平稳性检验结果

通过 R-平方拟合到 D(EURUSD) 的回归的评估: 0.07702.

通过该数据可得出下述结论:

  1. EURUSD 报价应被视为带高概率的非稳定 (69%)。我们不会严格拒绝零假设;
  2. D(EURUSD) 增量并不取决于之前带有 99.5% 概率的 EURUSD 价格值;
  3. D(EURUSD) 完全取决于之前的 D(EURUSD(1)) 增量;
  4. R-平方决定比率值 = 0.077028 表明与带 D(EURUSD) 分化报价的回归完全不符合。

2. 带偏移(一个常量)的 EURUSD 报价,其回归显示如下:

D(EURUSD) = С(1) * EURUSD(1) + С(2) * D(EURUSD(1)) + С(3)
 变量比率
t-统计等于零的概率
 EURUSD(1)
-0.0445
-1.6787
0.0964
 D(EURUSD(1))
0.3049
 3.1647
0.0021
 С 0.0603 1.68030.0961


表 4. 考虑偏移的平稳性检验结果

接受零假设的概率(序列非稳定): 0.4389

通过 R-平方拟合到 D(EURUSD) 的回归的评估: 0.1028

通过该数据可得出下述结论:

  1. EURUSD 报价应被视为带相当高概率的非稳定 (43%)。我们不会严格拒绝零假设;
  2. 我们不应将前一个 EURUSD 价格值和一个常量(偏移)纳入到 D(EURUSD) 增量的回归方程中,因为我们将这些比率视为等于 5% 显著性水平的零;
  3. D(EURUSD) 完全取决于之前的 D(EURUSD(1)) 增量;
  4. R-平方决定比率值 = 0.102876 表明与带 D(EURUSD) 分化报价的回归完全不符合。

3. 带偏移(一个常量)和一个趋势的 EURUSD 报价,其回归显示如下:

D(EURUSD) = С(1) * EURUSD(1) + С(2) * D(EURUSD(1)) + С(3) + С(4) * 趋势

接受零假设的概率(序列非稳定): 0.2541

 变量比率
t-统计
等于零的概率
EURUSD(-1)
-0.0743
-2.6631
0.0091
D(EURUSD(-1))
0.2717
2.8867
0.0048
C
0.0963
2.5891
0.0111
趋势 (11/01/2010)
8.52E-05
2.7266
0.0076

表 5. 考虑偏移与趋势的平稳性检验结果

通过 R-平方拟合到 D(EURUSD) 的回归的评估: 0.1667

通过该数据可得出下述结论:

  1. EURUSD 报价应被视为带相当高概率的非稳定 (25%)。我们不会严格拒绝零假设;
  2. 尽管于某趋势期间等于零的比率概率小于 1%,但该比率的值极小,也就是说,该趋势是一条水平线;
  3. R-平方决定比率值 = 0.166742 表明与带 D(EURUSD) 分化报价的回归完全不符合。

通过这些计算,可得出下述结论:如果基本 EURUSD 报价并非稳定,则其通过从下一个价格值中减去前一价格值得出的它们的第一个差异,很可能就是平稳的。

这种情况下,我们已经移除了一个趋势和一个偏移,可通过下述方程描述:

eurusd = c(1) * trend + c(2),

其中 c(1) 和 c(2) 都是可以通过最小平方法进行求值的常量。

此方程是一个通用的回归方程,与 MT4 终端中的“回归”工具完全一致。也就是说,我们已经用直线替换掉了基本报价。它是技术分析中广泛使用的一种方法,所以,我们可以轻松调用多种由直线构成的工具:通道、支撑位与阻力位、斐波纳契位、Gann 等

直线是所有交易者首选的工具。但是,我们为什么要相信这个工具呢?我们为什么认为直线可靠?我们会在后文中作出解答。

除直线外,技术分析中还会采用以部分曲线替换基本报价的指标。我们会采取同样的方式,并拿两个著名的指标进行分析:指数移动平均线与霍德里克-普雷斯科特过滤器


4. 报价消除趋势

«消除趋势»一词的使用,旨在强调该部分与对应计量经济学概念的关联。更确切地说,根据之前声明的金融市场模型,我们应讨论从报价中移除(消除趋势)某常规分量。

本例中,我们已经确定了三个常规分量:线性趋势、指数移动平均线与霍德里克-普雷斯科特过滤器。

所有常规分量均被设置为时间序列。


4.1. 线性趋势

我们通过向前一个值添加一个的方法设置线性趋势。

我们会计算线性回归比率:

eurusd = c(1) * trend + c(2),

我们得到了一个 EURUSD 基本报价的组合图表,回归直线垂直偏移,而余数则通过从报价中扣除回归线的方式获取:

图 10. EURUSD 图表、线性回归及余数

图 10. EURUSD 图表、线性回归及余数

现在,我们利用最小平方法来为下述方程求解:

EURUSD = С(1)*TREND + С(2)

回归方程的求解伴有下述数据:

变量
比率
t-统计 等于零的概率
趋势
0.0004
4.4758
0.0000
C
1.3318
223.3028
0.0000

表 6. 线性趋势平稳性检验结果

调整到 R-平方报价回归的求值 = 0.1655。

通过该结果可得出下述结论:

  1. 根据 R-平方确定系数,该直线仅可解释 16% 情形中的报价变化;
  2. 通过从报价中减去线性趋势得出的余数,与报价本身的区别微不足道。很显然,它也会有与报价一样的统计缺陷。


4.2. 指数平滑

不带季节分量、但有报价(水平)和趋势平滑参数的霍尔特-温特算法会被选中,用于指数平滑。

该方法的主要理念为:

  • 通过从趋势中分离水平的方式,从时间序列中移除该趋势。
  • 平滑该水平(一个参数);
  • 平滑趋势预测(b 参数)。

获得的结果如图中所示。

图 11. 指数移动平均线

图 11. 指数移动平均线

我们收到了一条标准的指数移动平均线,有一点点延迟,但报价的显示效果非常好。平滑参数于顶部显示,而参数选择尚未执行。

现在,我们利用最小平方法来为下述方程求解:

EURUSD = С(1)*EURUSD_EX +С(2)

回归方程的求解伴有下述数据:

变量
比率
t-统计等于零的概率
EURUSD_EX
0.9168
24.3688
 0.0000
C
0.1145
2.2504
 0.0266


表 7. 线性回归求值结果

调整到 R-平方报价回归的求值 = 0.8546。

通过该结果可得出下述结论:

  1. 根据 R-平方确定系数,该指数移动平均线可解释 84% 情况中的报价变化;
  2. 通过从报价中除去指数平均线得出的余数,与带有正态分布的随机过程类似。我们认为有必要对这个余数进行更深一步的分析。


4.3. 霍德里克-普雷斯科特过滤器

霍德里克-普雷斯科特过滤器有 lambda 参数。

我们不会讲解该参数的选择,且取值为 8162。

结果显示如下:

图 12. 霍德里克-普雷斯科特过滤器

图 12. 霍德里克-普雷斯科特过滤器

现在,我们利用最小平方法来为下述方程求解:

EURUSD = С(1)*EURUSD_HP + С(2)

回归方程的求解伴有下述数据:

变量
比率
t-统计
等于零的概率
EURUSD_HP
1.0577
23.9443
0.0000
C
-0.0782
-1.3070
0.1942


表 8. 回归调整到报价的求值结果

调整到 R-平方报价回归的求值 = 0.8502。

通过该结果可得出下述结论:

  1. 等于零的第二个比率(常量)的概率为 19%。就回归方程中该常量的使用提出了疑问;
  2. 根据 R-平方确定系数,霍德里克-普雷斯科特过滤器可解释 85% 情况中的报价变化;
  3. 通过从报价中去除霍德里克-普雷斯科特过滤器得出的余数,与带有正态分布的随机过程类似,且有必要对它进一步分析。


5. 比率诊断

比率诊断包括下述检验:

  1. 置信椭圆会定义回归方程比率之间的相关性:椭圆越接近于圆,相关性就越小;
  2. 置信区间会定义方程比率变化的限制。在技术分析中,比率就是通常可通过使用“期间”参数或以其它某种方式变更的常量。但在任何情况下,比率都不被视为随机值。如果为 true,我们则进行检查;
  3. 缺失的变量检验 – 已考虑到零假设:一个附加独立变量不显著。
  4. 冗余变量检验 – 零假设:附加变量比率等于零;
  5. 断点检验会确定报价统计特性变化点是否存在。我们按提到的变换点的作用,从技术分析的角度检查趋势变换点。在经过分析的 EURUSD 报价中,我们可以分配至少两个趋势 – 下降与上升(这里我们忽略了一个平动)。

5.1. 置信椭圆

我们为每一个回归方程创建置信椭圆:

图 13. 回归方程 1 的置信椭圆

图 13. 回归方程 1 的置信椭圆

图 14. 回归方程 2 的置信椭圆

图 14. 回归方程 2 的置信椭圆

图 15. 回归方程 3 的置信椭圆

图 15. 回归方程 3 的置信椭圆


通过这些图形得出下述结论:

  1. 线性趋势回归比率存在相关性,且可大致估算为 0.5;
  2. 带有指数移动平均线和霍德里克-普雷斯科特过滤器的回归的相关性接近于一,它需要排除回归方程的常量。该常量的显著概率等于零,为其从带有霍德里克-普雷斯科特过滤器的回归方程中排除的理念提供了支撑。


5.2. 置信区间

我们来验证一下回归方程中常量为随机值这一假设。

为此,我们要创建置信区间:

 变量 比率 置信区间 90% 置信区间 95%
下边界
上边界
于区间的百分比
下边界 上边界 于区间的百分比
趋势
0.0004
0.0002
0.0006
74.3362
0.0002
0.0006
88.7168
C
1.3318
1.3219
1.3417
1.4868
1.3200
1.3436
1.7767
        
EURUSD_EX
0.9168
0.8543
0.9793
13.6247
0.8422
0.9914
16.2810
C
0.1145
0.0300
0.1991
147.5336
0.0135
0.2155
176.2960
        
EURUSD_HP
1.0577
0.9844
1.1310
13.8661
0.9701
1.1453
16.5694
C
-0.0782
-0.1776
0.0211
254.0276
-0.1970
0.0405
303.5529


表 9. 回归比率的置信等级

观察置信区间,我们可以看出,该比率是一个根据其状态改变的随机值 – 在置信增长(通道宽度缩减)的同时,区间宽度会扩大。

«于区间的百分比» 列最引人关注,因为它会呈现比率值区间宽度与比率值的关联百分比。我们可以看出,带有指数平均线和过滤器的回归常量的数量,具备完全不被接收的、超过 100% 的值!有必要再说一遍,这些方程中两个比率之间的相关性几近于一。

我们从方程中移除该常量,并重新评估回归比率。

会得到下述结果:

 变量 比率 置信区间 90% 置信区间 95%
下边界 上边界 于区间的百分比 下边界 上边界 于区间的百分比
EURUSD_EX1.0014
0.9999
1.0030
0.3131
0.9996
1.0033
0.3742
EURUSD_HP
1.0000
0.9984
1.0015
0.3127
0.9981
1.0018
0.3737

表 10. 重新计算的回归比率的置信区间

为了本文不至于太过臃肿,我就不在这里展示针对带有指数平均线和过滤器的回归的新计算了。

只是提一下,下述回归方程会被进一步使用:

EURUSD = 1.00149684612*EURUSD_EX

EURUSD = 1.00002609628*EURUSD_HP


5.3. 缺失与过度变量(指标)

典型的交易系统创建算法由下述步骤构成。取部分指标用于交易系统的检验。之后再添加一个附加指数,以挑选出交易系统的错误触发等。

如果某交易者必须停止时,则不能显示此算法。它不能指明是否需要某些附加指标,或是否有必要从交易系统中排除某些指标。交易系统的现有理论不能回答这些问题,但答案可在执行缺失与过剩变量(指标)检验时找到。

缺失的变量检验 – 已考虑到零假设:一个附加独立变量不显著。

我们用现有全部的三个指标,创建一个复杂指标:

EURUSD = C(1)*TREND + C(2) + C(3)*EURUSD_EX + C(4)*EURUSD_HP

在计算该积分指标(回归)比率的同时,我们还会得到下述结果:

EURUSD = 1.41879198369e-05*TREND - 0.00319950161771 + 0.50111527265*EURUSD_EX + 0.501486719095*EURUSD_HP

等于零的相应比率的概率,如下表所示:

 变量 比率 等于零的概率
趋势
 1.42E-05
 0.7577
C
 -0.0032
 0.9608
EURUSD_EX
 0.5011
 0.0000
EURUSD_HP 0.5014 0.0004


表 11. 等于零的指标比率的概率计算

由此表可以看出,我们不应纳入 TREND 指标与该常量,因为我们可以确认其比率等于零。

我们再向前一个添加一个积分指标(指数平均值的平方 eurusd_ex^2),并利用零假设执行缺失变量 (eurusd_ex^2) 的检验:附加的 eurusd_ex^2 变量不显著。

根据计算得出的 t 和 F-统计,附加变量 (eurusd_ex^2) 不显著的概率为 44.87%。有鉴于此,可认为我们的交易系统不需要附加指标。

但更有趣的是,对于表中所示带有添加的 eurusd_ex^2 的整体指标的估值。

变量
比率等于零的概率
趋势
1.69E-05
0.7154
C
1.9682
0.4496
EURUSD_EX
-2.3705
0.5317
EURUSD_HP
0.4641
0.0020
EURUSD_EX^2
1.0724
0.4487

表 12. 等于零、带 eurusd_ex^2 的综合指标比率的概率计算

由此表可以看出,只有基于霍德里克-普雷斯科特过滤器的指标还有些意义。

冗余变量检验 – 零假设:附加变量比率等于零。

我们试着从另一方面进行检查,并利用零假设执行冗余变量检验:冗余变量比率等于零。我们会将趋势 c 作为复杂指标中的冗余变量。

根据计算得出的 t 和 F-统计,趋势与 c 冗余变量的概率为 92.95%。据此,就可以说我们的交易系统具备趋势和 c 冗余变量。它与前一结果完美呼应。

综合指标(由指数平均线及霍德里克-普雷斯科特过滤器构成)的计算,显示如下:

变量
比率
等于零的概率
EURUSD_EX
0.4992
0.00
EURUSD_HP
0.5015
0.00


表 13.
由指数平均线及霍德里克-普雷斯科特过滤器构成该指标时,整体指标比率等于零的概率的计算

即,我们对于在交易系统中使用这些指标是否有用方面毫无疑问。


6. 余数诊断

6.1. 自相关 - Q 统计

图 16. 去除线性趋势后的自相关函数

图 16.  去除线性趋势后的自相关函数

由相关图可以看出,从基本报价中去除线性趋势并不否定趋势的存在,如 ACF 所示。无相关的概率等于零,即,我们严格拒绝所有显著性水平上的零假设。

图 17. 去除指数平滑后的自相关函数

图 17. 去除指数平滑后的自相关函数

由相关图可以看出,从基本报价中去除指数曲线,即已排除了所有烛形图处高于第二个烛形图的趋势,如 ACF 所示。

根据计算结果,无相关的概率等于零,即,我们严格拒绝所有显著性水平上的零假设。

但如果我们再进一步,排除前两个烛形图的相关性后,我们就能够得到无相关性的余数了。

图 18. 去除霍德里克-普雷斯科特过滤器后的自相关函数

图 18. 去除霍德里克-普雷斯科特过滤器后的自相关函数

由相关图可以看出,从基本报价中去除霍德里克-普雷斯科特过滤器,即已排除了所有烛形图处高于第三个烛形图的趋势,如 ACF 所示。无相关的概率等于零,即,我们严格拒绝所有显著性水平上的零假设。但如果我们再进一步,排除前两个烛形图的相关性后,我们就能够得到无相关性的余数了。

总结:尝试通过从 EURUSD 基本报价中去除我们指标的方法移除确定型分量,对于线性趋势已完全失败,而对于指数移动平均线和霍德里克-普雷斯科特过滤器则取得了部分成功。

我们对指标的进一步分析,也因为自相关(确定型分量)而变得没有意义了。我们要找到允许排除余数中自相关的指标。这也正是我们下一部分内容中要做的。


7. 考虑到分析的指标创建与检查

目前,我们没有创建一套指标的正规理论。仅有的方式,就是根据分析结果选择某些设置来直接搜索。

通过之前的自相关分析,我们可断定:第一个报价烛形图处的自相关在消除趋势后保留了下来。

我们研究一下考虑到上述事实的以下方程:

EURUSD = C(1)*EURUSD_HP(1) + C(2)*D(EURUSD_HP(1)) + C(3)*D(EURUSD_HP(2))

D(EURUSD_HP(1)) 是指报价与霍德里克-普雷斯科特过滤器平滑之间的余数,第一个延迟(如果从一开始计算柱,则为第二个柱,而非第一个)。

使用最小平方法进行的方程比率计算,会导致出现下述结果:

 变量比率
等于零的概率
EURUSD_HP(1)
1.0001
0.0000
D(EURUSD(1))
0.8262
0.0000
D(EURUSD(-2))
-0.48810.0000


表 14. 使用最小平方法得到的比率评估结果

根据过剩变量检验与计算得出的 t 和 F-统计数据,有 eurusd(1) 与 eurusd(2) 变量时,比率等于零的概率为空,也就是说,这两个并非过剩变量。

自相关显示了直至延迟 16 无依存关系,概率超过 70% (第一条信号线):


图 19. 余数自相关

图 19. 余数自相关

怀特异方差性检验得出了有关 F-统计数据的结果,确认无异方差性,概率为 80%。

依据带零假设的夸特-安德鲁斯检验进行断点检查:«无断点»会给得下述结果:71% 概率的零假设会被接受(无断点)。

再提一下,根据标准技术分析,通过检查的报价至少有一个断点(一个趋势反转)。但我们的指标针对下降与上升两种趋势都有类似的统计参数,因此,它是市场状态的不变量。

带零假设的拉姆齐积分检验:按 t 与 F-统计量概率为 48% 的«管理回归中的误差是一个正态分布值»被接受。以此为基础,我们可以忽略余数自相关及其异方差性。

而且还意味着线性平方估值未偏移(检查值的数学期望值与检查值一致),且其有可能执行递归余数检验。

我们来检验提前一步递归余数预测。此图形上部给出的是递归余数和两个标准方差处的限制线。此外,左轴会显示报价烛形图的概率,指标比率恒常性假设据此偏差 5%、10% 和 15% 显著性水平。这种点没有多少,但它们的存在则意味着止损与获利触发错误。

图 20. 递归余数预测检验

图 20. 递归余数预测检验

我们来为回归方程比率的递归估值命名。图表构成如下:计算出最左边柱的比率值。之后,再添加一个柱,且不断地重复计算比率值,直到最后一个柱。如果少量的柱位于左侧,比率值当然也会非常不稳定。但是,随着计算所用的柱数的增加,平稳性(恒常性)也会增强。

图 21. С(1) 比率递归估值

图 21. С(1) 比率递归估值

图 22. С(2) 比率递归估值

图 22. С(2) 比率递归估值

图 23. С(3) 比率递归估值

图 23. С(3) 比率递归估值

图表显示,报价区间开头处观察到了某种不平稳,但之后的比率值可视为变得平稳了。但是,严格来讲,我们回归方程的比率并非恒定。


总结


本文为金融数据不平稳这一事实提供了又一个证据。本文中采用了将非定常性数据分为数据和的标准方法,以获取一个平稳余数。

有了基本报价的平稳余数,我们就可以解答与所获指标平稳性相关的主要问题了。

本文中提供的信息,还只是能够且应当基于报价预测创建交易系统的初步信息而已。


参考文献列表

EViews 7. User’s Guide II.

全部回复

0/140

量化课程

    移动端课程