请 [注册] 或 [登录]  | 返回主站

量化交易吧 /  量化策略 帖子:3364704 新帖:25

预测金融时间序列

我是游客发表于:4 月 17 日 19:45回复(1)

简介

本文将介绍神经网络最常见的实际应用之一 - 预测市场时间序列。在这一领域,预测与盈利最为息息相关,可视为一种商业活动。

预测金融时间序列是任何投资活动的必备元素。投资本身的概念是投入现有的资金以在未来获利,而这个概念又基于预测未来的概念。因此,预测金融时间序列是整个投资行业(包括所有有组织的交易所和其他证券交易系统)的投资活动的基础。

我们来看一些数据,了解一下这个预测行业的规模(夏普,1997)。美国股市的日成交量超过 100 亿美元。美国的存款信托公司,注册证券金额达 11 万亿美元(总金额 18 万亿美元),日交易额约为 2500 亿美元。全球外汇交易甚至更为活跃。其日收益超过了 1 万亿美元。大约是全球聚集资本的 1/50。

我们知道,所有交易中的 99% 都是投机交易,即交易目的并不是为了实际的商品流通,而是要从以下计划中盈利:“低买高卖”。这些交易都基于交易者对利率变化的预测。同时,非常重要的一点是,各个交易的参与者所做的预测都是相反的。因此,投机交易的金额体现了市场参与者所做预测之间的差异,实际上就是衡量金融时间序列的不可预测性。

这个市场时间序列最重要的特性,是 Louis Bachelier 于 1900 年在其论文中提出的有效市场假说的基础。该论文称,投资者能够信赖的唯有通过纽约交易所的道琼斯指数或标普 500 指数等类似指数评估出的平均市场盈利能力。然而,任何投机利润都具有随机性质,就像赌博。市场曲线为何具有不可预测性,原因与你很难在闹市的地面上捡到钱的理由相同:太多人会去捡。

所以有效市场理论自然就不会受到市场参与者的青睐,因为他们自己都正在找这种“掉地上”的钱呢。大部分市场参与者都确信,尽管市场时间序列看上去随机性很强,但它们有很多隐藏的规律,也就是说,它们至少一定程度上是可预测的。在 30 年代,技术分析的创始人 Ralph Elliott 试图找出这种隐藏的经验规律性。

到 80 年代,这种观点意外地获得了新近出现的动态混沌理论的大力支持。该理论基于混沌状态和随机性(完全无规律)的对立关系。混沌序列只会随机显示,但作为一个已确定的动态过程,它们在短期预测方面仍大有可为。可预测范围在时间上受预测周期所限,但这种预测已足以实现真正的盈利(Chorafas,1994 年)。之后,那些拥有更好的数学方法,能够从含噪混沌序列中抽丝剥茧找出规律的市场参与者开始展望更高的利润率——以牺牲那些数学方法较差的同行的利益为代价。

本文中,我们会给出具体的实例来证明金融时间序列的部分可预测性,甚至用数字来评估这种可预测性。



技术分析和神经网络

近几十年来,技术分析变得越来越流行,这是一套基于各种市场行为指标建立起来的经验规则。技术分析主要研究给定证券的个体行为,与其他证券并无关联(Pring,1991 年)。

从心理学角度来看,此方法基于经纪人在一定时间内专注于特定证券这一情况。著名技术分析师(早先是一名心理治疗师)Alexander Elder 称,市场行为与群体行为非常相似,都遵循特殊的大众心理定律。群体效应简化思维,降低个体特殊性影响,催生比个人行为更原始的集体社交行为。尤其是社交本能会强化领导者(一个占据主导地位的男性/女性)的角色。据 Elder 称,价格曲线正是这个领导者,它将市场群体意识汇聚于己身。这种从心理学角度对市场价格行为的解读证明了动态混沌理论的可行性。市场的部分可预测性由参与者们相对原始的集体行为所决定,这种集体行为形成了内部自由度相对较小的单个混沌动态系统。

根据这一理论,你必须“突破群体的束缚”,超然其上,思虑高于群体,才能预测市场曲线。为此,你应该开发一个可以根据时间序列的先前行为进行评估的赌博系统,并严格遵循该系统,而不会受到该市场弥漫的各种情绪和谣言的影响。换句话说,预测必须基于算法,即预测可以,甚至必须交由计算机来执行(LeBeau,1992 年)。参与者只需创建此算法,并为此拥有基于技术分析工具获得便于开发和进一步支持编程策略的各种软件产品。

依照此逻辑,完全可以在策略开发阶段使用计算机,不是将其作为助手来计算已知市场指标以及测试给定策略,而是用于找出最佳指标和针对这些指标的最佳策略。从 90 年代早期开始,在神经网络技术应用的支持下,这种方法吸引着越来越多的追随者(Beltratti,1995 年;Baestaens,1997 年),因为它具有大量无可争辩的优势。

首先,与其他技术分析不同,神经网络分析对输入数据的性质没有任何限制。它可以是给定时间序列的指标,也可以是其他市场证券行为的相关信息。不少机构投资者(例如大型养老基金)都在积极使用神经网络,这不是没有原因的。此类投资者采用大型投资组合,而对这些组合最重要的是不同市场之间的关联。

第二,与基于一般建议的技术分析不同,神经网络可以针对给定时间序列再次找到给定证券的最佳指标,并根据这些指标找到最佳预测策略。此外,这些策略是可调整的,会随市场情况而变化,这对蓬勃发展中的年轻市场(尤其是俄国市场)来说是至关重要的。

神经网络的单独建模仅基于数据,不涉及任何先验因素。这既是它的长处,同时又是它的致命弱点。可用数据可能不足以进行学习研究,同时可能的输入内容的维数可能会过高。本文中我们将进一步演示如何借助技术分析累积的经验克服这些金融预测领域的常见困难。



时间序列预测技术

第一步,我们来说明一下使用神经网络进行时间序列预测的一般方案(图 1)。

图 1时间序列预测的技术循环方案。

此外,本文中我们会简要探讨此流程的所有阶段。尽管神经网络建模的一般原理完全适用于此任务,但预测金融时间序列有其特定的性状。本文要尽最大可能阐明的内容就是这些特定性状。



浸入技术。Tackens 定理

我们先从浸入阶段开始。正如我们现在看到的,对于所有看似数据外推法的预测,神经网络确实能够解决插值的问题,这大大增强了这个解决方案的有效性。预测时间序列的问题可归结为神经分析的常规问题 - 多变量函数针对一组给定示例的逼近 - 使用将时间序列浸入多维空间的程序(Weigend,1994 年)。例如,时间序列 的维度滞后空间由时间序列在连续瞬时时间的值组成:

以下 Tackens 定理已证明对动态系统是成立的:如果某时间序列是由动态系统生成的,即 的值是这种系统的状态的一个任意函数,那么就可找出一种浸入深度(约等于此动态系统的有效自由度数),它可用于明确预测该时间序列的下一个值(Sauer,1991 年)。因此,在选择了一个较大值之后,可以保证时间序列未来的值与其之前的值之间的明确依存关系:,即时间序列预测的问题可归结于多变量函数插值的问题。然后,可根据此时间序列的历史所定义的一组示例,使用神经网络来恢复此未知函数。

反之,对于随机时间序列,过去的信息不会为预测未来提供任何有用的提示。因此,根据有效市场理论,在浸入滞后空间时,时间序列的预测值的散布不会发生变化。

图 2 中显示了浸入期间检测到的混沌动态与随机(无规律)动态之间的差异。

图 2浸入时检测到的随机过程与混沌动力学之间的差异。



时间序列可预测性的经验证明

浸入法允许我们对实际证券的可预测性进行量化衡量,即证明或反驳有效市场假说。根据后一种理论,点在所有滞后空间坐标中的散布都是一致的(如果这些点是同样分布的独立随机值)。反之,提供一定可预测度的混沌动力学必然会得出一个结论:即结果将围绕着一个特定的超曲面 ,即实验样本组成一个集合,其维度小于整个滞后空间的维度。

要测量此维度,可以使用以下直观属性:如果一个集合有维度 D,然后假设它被分成越来越小的三次曲面且边为 ,则这种立方体的数量将增长至 。这个事实正是根据我们从之前的考量中了解到的盒维数法来检测集合维度的依据。一个点集的维度是根据包含该点集中所有点的盒子的数量增速来检测的。要加快此算法,我们取 的维度为 2 的倍数,即分辨率尺度以位为单位。

我们举一个典型的市场时间序列示例,S&P500 指数,一个反映纽约交易所平均价格动态的著名金融工具。图 3 显示了该指数在 679 个月内的动态。图 4 中显示了根据盒维数法计算得出的此时间序列的增量维度(即信息维)。

图 3本文中用 S&P500 的 679 个值的时间序列为例。

图 4S&P500 时间序列的增量的信息维。

 

从图 4 中可以看出,实验点在一个 15 维浸入空间内形成了维数约为 4 的点集。这个数字远小于我们根据将时间序列的增量视为独立随机值的有效市场理论应获得的 15。

因此,虽然我们不能明确声明这里存在一个完全确定的混沌动态过程,但经验数据提供了令人信服的证据,证明金融时间序列中确实存在某种可预测的元素。那么,将神经网络分析应用于市场预测的做法也有了充分的理由。

但要注意的是,理论上的可预测性并不能保证能够获得切实有效的预测。特定时间序列的可预测性的量化评估可通过测量互熵来实现,也可使用盒维数法实现。例如,我们要测量 S&P500 增量对于浸入深度的可预测性。互熵

相关图表如下所示(图 5),要测量时间序列的下一个值的更多相关信息,需要了解此时间序列之前的值。

图 5S&P500 时间序列针对浸入深度(“窗口”宽度)的增量可预测性图。浸入深度超过 25 之后,可预测性不断下降。

我们将进一步评估这种可预测性水平下实际可获取的利润。



形成属性的输入空间

在图 5 中,你可以看到时间序列浸入窗口不断增大的宽度最终导致可预测性的不断降低 - 当不断增大的输入维数不再得到其信息值的补偿时。特定于金融时间序列的选择属性和/或增加可用示例数的方法将在下文中详述。



选择误差函数

要进行神经网络学习,光是组成输入/输出教学集还不够。还必须确定网络预测误差。大部分神经网络应用中默认使用的均方根误差对于市场时间序列来说并没有多少“经济意义”。所以我们才要在本文的一个特殊章节中讨论这个特定于金融时间序列的误差,并演示它们与可能的利润率的关联性。

例如,在选择市场价位时,能够可靠地检测利率变动讯号比降低均方差重要的多。尽管这些讯号彼此间相互关联,但当神经网络针对其中一个进行优化后,对另一个的预测精度就会下降。选择一个足可胜任的误差函数时,必然以特定的理想策略为依据,并受利润最大化(损失最小化)的意愿所驱使,下文中我们会进一步证明这一点。



神经网络的学习

时间序列预测的主要具体功能体现在数据预处理领域。单独神经网络的教学程序是标准程序。可用参数照例划分为三个样本:学习验证测试。第一个用于网络教学,第二个用于选择最佳网络架构和/或选择停止网络教学的时机。第三个并未被用于教学,而是完全用于“经过训练的”神经网络的预测质量控制。

但是,对于含噪极高的金融时间序列,使用 coterie 神经网络会大大提高预测可靠性。本文结尾处会讨论一下这个技巧。

在某些研究中,我们可以找到使用反馈神经网络可提高预测质量的证据。此类网络可能有一个本地存储器,保存着比输入中明显可用数据更早之前的数据。但是,考虑此类架构会让我们偏离主题,考虑的越多,偏离的越远,因为使用下文中所述的特殊时间序列浸入技巧的话,会有一些替代方法可有效扩展网络“范围”。



形成属性空间

有效的输入编码是提高预测质量的关键因素。对于极难预测的金融时间序列,这个因素具有特别重要的意义。有关数据预处理的所有标准建议也都适用于此处。但我们还有特定于金融时间序列的数据预处理方法,我们将在本节中进行更详细的讨论。



时间序列浸入法

首先,我们应记住该使用报价本身的值(我们将其指定为 )神经网络的输入或输出。真正对预测有重要意义的是报价的变动。通常,由于这些变动的范围小于报价本身,因此价格的值之间有很强的关联性 - 下一个最可能的价格值等于上一个价格。. 同时,就像我们反复强调的那样,要提高学习质量,我们应该努力实现输入内容的统计独立性,即避免此类关联性。

所以我们说,合理的方法是选择最具统计独立性的值作为输入内容,例如报价变动 或相关增量对数 。相关增量对数适用于长期时间序列,因为采用这种方法时,通胀影响会很明显。在这种情况下,序列不同部分之间的简单差异将处于不同范围内,因为它们实际上使用了不同的单位进行测量。反之,虽然计量单位会随通胀发生变化,但连续报价之间的比率并不取决于计量单位,并且它们将采用相同的比例。结果,时间序列获得了更好的稳定性,允许我们使用更大时间范围的历史数据进行教学,从而提高了教学质量。

沉浸到滞后空间中的劣势是网络“范围”受限。相反,技术分析不会固定在过去的窗口上,有时候会使用相当远的时间序列值。例如,时间序列的最大和最小值(即便取自相对较远的过去)必然会对交易者的心理产生相当强烈的影响,因此,这些值必然仍是预测的重要条件。如果沉浸到滞后空间的窗口不够宽广,将无法提供此类信息,自然就会降低预测的效率。另一方面,将窗口扩展至可涵盖时间序列遥远的极值的值时,同时也会增加网络的维数。这反过来又会降低神经网络预测的准确度 - 现在的原因是网络的增长。

这个看似无解的死局,出路可能就在对时间序列过去行为的替代编码方式中。从直觉上看很明显的一个情况是,时间序列的历史回溯的越久远,其行为细节对预测结果的影响就越小。这是由交易者过去的主观感知所决定的,严格来说,是那些形成了未来的主观感知。因此,我们应找出时间序列动态的这种具有选择性精度的表示方法:时间越久远,细节越少。同时,曲线的总体外观必须保持不变。所谓的小波分解在这里有很广阔的应用前景。其信息价值与滞后浸入等同,但它在压缩数据时能够更轻松地让数据以选择性的精度描述过去。



减少输入维数:属性

此数据压缩是一个从海量的输入变量中提取对预测最重要的属性的示例。上文已介绍了属性的系统提取法,它们也可以(且必须)相继应用于时间序列预测。

输入的表示方法可能有助于数据提取,这一点很重要。小波法就是一个良好的(从属性提取的角度来看)编码范例(Kaiser,1995)。例如,下图(图 6)显示了某时间序列的 50 个值的部分及其根据 10 个专门挑选的小波系数重构的形态。请注意,尽管它只需要 1/6 的数据,但刚刚过去的时间序列可以精确重构,而较早之前的数据也能恢复概貌,正确地反映最高值和最低值。因此,可仅使用 10 维输入向量以可接受的准确度描述一个 50 维窗口。

图 650 维窗口(实线)及其按 10 个小波系数 (o) 进行的重构示例。

另一个可能的方法是将在适当的软件包(例如 MetaStock 或 Windows On Wall Street)中自动计算的各种技术指标用作属性空间的可能候选项。虽然单个经验属性(Colby,1988 年)或许适用于特定的时间序列,但它们庞大的数量提高了其应用难度。上述方法允许你选择最有效的技术指标组合,并将其用作神经网络中的输入。



提示法

金融预测中最大的弱点之一是缺乏神经网络学习的范例。一般来说,金融市场(尤其是俄国市场)都不是静止不变的。总有尚未有任何使用记录的新指标出现,旧市场上的交易性质会随着时间发生转变。在这些条件下,可用于神经网络学习的时间序列的长度相当有限。

但是,我们可以使用一些与时间序列动态的不变量相关的先验因素来增加示例数量。这是另一个可以大大提高金融预测质量的微观数学物理术语。实际上就是对现有示例进行各种转换,从而生成人工示例(提示)。

让我们通过一个例子来理解其中心思想。以下假设从心理学角度讲是合理的:交易者大多将注意力放在价格曲线的形态上,而不是轴上具体的值。那么,如果我们将整个时间序列沿着报价轴拉伸一点,我们就能使用这种转变所产生的时间序列(以及初始时间序列)进行神经网络学习。这样,我们就已经根据交易者感知时间序列时的心理特征所产生的先验信息,将示例数翻了一番。此外,除了增加示例数,我们还限制了用于搜索解决方案的函数类,这也提高了预测质量(当然,前提是使用的不变量属实)。

按盒维数法计算 S&P500 的可预测性所得到的结果显示在下方(见图 7 和 8),这些结果表明了提示的作用。在这种情况下,属性空间是采用正交化技术构建的。我们在 100 维滞后空间中用 30 个主要组件作为输入变量。然后我们选择了这些主要组件的 7 个属性 - 最重要的正交线性组合。从下图中可以看到,这种情况下,只有应用了提示才能提供显著的可预测性。

图 7S&P500 的报价变更信号的可预测性 图 8通过拉伸价格轴增加三倍示例数之后,S&P500 的报价变更信号的可预测性。

请注意,与标准浸入法相比,使用正交空间增加了一定的可预测性:从 0.12 位(图 5)增加到 0.17 位(图 8)。稍后在我们开始讨论可预测性对利润的影响时,我们会证明,采用这种方法后,利润率可再次达到 50%。

另一个成功使用此类有关神经网络应在哪个方向上搜索解决方案的提示的重要示例是使用外汇交易中的隐藏对称性。这种对称感指的是可以从两个“角度”看待外汇报价,例如看做一系列的 DM/$ 或一系列的 $/DM。一方的增大对应的是另一方的减小。利用此属性,我们可将示例数翻番:向各个示例(例如 )添加其对称模拟项(例如 )。神经网络预测的实验表明,对于基本外汇市场,对称性概念的引入几乎使利润率翻了一番,具体表现在:在考虑到实际交易成本的情况下,年利润率从 5% 升至 10%(Abu-Mostafa,1995)。



测量预测质量

尽管预测金融时间序列的问题可归结为多维函数逼近问题,但它在针对神经网络构建输入内容和选择输出内容这两点上有其特有的特点。上文中我们已经谈过了输入内容。那么现在我们来学习一下选择输出变量的特性。不过,我们应该先回答主要问题:怎样才能衡量金融预测的质量?这将帮助我们找出最佳的神经网络学习策略。



可预测性与利润率之间的关联

金融时间序列预测的特性是,其目的是为了获取最大利润,而不是像函数逼近的惯例那样为了最大程度减小均方差。

在最简单的日常交易案例中,利润取决于正确预测的报价变更信号。正因如此,神经网络必须将目标定位于变更信号的精确预测,而不是值本身。现在我们要在最简单的日常入市表现中找出利润率与信号检测精度之间的关联(图 9)。

图 9日常入市。

让我们指定,从 之时起:交易者的全部资本为 ,相对报价变更为 ,并将此变更信号的置信水平作为网络输出:. 这个具备 形式的输出非线性的网络可学习如何预测变更信号,并预测信号(其范围与其概率成正比)。然后步骤 上的资本收益将记录如下:

其中, 是“场上”的资本份额。它是整个交易周期的利润: 可通过选择最佳利率大小 来最大化该利润。让交易者正确预测 的信号,相应地,错误预测的概率为 .然后是利润率对数,

且利润本身将在值为 时达到最高,平均数:

这里我们引入了系数 。例如,对于高斯分布,。信号可预测性水平与可使用盒维数法进行先验性估算的互熵有直接的关联。对于二进制输出(见图 10):

图 10正确预测的时间序列变动方向作为针对已知输入的输出信号的互熵函数的片段。

最终,我们针对给定信号可预测性值 I (以位为单位)获得以下利润率估值:

它表示,对于可预测性为I 的时间序列,原则上可以在次入市中将资本翻一番。因此,假设 次入市的平均资本翻倍,之前计算的 S&P500 时间序列可预测性等于I 的时间序列,=0.17 (见图 8)。那么,即使报价变更信号的可预测性只发生了小小的变化,也会提供非常显著的利润率。

这里我们要强调的是,想要获得最佳利润率,每次入市都需要相当谨慎精细的操作,交易者只可投入严格限定的资本份额:

其中, 是针对此市场波幅 的典型利润/亏损额。较小或较大的利率都会降低利润,风险过大的交易会导致可预测性无论多高都会亏钱。图 11 说明了这一事实。

图 11从选定“储备”资本份额角度来看平均利润率的依赖性。

这就是上述估计仅深入探讨了利润率上限的原因。至于将波动效应考虑在内的更详尽的研究,就不在本文探讨范围之内了。但是,从定性的角度来看可以很明显地发现,要选择最佳的合同金额,需要评估每一步的预测精度。



选择误差函数

如果我们把预测金融时间序列的目的定为最大程度提高利润,那就应该根据这个最终结果来调整神经网络。例如,如果你根据上述方案进行交易,可以选择以下学习误差函数进行神经网络学习,取学习样本的所有例子的平均值:

这里引入入场的资本份额作为要在学习期间调整的额外网络输出。对于此方法,第一个神经元 和激活函数 将向我们提供提高或降低利率的可能性,而第二个网络输出 将产生要在给定阶段投入的建议资本份额。

但是,根据之前的分析,由于此份额必须与预测置信水平成正比,你可通过放置 并限制自己只优化一个可最大程度减小误差的全局参数 ,从而将两个网络输出替换为一个网络输出:

这就产生了一个可根据网络预测的风险水平调节利率的机会。使用可变利率产生的收益高于使用固定利率。确实,如果你固定利率,按其平均可预测性定义来定义它,则资本增长率将与 成正比,而如果你在各个步骤选择最佳利率,则资本增长率将与 成正比。



使用 coterie 网络

一般来说,由于选择突触权重初始值的随机性,在同一样本上训练的不同网络所做的预测将有所不同。这一劣势(不确定因素)可以通过组建一个将不同神经网络包含在内的 coterie 神经网络智能交易系统来转变为优势。智能交易系统预测的离散度可以反映这些预测的置信水平,此水平可用于选择正确的交易策略。

我们可以很容易证明,coterie 值的平均值必然会产生比同一 coterie 的一般智能交易系统更好的预测。对于输入值,让ith 智能交易系统的误差等于 。考虑到柯西不等式,coterie 的平均误差始终小于各智能交易系统的均方差:

必须注意的是,误差的减少有相当重要的意义。如果各智能交易系统的误差彼此之间互不关联,即 ,则包含L个智能交易系统的 coterie 的均方差比单个智能交易系统的平均个体误差小 倍!

这就是为何个人的预测最好基于整个 coterie 的平均值的原因。图 12 说明了这一事实。

图 12使用 10 个网络的 coterie 进行预测时,时间序列 sp500 的最后 100 个值的利润率。coterie(圈子)的利润高于一般智能交易系统的利润。coterie 正确预测信号的比分是 59:41。

正如图 12 中所示,在这种情况下,coterie 的利润甚至会高于各个智能交易系统的利润。因此,coterie 方法可从根本上提高预测质量。请注意利润率的绝对值:coterie 的资本在经过 100 次入市后增加了3.25 倍(当然,如果考虑到交易成本,这个倍数还会低一些)。

预测是网络在指数增量时间序列的 30 个连续指数移动平均值 (EMA 1 … EMA 30) 上学习时获得的。已预测出下一步的增量信号。

在此实验中,利率固定在 的水平,接近给定预测精度的最佳水平(59 个正确预测的信号与 41 个错误预测的信号),即 。图 13 中可以看到使用相同预测(即)而风险更高的交易的结果。

图 13风险更高的策略下,使用之前的 10 个网络的 coterie 进行预测时,时间序列 sp500 的最后 100 个值的利润率。

由于此风险值与上一风险值一样接近最佳状态,coterie 的利润保持在同一水平(略微增加)。但是,总体而言,大部分网络的预测精度低于 coterie 的预测精度,此类利润率最终被证明风险过大,导致其几乎完全失效。

上述示例展示了能够正确评估预测质量的重要性以及此评估可如何用于提高相同预测的盈利能力。

我们可以转用更大的极值,并使用智能交易系统网络的加权而不是平均建议。应自适应地选择权重,以最大程度提高 coterie 对学习样本的预测能力。结果,coterie 训练较差的网络起到了较小的作用,但并未使预测失败。

以下两种 coterie 网络类型(包含 25 个智能交易系统)所做预测的对比展示了此方法的可行性(见图 14 和 15)。这些预测采用的是同一个方案:作为输入,时间序列的指数移动平均值的使用周期与前 10 个斐波那契数字相同。根据从 100 次实验中获得的结果,加权预测产生的正确预测信号平均超出错误预测信号大约 15,而使用平均预测时,此值约为 12。应该指出,给定时间内价格上涨总量与下降总量之比正好等于 12。因此,将主要的增长趋势视为较不重要的对“+”信号的常数预测,所得到的正确预测信号百分比结果与 25 个智能交易系统的加权意见得出的结果相同。

图 1425 个智能交易系统平均预测时正确预测信号总数的直方图。标准偏差为 3.2 时,100 个 coterie 的平均值 = 11.7。 图 15同样的 25 个智能交易系统加权预测时正确预测信号总数的直方图。标准偏差为 4.9 时,100 个 coterie 的平均值 = 15.2

 



神经网络预测的可能利润率

到目前为止,我们将数值实验的结果归结成正确预测信号的百分比。现在让我们找出使用神经网络交易时实际可达到的利润率。上文中所述的利润率上限并未将行情波动考虑在内,实际情况下很难达到该上限,更何况之前我们还未考虑交易成本,这就会抵消掉达到的可预测性水平。

实际上,将佣金考虑在内会导致出现一个衰减常数:

此外,与可预测性水平 不同,佣金 是以线性而非平方形式增加的。因此,在上例中,可预测性的典型值 不可超过佣金

为了说明神经网络在此领域的真实可行性,我们将提供使用神经网络在不同的典型时间内基于三个指数进行自动交易的结果:卢克石油公司在俄罗斯交易所每隔一月的指数 S$P500 读数之间的值、DM/$ 的每日报价,和期货的每小时读数。预测统计数据采集自 50 个不同的神经网络系统(每个系统包含 50 个神经网络的 coterie)。图 16 中显示了时间序列本身以及针对各个时间序列最后 100 个值的测试集的信号预测结果。

图 16针对三个实际金融指数的 100 个值的测试样本所获得的正确 ( ) 和错误 ( ) 预测信号数量的平均值和直方图。

这些结果证实了这个直观上很明显的规律:读数之间的间隔时间越短,时间序列的可预测性越高。的确,时间序列的连续值之间的时间间隔越大,市场参与者可获得的与该时间序列动态变化相关的外部信息就越多,因此,时间序列自身关于未来的信息就越少。

然后,上述获得的预测用于在测试集上进行交易。同时,根据预测的置信水平成比例地选择每个步骤的合约金额,同时在学习样本上优化了全局参数 的值。此外,根据它的成功情况,coterie 中的每个网络都有其自己的浮动利率。在各个步骤的预测中,我们仅用了实际上“最佳”的那部分网络。图 17 中显示了此类“神经”交易者的结果。

图 17根据佣金金额实现的 50 次交易的获利统计数据。用虚线绘制的佣金的实际值显示了实际可达到的利润率区域。

当然,最终的获利(就像博弈策略本身)取决于佣金大小。上图中显示的正是这种依赖关系。对于作者已知计量单位的佣金的实际值,图中已做了标示。必须注意的是,这些实验并未考虑到实际交易的“量化”性质,即我们并未考虑交易仓位必须等于典型合约的整数。这种情况对应于大资本交易(其中的典型交易包含很多合约)。此外还隐含了担保交易,即利率润是作为安全资本的比率进行计算的,这个安全资本远小于合约本身的规模。

上述结果表明,基于神经网络的交易至少在短线交易上是很有前景的。此外,考虑到金融时间序列的自相似性(Peters,1994),典型交易时间越短,每个时间单位的利润率将更高。因此,结果证明,使用神经网络的自动交易者在实时交易模式下具有最高的效率,在此模式下,神经网络相对于典型经纪人来说有非常显著的优势:不知疲倦、不受情绪干扰、潜在的高得多的反应速度。连接到自动交易系统的训练有素的神经网络可以比要在终端图表上辨识价格变动的经纪人更早作出决策。



总结

我们证明了(至少某些)市场时间序列一定程度上是可预测的。像任何其他类型的神经分析一样,预测时间序列需要相当复杂、谨慎的数据预处理。但是,时间序列的使用有其自身的特点,可用于增加利润。这涉及到输入内容的选择(使用特殊的数据表示法)、输出内容的选择,以及特定误差函数的使用。最后,我们证明了使用 coterie 神经智能交易系统比使用单独神经网络更具盈利能力,还提供针对多个实际证券的实际利润率数据。



参考文献:

  • Sharpe, W.F., Alexander, G.J., Bailey, J.W.(1997).投资学。- 第 6 版,Prentice Hall, Inc.,1998。
  • Abu-Mostafa, Y.S.(1995).“金融市场应用之从提示中学习”。在资本市场中的神经网络中。Apostolos-Paul Refenes (Ed.), Wiley, 221-232.
  • Beltratti, A., Margarita, S. 和 Terna, P. (1995).神经网络在经济和金融建模中的应用。ITCP.
  • Chorafas, D.N.(1994).金融市场中的混沌理论。Probus Publishing.
  • Colby, R.W., Meyers, T.A.(1988).技术市场指标百科全书。IRWIN Professional Publishing.
  • Ehlers, J.F.(1992).MESA 和交易市场周期。Wiley.
  • Kaiser, G. (1995).小波通俗指南。Birk.
  • LeBeau, C. 和 Lucas, D.W.(1992).技术交易者指南:期货市场的计算机分析。Business One Irwin.
  • Peters, E.E.(1994).分形市场分析。Wiley.
  • Pring, M.G.(1991).技术分析精论。McGraw Hill.
  • Plummer, T. (1989).预测金融市场。Kogan Page.
  • Sauer, T., Yorke, J.A. 和 Casdagli, M. (1991).“内嵌理论”。统计物理学杂志65, 579-616.
  • Vemuri, V.R. 和 Rogers, R.D., eds.(1993).人工神经网络。预测时间序列。IEEE Comp.Soc.Press.
  • Weigend, A 和 Gershenfield, eds.(1994).时间序列预测:预测未来和了解过去。Addison-Wesley.
  • Baestaens, D.-E., Van Den Bergh, W.-M., Wood, D. 金融市场交易的神经网络解决方案。金融时间管理(1994 年 7 月)。

本文的发表已征得作者的同意。

关于作者:Sergey Shumskiy 是俄罗斯科学院物理研究所(物理与数学)的资深研究员(Cand.Sc.)、机器学习与人工智能技术专家、俄罗斯神经网络学会的主席团成员、使用机器学习技术开发企业专家系统的 IQMen Corp. 的首席执行官。Shumskiy 先生是 50 多份科技论文的合著者。作者的课程:神经计算及其在经济和商业上的应用

全部回复

0/140

量化课程

    移动端课程