请 [注册] 或 [登录]  | 返回主站

量化交易吧 /  数理科学 帖子:3364680 新帖:1

量化笔记(2)模型分类

爱德华发表于:5 月 9 日 18:39回复(1)

在之前的笔记中对策略作了一个简单的分类,经过时间的沉淀,对模型的分类有了新的认识,按照机器学习的概念来说,应该分为判别式模型和生成式模型,只有把这个概念区分清楚了,才会了解到自己当下的研究处于哪一范畴,还有哪些可以提升。

一、判别式模型

p(y/x)=f(x),线性回归、决策树、SVM、神经网络等均是判别式模型,按照公式可以理解为直接由特征对结果进行计算。
判别式模型多用于估值,比如当前横截面下的估值,又或者当前无风险利率条件下的估值等等。当然有时候估值策略并不是直接估计股票的价格,有可能是根据价格简化或者衍生出来的一个指标,比如PEG,这些指标和股价的关系是单调的,指标的大小可以直接反应股票的好坏。
估值模型的特点在于:简则粗,细则繁,如果用简单的模型正确率高,但对细节的估计往往不够,想把细节估计准确则模型可能很复杂,从而过拟合。
估值的最终目的是回归,即认为股票价格会回归到估值的水平从而进行买卖。虽然同为估值,但很多估值策略是在不同维度上进行比较的,不能简单比较两个策略的好坏。

二、生成式模型

p(y/x)=p(x,y)/p(x),所谓生成,便是通过联合概率分布来生成条件概率。生成式模型多用于直接的涨跌预测,最直观的便是技术指标,技术指标往往是所谓的统计学家根据观测得到条件概率,比如某某条件下股票上涨的概率是多少(金叉买入)。
生成式模型使用简单,但其中最重要的部分往往容易被忽略,即模型本身所假设的背景,比如MACD金叉所假设的是当下处于趋势行情这一基本假设,假设背景如果不正确,模型便会失效。
生成式模型一般都是用别人的模型,自己很难构建,因为其研究对数据量的要求非常大。

当然也不意味着判别式只能用于估值,判别式也可以用于涨跌预测,但是如果基于判别式的预测往往误差较大,较为复杂;生成式模型也可用于估值,但指标太多可能维度太高,数据量不够。总之,两种模型在不同地方的使用因地制宜。

全部回复

0/140

量化课程

    移动端课程