请 [注册] 或 [登录]  | 返回主站

量化交易吧 /  量化平台 帖子:3365876 新帖:9

用聚宽的分位回测的方法再验证一下Q

TRADE12发表于:5 月 10 日 16:16回复(1)

回复里添加不了研究,只能再开一贴。。。。问题来了,看研究。。。

#1 先导入所需要的程序包
import datetime
import numpy as np
import pandas as pd
import time
from jqdata import *
from pandas import Series, DataFrame
import matplotlib.pyplot as plt
import seaborn as sns
import itertools
import copy
import pickle

# 定义类'参数分析'
class parameter_analysis(object):
    
    # 定义函数中不同的变量
    def __init__(self, algorithm_id=None):
        self.algorithm_id = algorithm_id            # 回测id
        
        self.params_df = pd.DataFrame()             # 回测中所有调参备选值的内容,列名字为对应修改面两名称,对应回测中的 g.XXXX
        self.results = {}                           # 回测结果的回报率,key 为 params_df 的行序号,value 为
        self.evaluations = {}                       # 回测结果的各项指标,key 为 params_df 的行序号,value 为一个 dataframe
        self.backtest_ids = {}                      # 回测结果的 id
        
        # 新加入的基准的回测结果 id,可以默认为空 '',则使用回测中设定的基准
        self.benchmark_id = ''                      
        
        self.benchmark_returns = []                 # 新加入的基准的回测回报率
        self.returns = {}                           # 记录所有回报率
        self.excess_returns = {}                    # 记录超额收益率
        self.log_returns = {}                       # 记录收益率的 log 值
        self.log_excess_returns = {}                # 记录超额收益的 log 值
        self.dates = []                             # 回测对应的所有日期
        self.excess_max_drawdown = {}               # 计算超额收益的最大回撤
        self.excess_annual_return = {}              # 计算超额收益率的年化指标
        self.evaluations_df = pd.DataFrame()        # 记录各项回测指标,除日回报率外
    
    # 定义排队运行多参数回测函数
    def run_backtest(self,                          #
                     algorithm_id=None,             # 回测策略id
                     running_max=10,                # 回测中同时巡行最大回测数量
                     start_date='2016-01-01',       # 回测的起始日期
                     end_date='2016-04-30',         # 回测的结束日期
                     frequency='day',               # 回测的运行频率
                     initial_cash='1000000',        # 回测的初始持仓金额
                     param_names=[],                # 回测中调整参数涉及的变量
                     param_values=[]                # 回测中每个变量的备选参数值
                     ):
        # 当此处回测策略的 id 没有给出时,调用类输入的策略 id
        if algorithm_id == None: algorithm_id=self.algorithm_id
        
        # 生成所有参数组合并加载到 df 中
        # 包含了不同参数具体备选值的排列组合中一组参数的 tuple 的 list
        param_combinations = list(itertools.product(*param_values))
        # 生成一个 dataframe, 对应的列为每个调参的变量,每个值为调参对应的备选值
        to_run_df = pd.DataFrame(param_combinations)
        # 修改列名称为调参变量的名字
        to_run_df.columns = param_names
        to_run_df['backtestID']=''
        to_run_df['state']='waiting'
        to_run_df['times']=0
        

        # 设定运行起始时间和保存格式
        start = time.time()
        # 记录结束的运行回测
        finished_backtests = {}
        # 记录运行中的回测
        running_backtests = {}
        failed_backtests={}
        running_count=0

        # 总运行回测数目,等于排列组合中的元素个数
        total_backtest_num = len(param_combinations)
        # 记录回测结果的回报率
        all_results = {}
        # 记录回测结果的各项指标
        all_evaluations = {}
        
        # 在运行开始时显示
        print '【已完成|运行中|待运行||失败】:', 
        # 当运行回测开始后,如果没有全部运行完全的话:
        while len(to_run_df[(to_run_df.state=='waiting') | (to_run_df.state=='running')].index)>0:
            # 显示运行、完成和待运行的回测个数
            print('[%s|%s|%s||%s].' % (len(finished_backtests), 
                                   len(running_backtests), 
                                   (total_backtest_num-len(finished_backtests)-len(running_backtests)- len(failed_backtests)),
                                    len(failed_backtests)  
                                      )),
            # 把可用的空位进行跑回测
            for index in (to_run_df[to_run_df.state=='waiting'].index):
                # 备选的参数排列组合的 df 中第 i 行变成 dict,每个 key 为列名字,value 为 df 中对应的值
                if running_count>=running_max:
                    continue
                params = to_run_df.ix[index,param_names].to_dict()
                # 记录策略回测结果的 id,调整参数 extras 使用 params 的内容
                backtest = create_backtest(algorithm_id = algorithm_id,
                                           start_date = start_date, 
                                           end_date = end_date, 
                                           frequency = frequency, 
                                           initial_cash = initial_cash, 
                                           extras = params, 
                                           # 再回测中把改参数的结果起一个名字,包含了所有涉及的变量参数值
                                           name =str( params).replace('{','').replace('}','').replace('\'','')
                                           )
                # 记录运行中 i 回测的回测 id
                to_run_df.at[index,'backtestID'] = backtest
                to_run_df.at[index,'state']='running'
                to_run_df.at[index,'times']=to_run_df.at[index,'times']+1
                running_count=running_count+1

            # 获取回测结果
            failed = []
            finished = []
            # 对于运行中的回测,key 为 to_run_df 中所有排列组合中的序数

            for index in to_run_df[to_run_df.state=='running'].index:
                # 研究调用回测的结果,running_backtests[key] 为运行中保存的结果 id
                bt = get_backtest(to_run_df.at[index,'backtestID'])
                # 获得运行回测结果的状态,成功和失败都需要运行结束后返回,如果没有返回则运行没有结束
                status = bt.get_status()
                # 当运行回测失败
                if status in [ 'failed','canceled','deleted']:
                    # 失败 list 中记录对应的回测结果 id
                    failed.append(index)
                # 当运行回测成功时
                elif status == 'done':
                    # 成功 list 记录对应的回测结果 id,finish 仅记录运行成功的
                    finished.append(index)
                    # 回测回报率记录对应回测的回报率 dict, key to_run_df 中所有排列组合中的序数, value 为回报率的 dict
                    # 每个 value 一个 list 每个对象为一个包含时间、日回报率和基准回报率的 dict
                    all_results[index] = bt.get_results()
                    # 回测回报率记录对应回测结果指标 dict, key to_run_df 中所有排列组合中的序数, value 为回测结果指标的 dataframe
                    all_evaluations[index] = bt.get_risk()
            # 记录运行中回测结果 id 的 list 中删除失败的运行
            for index in failed:
                if to_run_df.at[index,'times']<3:
                    to_run_df.at[index,'state']='waiting'
                else:
                    to_run_df.at[index,'state']='failed'

            # 在结束回测结果 dict 中记录运行成功的回测结果 id,同时在运行中的记录中删除该回测
            for index in finished:
                to_run_df.at[index,'state']='done'
            
            running_count=len(to_run_df[to_run_df.state=='running'].index)
            running_backtests=to_run_df[to_run_df.state=='running']['backtestID'].to_dict()
            finished_backtests=to_run_df[to_run_df.state=='done']['backtestID'].to_dict()
            failed_backtests=to_run_df[to_run_df.state=='failed']['backtestID'].to_dict()
            
            # 当一组同时运行的回测结束时报告时间
            if len(finished_backtests) != 0 and len(finished_backtests) % running_max == 0 :
                # 记录当时时间
                middle = time.time()
                # 计算剩余时间,假设没工作量时间相等的话
                remain_time = (middle - start) * (total_backtest_num - len(finished_backtests)) / len(finished_backtests)
                # print 当前运行时间
                print('[已用%s时,尚余%s时,请不要关闭浏览器].' % (str(round((middle - start) / 60.0 / 60.0,3)), 
                                          str(round(remain_time / 60.0 / 60.0,3)))),
            # 5秒钟后再跑一下
            

            time.sleep(5) 
        # 记录结束时间
        end = time.time() 
        print ''
        print('【回测完成】总用时:%s秒(即%s小时)。' % (str(int(end-start)), 
                                           str(round((end-start)/60.0/60.0,2)))),
        # 对应修改类内部对应
        self.params_df = to_run_df.ix[:,param_names]
        self.results = all_results
        self.evaluations = all_evaluations
        self.backtest_ids = finished_backtests

        
    #7 最大回撤计算方法
    def find_max_drawdown(self, returns):
        # 定义最大回撤的变量
        result = 0
        # 记录最高的回报率点
        historical_return = 0
        # 遍历所有日期
        for i in range(len(returns)):
            # 最高回报率记录
            historical_return = max(historical_return, returns[i])
            # 最大回撤记录
            drawdown = 1-(returns[i] + 1) / (historical_return + 1)
            # 记录最大回撤
            result = max(drawdown, result)
        # 返回最大回撤值
        return result

    # log 收益、新基准下超额收益和相对与新基准的最大回撤
    def organize_backtest_results(self, benchmark_id=None):
        # 若新基准的回测结果 id 没给出
        if benchmark_id==None:
            # 使用默认的基准回报率,默认的基准在回测策略中设定
            self.benchmark_returns = [x['benchmark_returns'] for x in self.results[0]]
        # 当新基准指标给出后    
        else:
            # 基准使用新加入的基准回测结果
            self.benchmark_returns = [x['returns'] for x in get_backtest(benchmark_id).get_results()]
        # 回测日期为结果中记录的第一项对应的日期
        self.dates = [x['time'] for x in self.results[0]]
        
        # 对应每个回测在所有备选回测中的顺序 (key),生成新数据
        # 由 {key:{u'benchmark_returns': 0.022480100091729405,
        #           u'returns': 0.03184566700000002,
        #           u'time': u'2006-02-14'}} 格式转化为:
        # {key: []} 格式,其中 list 为对应 date 的一个回报率 list
        for key in self.results.keys():
            self.returns[key] = [x['returns'] for x in self.results[key]]
        # 生成对于基准(或新基准)的超额收益率
        for key in self.results.keys():
            self.excess_returns[key] = [(x+1)/(y+1)-1 for (x,y) in zip(self.returns[key], self.benchmark_returns)]
        # 生成 log 形式的收益率
        for key in self.results.keys():
            self.log_returns[key] = [log(x+1) for x in self.returns[key]]
        # 生成超额收益率的 log 形式
        for key in self.results.keys():
            self.log_excess_returns[key] = [log(x+1) for x in self.excess_returns[key]]
        # 生成超额收益率的最大回撤
        for key in self.results.keys():
            self.excess_max_drawdown[key] = self.find_max_drawdown(self.excess_returns[key])
        # 生成年化超额收益率
        for key in self.results.keys():
            self.excess_annual_return[key] = (self.excess_returns[key][-1]+1)**(252./float(len(self.dates)))-1
        # 把调参数据中的参数组合 df 与对应结果的 df 进行合并
        self.evaluations_df = pd.concat([self.params_df, pd.DataFrame(self.evaluations).T], axis=1)
#         self.evaluations_df = 

    # 获取最总分析数据,调用排队回测函数和数据整理的函数    
    def get_backtest_data(self,
                          algorithm_id=None,                         # 回测策略id
                          benchmark_id=None,                         # 新基准回测结果id
                          file_name='results.pkl',                   # 保存结果的 pickle 文件名字
                          running_max=10,                            # 最大同时运行回测数量
                          start_date='2016-01-01',                   # 回测开始时间
                          end_date='2016-04-30',                     # 回测结束日期
                          frequency='day',                           # 回测的运行频率
                          initial_cash='1000000',                    # 回测初始持仓资金
                          param_names=[],                            # 回测需要测试的变量
                          param_values=[]                            # 对应每个变量的备选参数
                          ):
        # 调运排队回测函数,传递对应参数
        self.run_backtest(algorithm_id=algorithm_id,
                          running_max=running_max,
                          start_date=start_date,
                          end_date=end_date,
                          frequency=frequency,
                          initial_cash=initial_cash,
                          param_names=param_names,
                          param_values=param_values
                          )
        # 回测结果指标中加入 log 收益率和超额收益率等指标
        self.organize_backtest_results(benchmark_id)
        # 生成 dict 保存所有结果。
        results = {'returns':self.returns,
                   'excess_returns':self.excess_returns,
                   'log_returns':self.log_returns,
                   'log_excess_returns':self.log_excess_returns,
                   'dates':self.dates,
                   'benchmark_returns':self.benchmark_returns,
                   'evaluations':self.evaluations,
                   'params_df':self.params_df,
                   'backtest_ids':self.backtest_ids,
                   'excess_max_drawdown':self.excess_max_drawdown,
                   'excess_annual_return':self.excess_annual_return,
                   'evaluations_df':self.evaluations_df}
        # 保存 pickle 文件
        pickle_file = open(file_name, 'wb')
        pickle.dump(results, pickle_file)
        pickle_file.close()

    # 读取保存的 pickle 文件,赋予类中的对象名对应的保存内容    
    def read_backtest_data(self, file_name='results.pkl'):
        pickle_file = open(file_name, 'rb')
        results = pickle.load(pickle_file)
        self.returns = results['returns']
        self.excess_returns = results['excess_returns']
        self.log_returns = results['log_returns']
        self.log_excess_returns = results['log_excess_returns']
        self.dates = results['dates']
        self.benchmark_returns = results['benchmark_returns']
        self.evaluations = results['evaluations']
        self.params_df = results['params_df']
        self.backtest_ids = results['backtest_ids']
        self.excess_max_drawdown = results['excess_max_drawdown']
        self.excess_annual_return = results['excess_annual_return']
        self.evaluations_df = results['evaluations_df']
        
    # 回报率折线图    
    def plot_returns(self):
        # 通过figsize参数可以指定绘图对象的宽度和高度,单位为英寸;
        fig = plt.figure(figsize=(20,8))
        ax = fig.add_subplot(111)
        # 作图
        for key in self.returns.keys():
            ax.plot(range(len(self.returns[key])), self.returns[key], label=key)
        # 设定benchmark曲线并标记
        ax.plot(range(len(self.benchmark_returns)), self.benchmark_returns, label='benchmark', c='k', linestyle='--') 
        ticks = [int(x) for x in np.linspace(0, len(self.dates)-1, 11)]
        print(ticks)
        plt.xticks(ticks, [self.dates[i] for i in ticks])
        # 设置图例样式
        ax.legend(loc = 2, fontsize = 10)
        # 设置y标签样式
        ax.set_ylabel('returns',fontsize=20)
        # 设置x标签样式
        ax.set_yticklabels([str(x*100)+'% 'for x in ax.get_yticks()])
        # 设置图片标题样式
        ax.set_title("Strategy's performances with different parameters", fontsize=21)
        plt.xlim(0, len(self.returns[0]))

    # 超额收益率图    
    def plot_excess_returns(self):
        # 通过figsize参数可以指定绘图对象的宽度和高度,单位为英寸;
        fig = plt.figure(figsize=(20,8))
        ax = fig.add_subplot(111)
        # 作图
        for key in self.returns.keys():
            ax.plot(range(len(self.excess_returns[key])), self.excess_returns[key], label=key)
        # 设定benchmark曲线并标记
        ax.plot(range(len(self.benchmark_returns)), [0]*len(self.benchmark_returns), label='benchmark', c='k', linestyle='--')
        ticks = [int(x) for x in np.linspace(0, len(self.dates)-1, 11)]
        plt.xticks(ticks, [self.dates[i] for i in ticks])
        # 设置图例样式
        ax.legend(loc = 2, fontsize = 10)
        # 设置y标签样式
        ax.set_ylabel('excess returns',fontsize=20)
        # 设置x标签样式
        ax.set_yticklabels([str(x*100)+'% 'for x in ax.get_yticks()])
        # 设置图片标题样式
        ax.set_title("Strategy's performances with different parameters", fontsize=21)
        plt.xlim(0, len(self.excess_returns[0]))
        
    # log回报率图    
    def plot_log_returns(self):
        # 通过figsize参数可以指定绘图对象的宽度和高度,单位为英寸;
        fig = plt.figure(figsize=(20,8))
        ax = fig.add_subplot(111)
        # 作图
        for key in self.returns.keys():
            ax.plot(range(len(self.log_returns[key])), self.log_returns[key], label=key)
        # 设定benchmark曲线并标记
        ax.plot(range(len(self.benchmark_returns)), [log(x+1) for x in self.benchmark_returns], label='benchmark', c='k', linestyle='--')
        ticks = [int(x) for x in np.linspace(0, len(self.dates)-1, 11)]
        plt.xticks(ticks, [self.dates[i] for i in ticks])
        # 设置图例样式
        ax.legend(loc = 2, fontsize = 10)
        # 设置y标签样式
        ax.set_ylabel('log returns',fontsize=20)
        # 设置图片标题样式
        ax.set_title("Strategy's performances with different parameters", fontsize=21)
        plt.xlim(0, len(self.log_returns[0]))
    
    # 超额收益率的 log 图
    def plot_log_excess_returns(self):
        # 通过figsize参数可以指定绘图对象的宽度和高度,单位为英寸;
        fig = plt.figure(figsize=(20,8))
        ax = fig.add_subplot(111)
        # 作图
        for key in self.returns.keys():
            ax.plot(range(len(self.log_excess_returns[key])), self.log_excess_returns[key], label=key)
        # 设定benchmark曲线并标记
        ax.plot(range(len(self.benchmark_returns)), [0]*len(self.benchmark_returns), label='benchmark', c='k', linestyle='--')
        ticks = [int(x) for x in np.linspace(0, len(self.dates)-1, 11)]
        plt.xticks(ticks, [self.dates[i] for i in ticks])
        # 设置图例样式
        ax.legend(loc = 2, fontsize = 10)
        # 设置y标签样式
        ax.set_ylabel('log excess returns',fontsize=20)
        # 设置图片标题样式
        ax.set_title("Strategy's performances with different parameters", fontsize=21)
        plt.xlim(0, len(self.log_excess_returns[0]))

        
    # 回测的4个主要指标,包括总回报率、最大回撤夏普率和波动
    def get_eval4_bar(self, sort_by=[]): 
        
        sorted_params = self.params_df
        for by in sort_by:
            sorted_params = sorted_params.sort(by)
        indices = sorted_params.index
        
        fig = plt.figure(figsize=(20,7))

        # 定义位置
        ax1 = fig.add_subplot(221)
        # 设定横轴为对应分位,纵轴为对应指标
        ax1.bar(range(len(indices)), 
                [self.evaluations[x]['algorithm_return'] for x in indices], 0.6, label = 'Algorithm_return')
        plt.xticks([x+0.3 for x in range(len(indices))], indices)
        # 设置图例样式
        ax1.legend(loc='best',fontsize=15)
        # 设置y标签样式
        ax1.set_ylabel('Algorithm_return', fontsize=15)
        # 设置y标签样式
        ax1.set_yticklabels([str(x*100)+'% 'for x in ax1.get_yticks()])
        # 设置图片标题样式
        ax1.set_title("Strategy's of Algorithm_return performances of different quantile", fontsize=15)
        # x轴范围
        plt.xlim(0, len(indices))

        # 定义位置
        ax2 = fig.add_subplot(224)
        # 设定横轴为对应分位,纵轴为对应指标
        ax2.bar(range(len(indices)), 
                [self.evaluations[x]['max_drawdown'] for x in indices], 0.6, label = 'Max_drawdown')
        plt.xticks([x+0.3 for x in range(len(indices))], indices)
        # 设置图例样式
        ax2.legend(loc='best',fontsize=15)
        # 设置y标签样式
        ax2.set_ylabel('Max_drawdown', fontsize=15)
        # 设置x标签样式
        ax2.set_yticklabels([str(x*100)+'% 'for x in ax2.get_yticks()])
        # 设置图片标题样式
        ax2.set_title("Strategy's of Max_drawdown performances of different quantile", fontsize=15)
        # x轴范围
        plt.xlim(0, len(indices))

        # 定义位置
        ax3 = fig.add_subplot(223)
        # 设定横轴为对应分位,纵轴为对应指标
        ax3.bar(range(len(indices)),
                [self.evaluations[x]['sharpe'] for x in indices], 0.6, label = 'Sharpe')
        plt.xticks([x+0.3 for x in range(len(indices))], indices)
        # 设置图例样式
        ax3.legend(loc='best',fontsize=15)
        # 设置y标签样式
        ax3.set_ylabel('Sharpe', fontsize=15)
        # 设置x标签样式
        ax3.set_yticklabels([str(x*100)+'% 'for x in ax3.get_yticks()])
        # 设置图片标题样式
        ax3.set_title("Strategy's of Sharpe performances of different quantile", fontsize=15)
        # x轴范围
        plt.xlim(0, len(indices))

        # 定义位置
        ax4 = fig.add_subplot(222)
        # 设定横轴为对应分位,纵轴为对应指标
        ax4.bar(range(len(indices)), 
                [self.evaluations[x]['algorithm_volatility'] for x in indices], 0.6, label = 'Algorithm_volatility')
        plt.xticks([x+0.3 for x in range(len(indices))], indices)
        # 设置图例样式
        ax4.legend(loc='best',fontsize=15)
        # 设置y标签样式
        ax4.set_ylabel('Algorithm_volatility', fontsize=15)
        # 设置x标签样式
        ax4.set_yticklabels([str(x*100)+'% 'for x in ax4.get_yticks()])
        # 设置图片标题样式
        ax4.set_title("Strategy's of Algorithm_volatility performances of different quantile", fontsize=15)
        # x轴范围
        plt.xlim(0, len(indices))
        
    #14 年化回报和最大回撤,正负双色表示
    def get_eval(self, sort_by=[]):

        sorted_params = self.params_df
        for by in sort_by:
            sorted_params = sorted_params.sort(by)
        indices = sorted_params.index
        
        # 大小
        fig = plt.figure(figsize = (20, 8))
        # 图1位置
        ax = fig.add_subplot(111)
        # 生成图超额收益率的最大回撤
        ax.bar([x+0.3 for x in range(len(indices))],
               [-self.evaluations[x]['max_drawdown'] for x in indices], color = '#32CD32',  
                     width = 0.6, label = 'Max_drawdown', zorder=10)
        # 图年化超额收益
        ax.bar([x for x in range(len(indices))],
               [self.evaluations[x]['annual_algo_return'] for x in indices], color = 'r', 
                     width = 0.6, label = 'Annual_return')
        plt.xticks([x+0.3 for x in range(len(indices))], indices)
        # 设置图例样式
        ax.legend(loc='best',fontsize=15)
        # 基准线
        plt.plot([0, len(indices)], [0, 0], c='k', 
                 linestyle='--', label='zero')
        # 设置图例样式
        ax.legend(loc='best',fontsize=15)
        # 设置y标签样式
        ax.set_ylabel('Max_drawdown', fontsize=15)
        # 设置x标签样式
        ax.set_yticklabels([str(x*100)+'% 'for x in ax.get_yticks()])
        # 设置图片标题样式
        ax.set_title("Strategy's performances of different quantile", fontsize=15)
        #   设定x轴长度
        plt.xlim(0, len(indices))


    #14 超额收益的年化回报和最大回撤
    # 加入新的benchmark后超额收益和
    def get_excess_eval(self, sort_by=[]):

        sorted_params = self.params_df
        for by in sort_by:
            sorted_params = sorted_params.sort(by)
        indices = sorted_params.index
        
        # 大小
        fig = plt.figure(figsize = (20, 8))
        # 图1位置
        ax = fig.add_subplot(111)
        # 生成图超额收益率的最大回撤
        ax.bar([x+0.3 for x in range(len(indices))],
               [-self.excess_max_drawdown[x] for x in indices], color = '#32CD32',  
                     width = 0.6, label = 'Excess_max_drawdown')
        # 图年化超额收益
        ax.bar([x for x in range(len(indices))],
               [self.excess_annual_return[x] for x in indices], color = 'r', 
                     width = 0.6, label = 'Excess_annual_return')
        plt.xticks([x+0.3 for x in range(len(indices))], indices)
        # 设置图例样式
        ax.legend(loc='best',fontsize=15)
        # 基准线
        plt.plot([0, len(indices)], [0, 0], c='k', 
                 linestyle='--', label='zero')
        # 设置图例样式
        ax.legend(loc='best',fontsize=15)
        # 设置y标签样式
        ax.set_ylabel('Max_drawdown', fontsize=15)
        # 设置x标签样式
        ax.set_yticklabels([str(x*100)+'% 'for x in ax.get_yticks()])
        # 设置图片标题样式
        ax.set_title("Strategy's performances of different quantile", fontsize=15)
        #   设定x轴长度
        plt.xlim(0, len(indices))
#2 设定回测策略 id ,即编辑策略URL中algorithmId=xxxxxxxxxxxxx,algorithmId后的那部分
pa = parameter_analysis('2eb83d12aaec936f3e3fab3aafc3cd10')
#3 运行回测
pa.get_backtest_data(file_name = 'results.pkl',#保存结果的文件名
                          running_max = 5, #最大运行回测数量
                          start_date = '2006-01-01',#回测开始时间
                          end_date = '2018-12-01',#回测结束时间
                          frequency = 'day',#回测频率可选:‘day’、'minute'
                          initial_cash = '2000000',#初始资金
                          param_names = ['factor', 'quantile'],#变量名,即在策略中的g.xxxx变量
                          param_values = [['Q'], tuple(zip(range(0,50,10), range(10,51,10)))]#变量数值取值范围,数量需与上述变量名一致
                          )
【已完成|运行中|待运行||失败】: [0|0|5||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [0|5|0||0]. [1|4|0||0]. [1|4|0||0]. [1|4|0||0]. [1|4|0||0]. [1|4|0||0]. [1|4|0||0]. [1|4|0||0]. [1|4|0||0]. [2|3|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [3|2|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [4|1|0||0]. [已用0.762时,尚余0.0时,请不要关闭浏览器]. 
【回测完成】总用时:2748秒(即0.76小时)。
#4 数据读取
pa.read_backtest_data('results.pkl')
#5 回测参数的 Dataframe
pa.params_df
factor quantile
0 Q (0, 10)
1 Q (10, 20)
2 Q (20, 30)
3 Q (30, 40)
4 Q (40, 50)
#6 查看回测结果指标
pa.evaluations_df
factor quantile __version algorithm_return algorithm_volatility alpha annual_algo_return annual_bm_return benchmark_return benchmark_volatility ... excess_return information max_drawdown max_drawdown_period max_leverage period_label sharpe sortino trading_days treasury_return
0 Q (0, 10) 101 0.5447666 0.2899972 -0.02946761 0.03523001 0.06590466 1.229167 0.2634988 ... 0.02827342 -0.2109873 0.764 [2015-05-27, 2018-10-18] 0 2018-11 -0.01644841 -0.01967284 3140 0.5164932
1 Q (10, 20) 101 2.823629 0.2848161 0.04795274 0.1126933 0.06590466 1.229167 0.2634988 ... 2.307135 0.3494309 0.6803768 [2015-06-12, 2018-10-18] 0 2018-11 0.2552287 0.3024984 3140 0.5164932
2 Q (20, 30) 101 3.393039 0.2960847 0.05924536 0.1250597 0.06590466 1.229167 0.2634988 ... 2.876545 0.4323673 0.6987153 [2008-01-15, 2008-11-04] 0 2018-11 0.2872816 0.3376217 3140 0.5164932
3 Q (30, 40) 101 4.992744 0.2998492 0.08702251 0.1532219 0.06590466 1.229167 0.2634988 ... 4.476251 0.6351729 0.689242 [2008-01-15, 2008-11-04] 0 2018-11 0.3775962 0.4443115 3140 0.5164932
4 Q (40, 50) 101 4.855184 0.3049836 0.08467093 0.1510917 0.06590466 1.229167 0.2634988 ... 4.338691 0.5904264 0.692794 [2008-01-15, 2008-11-04] 0 2018-11 0.3642546 0.4279318 3140 0.5164932

5 rows × 21 columns

7、首先是收益曲线 parameter_analysis.plot_returns(),这里回测编号从 0 到 4 是 Q 值从大到小的回测。可以看出这个因子是具有单调性质的,也就是说 Q 值更大的股票表现一般比 Q 小的股票表现更差。但是,Q 指标的单调性并不是非常具有区分度,比如 (10,20) 分位的和(20,30)股票的收益率是区分度很低,同样(30,40) 分位的和(40,50)股票的收益率是区分度很低 。¶

 #7 回报率折线图    
pa.plot_returns()
[0, 313, 627, 941, 1255, 1569, 1883, 2197, 2511, 2825, 3139]

8、从超额收益的图可以看出,除了最大Q值组跑输大盘,其他都是有超额收益的。这里比较的基准可以更换为等权指数再比较¶

#8 超额收益率图    
pa.plot_excess_returns()
#9 log回报率图    
pa.plot_log_returns()

10、从图中可以看出,早期没有拉开差距,反而是近年来有了区分。。。这个和我之前的判断有很大的出入¶

难道近年来有效了,什么鬼原因???为啥我的策略一年没超额收益。。。这个因子很迷!!!!!!¶

#10 超额收益率的 log 图
pa.plot_log_excess_returns()

11、再用 parameter_analysis.get_eval4_bar() 画出策略的年化收益、最大回撤、夏普率和波动率,可以看出 Q 策略各分位表现出了收益不完全单调,第4组表现最好;对应的其他指标也并不单调。能够简单总结 Q 较小还是体现公司的股票回报率会好于 Q 较高的股票,伴随的是收益较高反而最大回撤较小。夏普率的变动与回报率较为一致,但是波动率变动在不同分位间差距不明显。¶

#11 回测的4个主要指标,包括总回报率、最大回撤夏普率和波动
# get_eval4_bar(self, sort_by=[])
pa.get_eval4_bar()

12、使用正的年化收益与负的最大回撤构建柱状图¶

#12 年化回报和最大回撤,正负双色显示
# get_eval(self, sort_by=[])
pa.get_eval()

13、可以通过 parameter_analysis.get_excess_eval() 获得超额回报和超额回报最大回撤的柱状图。最大回撤也拉开了距离;按照策略净值算的最大回撤由于经历过同样的股灾,所以最大回撤都是百分之六十多,但在剔除大盘影响之后就能比较清晰地对比超额收益的回撤。整体来说,按 Q 选股的各个分为超额收益都不高,并且相对于基准的超额回撤都不小。¶

#13 超额收益的年化回报和最大回撤
# 加入新的benchmark后超额收益和
# get_excess_eval(self, sort_by=[])
pa.get_excess_eval()
# test 测试最后bar图中的sort_by对应内容
param_names=['abc','x_y_z']
param_values=[['a','b','c'], [1,2]]
param_combinations = list(itertools.product(*param_values))
to_run_df = pd.DataFrame(param_combinations)
to_run_df.columns = param_names
# to_run_df.ix[1].to_dict()
to_run_df

# sort_by = ['abc']
sort_by = ['abc', 'x_y_z']
# sort_by = ['x_y_z']
# sort_by = ['x_y_z','abc']
sorted_params = to_run_df
for by in sort_by:
    sorted_params = sorted_params.sort(by)
indices = sorted_params.index
sorted_params
abc x_y_z
0 a 1
2 b 1
4 c 1
1 a 2
3 b 2
5 c 2
 

全部回复

0/140

量化课程

    移动端课程