"피포리오" 도구를 사용하여 백테스트 자본 곡선의 평가

저자:선함, 2020-06-23 09:55:35, 업데이트: 2023-10-31 21:02:34

img

전문

며칠 전에 FMZ 전략 백테스트 결과의 이익과 손실 곡선 출력이 비교적 간단하다는 것이 밝혀졌습니다. 그래서 수익 결과 데이터를 얻고 직접 처리하여 보다 자세한 자본 곡선 평가 보고서를 얻고 그래픽으로 표시 할 수 있는지 생각했습니다. 아이디어를 작성하기 시작했을 때 그렇게 쉬운 일이 아니라는 것을 알게되었습니다. 그래서 누군가가 동일한 아이디어를 가지고 있으며 해당 도구를 이미 만들었는지 궁금합니다. 그래서 인터넷을 검색하고 실제로 그러한 도구가 있음을 발견했습니다.pyfolio.

피포리오란 무엇입니까?

pyfolioquantinc이 개발한 금융 포트폴리오 성과 및 위험 분석을 위한 파이썬 라이브러리입니다. Zipline 오픈 소스 백테스트 라이브러리와 잘 작동합니다.Zipline, Alphalens, Pyfolio, FactSet데이터 등

그 핵심pyfolio이 그래프는 다양한 독립적인 그래프로 구성되어 거래 알고리즘의 성능에 대한 포괄적인 그림을 제공합니다.

GitHub address: https://github.com/quantopian/pyfolio

파이폴리오 사용법을 배우세요.

이 도구에 대한 온라인 학습 자료가 거의 없기 때문에 쉽게 사용하기에는 시간이 오래 걸립니다.

PyFolioAPI 참조:

https://www.quantopian.com/docs/api-reference/pyfolio-api-reference#pyfolio-api-reference

다음은 보다 상세한 소개입니다pyfolio이 플랫폼은 미국 주식의 백테스팅을 위해 사용될 수 있습니다. 백테스팅 결과는pyfolio저는 대략적으로 배웠어요. 다른 기능들이 상당히 강력해 보입니다.

pyfolio를 설치합니다

설치pyfolio비교적 간단합니다. 그냥 GitHub에 있는 지침을 따르세요.

pyfolio로 표시된 FMZ 백테스트 결과

먼저 FMZ 플랫폼에서 자본 곡선 데이터를 얻습니다.

img

위 그림의 전체 화면 옆에 있는 버튼을 클릭하고, Download CSV를 선택합니다. 얻은 CSV 데이터의 형식은 다음과 같습니다 (파일 이름은 필요에 따라 변경할 수 있습니다):

img

분석 결과에 대한 비교 벤치마크를 가지고 싶다면 거래 목표의 K-라인 일일 데이터를 준비해야합니다. K-라인 데이터가 없으면 소득 데이터만 분석 할 수 있지만 벤치마크 데이터 분석 결과에 대한 몇 가지 더 많은 지표가있을 것입니다. 예를 들어: 알파, 베타 등. 다음 내용은 기본 K-라인 데이터에 따라 작성됩니다.

우리는 FMZ 연구 환경을 통해 플랫폼에서 직접 K-라인 데이터를 얻을 수 있습니다:

# Use the API provided by the FMZ research environment to obtain K-line data which equal to the revenue data
dfh = get_bars('bitfinex.btc_usd', '1d', start=str(startd), end=str(endd))

데이터가 준비된 후, 우리는 코딩을 시작할 수 있습니다. 우리는 수집 된 데이터를 처리하여pyfolio그리고 그 다음 전화create_returns_tear_sheet인터페이스pyfolio계산하고 결과물을 내보낼 수 있습니다returns, benchmark_rets=None그리고live_start_date=None세 개의 매개 변수

return매개 변수 (parameter) 는 소득 데이터가 필요합니다.benchmark_rets기준값 데이터인 경우, 필요 없습니다.live_start_datelive_start_date필요없습니다.

이 매개 변수의 의미는returns실제 시장에서 시작합니까? 예를 들어, 우리의returns위와 같이, 우리가 2019-12-01 이후 실제 시장을 시작한다고 가정하고, 이전 시뮬레이션 시장 또는 백테스트의 결과라고 가정하면 다음과 같이 설정할 수 있습니다.live_start_date = '2019-12-01'.

매개 변수를 설정함으로써, 우리는 이론적으로 우리의 전략이 과장되어 있는지 분석할 수 있습니다. 샘플의 내부와 외부의 차이가 크다면, 이것은 과장되어 있는 가능성이 높습니다.

우리는 FMZ 연구 환경에서 이 분석 기능을 구현할 수 있습니다. 또는 우리는 지역적으로 구현할 수 있습니다. 다음은 FMZ 연구 환경에서 구현을 예로 들 수 있습니다.

https://www.fmz.com/upload/asset/1379deaa35b22ee37de23.ipynb?name=%E5%88%A9%E7%94%A8pyfolio%E5%B7%A5%E5%85%B7%E8%AF%84%E4%BB%B7%E5%9B%9E%E6%B5%8B%E8%B5%84%E9%87%91%E6%9B%B2%E7%BA%BF(%E5%8E%9F%E5%88%9B).ipynb
# First, create a new "csv to py code.py" python file locally and copy the following code to generate the py code containing the CSV file of the fund curve downloaded from FMZ. Running the newly created py file locally will generate "chart_hex.py" file.

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import binascii

# The file name can be customized as needed, this example uses the default file name
filename = 'chart.csv'
with open(filename, 'rb') as f:
    content = f.read()
# csv to py
wFile = open(filename.split('.')[0] + '_hex.py', "w")
wFile.write("hexstr = bytearray.fromhex('" +
            bytes.decode(binascii.hexlify(content))
            + "').decode()\nwFile = open('" + filename + "', 'w')\nwFile.write(hexstr)\nwFile.close()")
wFile.close()
# Open the "chart_hex.py" file generated above, copy all the contents and replace the following code blocks, and then run the following code blocks one by one to get the chart.csv file

hexstr = bytearray.fromhex('').decode()
wFile = open('chart.csv', 'w')
wFile.write(hexstr)
wFile.close()

!ls -la

cat chart.csv
# Install pyfolio library in research environment

!pip3 install --user pyfolio
import pandas as pd
import sys
sys.path.append('/home/quant/.local/lib/python3.6/site-packages')
import pyfolio as pf
import matplotlib.pyplot as plt
%matplotlib inline
import warnings
warnings.filterwarnings('ignore')
from fmz import * # import all FMZ functions

# Read fund curve data, FMZ platform download, cumulative income data
df=pd.read_csv(filepath_or_buffer='chart.csv')
# Convert to date format
df['Date'] = pd.to_datetime(df['DateTime'],format='%Y-%m-%d %H:%M:%S')
# Get start and end time
startd = df.at[0,'Date']
endd = df.at[df.shape[0]-1,'Date']

# Read the target asset daily K-line data, and use it as the benchmark income data
# Use the API provided by the FMZ research environment to obtain K-line data equal to the revenue data
dfh = get_bars('bitfinex.btc_usd', '1d', start=str(startd), end=str(endd))
dfh=dfh[['close']]
# Calculate the daily rise and fall based on the closing price of k-line data
dfh['close_shift'] = dfh['close'].shift(1)
dfh = dfh.fillna(method='bfill') #  Look down for the nearest non-null value, fill the exact position with this value, full name "backward fill"
dfh['changeval']=dfh['close']-dfh['close_shift']
dfh['change']=dfh['changeval']/dfh['close_shift']
# Frequency changes keep 6 decimal places
dfh = dfh.round({'change': 6})

# Revenue data processing, the FMZ platform obtains the cumulative revenue, and converts it to the daily revenue change rate
df['return_shift'] = df['Floating Profit and Loss'].shift(1)
df['dayly']=df['Floating P&L']-df['return_shift']
chushizichan = 3 #  Initial asset value in FMZ backtest
df['returns'] = df['dayly']/(df['return_shift']+chushizichan)
df=df[['Date','Floating Profit and Loss','return_shift','dayly','returns']]
df = df.fillna(value=0.0)
df = df.round({'dayly': 3}) # retain three decimal places
df = df.round({'returns': 6})

# Convert pd.DataFrame to pd.Series required for pyfolio earnings
df['Date'] = pd.to_datetime(df['Date'])
df=df[['Date','returns']]
df.set_index('Date', inplace=True)
# Processed revenue data
returns = df['returns'].tz_localize('UTC')

# Convert pd.DataFrame to pd.Series required for pyfolio benchmark returns
dfh=dfh[['change']]
dfh = pd.Series(dfh['change'].values, index=dfh.index)
# Processed benchmark data
benchmark_rets = dfh

# The point in time when real-time trading begins after the strategy's backtest period.
live_start_date = '2020-02-01'

# Call pyfolio's API to calculate and output the fund curve analysis result graph
# "returns" Parameters are required, the remaining parameters can not be entered
pf.create_returns_tear_sheet(returns,benchmark_rets=benchmark_rets,live_start_date=live_start_date)

출력 분석 결과:

img img

결과 해석

많은 출력 데이터가 있습니다, 우리는 진정하고 이러한 지표가 무엇을 의미하는지 알아야합니다. 몇 가지를 소개해 드리겠습니다. 관련 지표에 대한 소개를 찾고 지표의 의미를 이해하면 거래 전략 상태를 해석 할 수 있습니다.

  • 연간 수익

연간수익률은 현재의 수익률 (일일 수익률, 주간수익률, 월간수익률 등) 을 연간수익률으로 변환하여 계산된다. 이것은 이론적 수익률이며 실제로 달성된 수익률이 아니다. 연간수익률은 연간수익률과 구별되어야 한다. 연간수익률은 전략 실행의 1년 동안의 수익률을 가리키며 실제 수익률이다.

  • 누적 수익

가장 이해하기 쉬운 개념은 전략의 수익률입니다. 전략의 시작부터 끝까지 총 자산의 변화율입니다. 연간 변동성 연간 변동율은 투자 목표의 변동 위험을 측정하는 데 사용됩니다.

  • 샤프 비율

전체 유닛 리스크에서 전략이 얻을 수 있는 초과 수익을 설명합니다.

  • 최대 수요

전략의 가장 큰 손실을 설명합니다. 최대 인출은 보통 더 작을수록 더 좋습니다.

  • 오메가 비율

또 다른 위험 보상 성능 지표입니다. 샤프 비율에 대한 가장 큰 장점은-구조에 의해-모든 통계적 순간을 고려하고, 샤프 비율은 첫 두 순간을 고려합니다.

  • 소르티노 비율

이 전략이 유닛의 하향 위험 하에 얻을 수 있는 초과 수익을 설명합니다.

  • 일일 위험 가치

위험 당일 가치-다른 매우 인기있는 위험 지표. 이 경우 95%의 경우 지위 (포트폴리오) 는 또 다른 날로 유지되며 손실은 1.8%를 초과하지 않습니다.

참고:https://towardsdatascience.com/the-easiest-way-to-evaluate-the-performance-of-trading-strategies-in-python-4959fd798bb3

  • 꼬리 비율

일일 수익의 분포를 위해 95번째와 5번째 쿼틸을 선택하고, 절대 값을 얻기 위해 나눕니다. 본질적인 의미는 얻은 수익이 손실보다 몇 배나 크다는 것입니다.

  • 안정성

이것은 안정성이라고 불립니다. 사실, 그것은 매우 간단합니다. 즉, 시간 증가는 누적 순 가치를 설명합니다. 즉, 회귀의 r 제곱입니다. 이것은 약간 추상적입니다. 간단히 설명해 보겠습니다.

참고:https://blog.csdn.net/qtlyx/article/details/88724236

작은 제안

FMZ가 리치 캐피탈 곡선의 평가 기능을 높이고, 역사적인 백테스트 결과를 저장 기능을 높여서 백테스트 결과를 더 편리하고 전문적으로 표시할 수 있으며, 더 나은 전략을 만드는 데 도움이 될 수 있기를 바랍니다.


더 많은