vn.py量化社区
By Traders, For Traders.
Member
加入于:
帖子: 102
声望: 23

之前看到一篇文章,变点理论CUSUM在量化交易中;列了一堆数据和公式,说结果不错。链接如下:

https://max.book118.com/html/2017/0726/124391946.shtm

或者这个,就是整理版,有很详细的公式推导,不过代码写的不清不楚的,应该没写完。

https://wizardforcel.gitbooks.io/python-quant-uqer/134.html

花了些时间研究下:

原理描述:CUSUM控制图的设计思想是对信息加以累积,将过程的小偏移累加起来,达到放大的结果,从而提高检验小偏移的灵敏度。CUSUM作为一个统计量,其由来具有严格的数学推理,总的来说,是一个变点假设检验通过极大似然法推导得到的统计量。

具体推导不研究了,直接看具体引用
![enter image description here]
enter image description here

其实就是我之前说到那个那个对数收益率,形成一个对数收益率的近似正太分布。如上图,这里有一个上下允偏量k,这里设为k = 0.02, 先说上阈值, 那么时序队列里面,下一个时段的对数收益率大于0.02,yi则差值为正;如果差值累计yi的和Ci大于h,比如h为0.5。则触发向上趋势。

其实就是如果多次上阈值收益率发生,或者一次非常大的收益率情况发生,是的c值大于h 就会触发向上趋势判断。如果只是偶尔一次大于阈值,那么下一次小于k (0.02)时候,差值为负值,和值Ci就变小了,这里Max的作用就是保证C为正,不会因为多次低于k值为负值。下阈值也是同理。

代码如下,这里调用ta-lib库来计算均值和标准差,速度比起用numpy还快一些。用标准差做为 允偏量k;5倍标准差为h 阈值。

# encoding: UTF-8
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import talib
def detect_via_cusum_lg(ts, istart=30, threshold_times=5):
    """
    detect a time series using  cusum algorithm
    :param ts: the time series to be detected
    :param istart: the data from index 0 to index istart will be used as cold startup data to train
    :param threshold_times: the times for setting threshold
    :return:
    """
    S_h = 0
    S_l = 0
    S_list = np.zeros(istart)
    meanArray = talib.SMA(ts,timeperiod = istart)
    stdArray = talib.STDDEV(np.log(ts/meanArray),timeperiod = istart)
    for i in range(istart+1, len(ts)-1):
        tslog = np.log(ts[i] / meanArray[i - 1])
        S_h_ = max(0, S_h + tslog - stdArray[i-1])
        S_l_ = min(0, S_l + tslog + stdArray[i-1])
        if S_h_> threshold_times * stdArray[i-1]:
            S_list = np.append(S_list,1)
            S_h_ = 0
        elif abs(S_l_)> threshold_times *  stdArray[i-1]:
            S_list = np.append(S_list, -1)
            S_l_ = 0
        else:
            S_list = np.append(S_list, 0)
        S_h = S_h_
        S_l = S_l_
    return S_list
#数据导入
df5min =  pd.read_csv("bar5rb8888.csv")
dt0 = np.array(df5min["close"])
listup,listdown = [],[]
s_list = detect_via_cusum_lg(dt0,istart=30, threshold_times=5)
for i in range(0,len(s_list)):
    if s_list[i] == 1:
        listup.append(i)
    elif s_list[i] == -1 :
        listdown.append(i)
plt.subplot(2,1,1)
plt.plot(dt0, color='y', lw=2.)
plt.plot(dt0, '^', markersize=5, color='r', label='UP signal', markevery=listup)
plt.plot(dt0, 'v', markersize=5, color='g', label='DOWN signal', markevery=listdown)
plt.legend()
plt.subplot(2,1,2)
plt.title('s_list')
plt.plot(s_list,'r-')
plt.show()

用5分钟螺纹钢数据跑出来,部分如下,好像有搞头,因为一旦触发后没有清空队列,所以会有连续多个向上或者向下。代码在我Github里面可以找到.
enter image description here

Member
加入于:
帖子: 22
声望: 1

感谢大神分享

© 2015-2019 上海韦纳软件科技有限公司
备案服务号:沪ICP备18006526号-3