作者:码农的量化之路 ;文章来源:维恩的派论坛
最近参加了一个知乎收费讲座,将CTA策略的创新,尤其提到了策略开发的技术路线,包括机器学习在策略开放中使用的一些情况,收获很大,总结出来方便自己未来查阅,也为大家提供一些思路。另外,本文只是我的总结, 建议感兴趣的还是听知乎博主的课。
备注:CTA时量化策略的一个大类,主要是通过预测趋势来赚钱,跟其相对应的大类还有统计套利策略和高频策略。
知乎博主介绍:博主付超,是国内一家私募公司CTA策略部门的负责人,从事CTA策略开发6年。由于策略的私密性,无法讲解细节,只能提供方向。
传统CTA的特点
- β偏好性,主要利用趋势的肥尾特点,通过追随趋势获取利润。喜欢波动较大或者急涨急跌行情
- 多策略多周期
- 国内传统的CTA策略夏普一般在2以内,国外因为市场更成熟,一般在1.5以内
- 以长周期为主(作者认为长周期一般指的是平均持仓周期是几天以上的),原因时长周期趋势肥尾的特点才比较明显。通过平时亏小钱,赚大钱
我自己的思考:
包括我在内,业余的量化交易员常用的以技术指标为主的策略开发,应该就属于这种。但是如果将技术指标最为X,未来收益作为Y,放到机器学习的模型中进行训练,得到的一个新的指标或者说因子,则属于后面说的新型CTA策略。
新型CTA的特点
新型的CTA是传统CTA策略的包含关系,是对传统CTA策略的一个创新,比如利用高频策略的盘口预测和统计套利的多空对冲策略等。
- 除了传统CTA策略的β策略外,还包含了α策略。(β策略的本质时利用投资者回避风险的特点,亏欠的人更容易回避风险或者犯错。而α策略本质上是一种预测,主要是概率统计来发现交易机会。无论时β策略还是α策略,在市场波动率较大的情况下,一般绩效也越高,因为波动大,大家犯错的可能业变大。)
- 夏普一般在2以上,博主公司的策略基本都在3以上
- 短中长期的策略都可以做,尤其时短周期策略,因为预测周期越短,相对数据量就越大,统计学习的算法预测精度就越高(α策略)
我自己的思考:
新型CTA策略最大的特点是加入了机器学习进行预测,比如利用机器学习得到的有效信号或者说因子。即使使用现成的技术指标,也应该纳入到统计学习或者机器学习的框架来寻找映射函数
CTA的未来和创新
- 横向的资源整合。把不同的策略大类的特点结合起来,使用高频的逻辑处理CTA和统计套利的下单(作者指的是可以利用机器学习进行下单预测,减少滑点)。CTA可以参考统计套利的套利,做一些多空对冲。
- 纵向的资源整合。对一个资产管理公司来说,已经包括策略研发,还有募资和IT的支持。IT支持作者举了一个例子,就是资金量较大后,需要利用高频下单的逻辑减少滑点,需要有IT的支持
- 流水线作业。例如策略研发,可以封装成单独做信号(因子)、单独做策略组合的、单独做下单的几个部门,每个部门都可以做到各自的极致。4.数据为王。数据指的是2个方面,第一个是数据量越大越好,数据量越大,统计就越健壮。第二是预测周期越短越好,同样数据量的情况下,预测周期越短,样本数量就越大。
- 机器学习。机器学习在CTA中的应用是由浅入深的过程。一谈到机器学习,大家都马上会想到深度学习,但是作者建议大家先从简单到复杂,不要一上来就深度学习。
我自己的思考:
作者说的未来和创新,结合上下文,其实时他自己已经在做的。对我来说最有价值的是,明确了后续的技术发展方向。还是要走统计学习的方向。当然,机器学习只是工具,还是需要人能够发现潜在的规律,然后利用机器学习,得到一个可能的盈利因子。
机器学习在量化交易领域的4个特点
- 从线性模型到非线性模型(前一项相对于后一项更复杂,但是可能会有更好的预测效果,下同)线性模型相对比较简单,就是对一些因子进行多元线性回归等。)
- 从无监督学习到有监督学习(有监督模型相对于无监督模型而言,需要挑选样本进行训练,而挑选样本需要本身对市场比较了解,有很大的经验性。作者认为初学者最好从无监督学习开始。)
- 从分类的学习到回归的学习(分类实际上是最极端的回归,将回归分成2类或者3类,比如-1(预测正确)/1(预测错误)。为什么说先做分类再做回归,主要也是从易到难的一个过程。为什么要用回归,主要是回归做出来的策略效果更好)
- 从决策树模型到神经网络模型(偏深度学习)(作者没有细说。只是说神经网络模型的坑特别多)
我自己的思考:
到最后,量化交易实际就是拼技术和智力,有同样交易经验的,是否精通统计学习或机器学习,对策略的研发能力会由天壤之别。
------------------------------------------------------------------------------分割线--------------------------------------------------------------------
问答精选
问题1:量化策略开发的常识是啥
回答:交易任何时候都是一种预测,你在T时刻可以利用T时刻之前的所有数据来预测T+N期的收益率,而T+N期的收益可以看成Y,T时刻之前的所有量价数据都可以看成X,X可以采用各种量价的组合,世面上能够找到的技术指标,就是最简单的因子,可以作为X,然后通过统计学习/机器学习的思路找到一种X到Y的比较好的映射关系