浅谈算法交易的演变

jopen 8年前

---前言---

经常会在社区中被问到算法交易到底是什么,我自己其实一开始也不知道如何去解释清楚,趁着放假做了一些调查总结,顺手写了这么一篇入门科普级别的文章,希望对大家理解有所帮助罢。

---前言---


算法交易的演变

所有人都在寻找投资中的圣杯(holy grail),但是用什么样的方法可以更准确地找到“圣杯”呢?我们也一起来看看算法交易的演变吧:

浅谈算法交易的演变

读图

算 法交易始于读各种市场交易数据图,不出意外不论欧美还是亚太地区市场都是始于这里 - 读图高手们从价格的历史图形中寻找某种规律。这些图形规律总是被冠以“艺术”的名称,像是K线图中的“阳线”、“阴线”、“十字星”、"morning star"、"head and shoulders"(可不是中国特色,欧美这些术语也是很多的)等。读图看起来更像是看手相,而我们总是会质疑 - similarities don't end with appearances。

浅谈算法交易的演变

读曲线图更像是尝试从股票的历史价格中寻求市场上的买、卖的平衡点。从这点来看,读图在也在寻找着预测价格的可能性。读图非常常见,以至于某些事件发生之后会引起市场参与者的反应,可能也是因为很多参与者都从股票价格图中看到了同样的“含义”。

在亚洲,有传闻技术分析是由[Homma Munehisa][3]在18世纪使用蜡烛图开始使用的,而Homma Munehisa本人其实是一位大米商人,而蜡烛图至今也是一个非常常用和出名的技术图表。

可以看到早期的技术分析都是分析图表,这是因为那个时候缺乏计算机对数据进行更深入的分析。



技术分析

伴 随着计算机技术的进步,技术分析也越来越复杂,读图也替换成了编程实现的算法。这些算法有着听上去更科学的名字,比如:移动平均(moving average)、成交量加权移动平均(volume weighted moving average)、bollinger bands、相对强弱指标(relative strength indicator)、pearson's correlation coefficient。的确,构建技术分析的算法看上去很像是现代的统计方法。不过,技术分析将算法应用在同样的概念中:从历史的数据中推导出未来行 为。除了难度更大外,技术分析可以从历史数据中测试他们的算法。虽然并不完美,但是相比读图这已经是一个不小的进步了。

浅谈算法交易的演变

相当多的人都在质疑使用历史数据来推断出未来行为的技术分析的**正确性**。不过我们更想指出的是,读图和技术分析都有一个局限:都想“孤立地”预测出**单个股票**的走势。这个局限既有好处也有坏处:

一方面来看,对于复杂的统计和机器学习来看,技术分析几乎没有空间改进了:因为你只有一条时间序列的数据线,而你还需要用它来既做信号又要来做你预测的目标。

另 一方面,由于技术分析的比较直观,非常易于上手和学习自动化交易。通常来说,从时间序列的数据到如何产生信号买、卖之间存在一条理解上的鸿沟,而用技术分 析来上手可以帮助你理解自动化交易,从而得到这块思想上的进步。因为技术分析产生的交易信号都比较好理解,也便于初步理解风险控制、评判收益和订单管理 (order management)。比如:价格高于30天的均线是很容易被理解和想象出来的。因此,你可以集中你的精力在金融和交易问题上。



统计套利

和技术分析类似,统计套利也非常依赖于算法、数据和统计,但是他们有最明显的区别:“统计套利”在寻找多个股票之间的关系。面临的挑战和困难主要在两方面:

* 如何具体化这些关系会非常复杂,因为这些关系可能会是高维度的。

* 数据处理和计算是海量的 - 以美股为例,对所有股票做简单的线性回归需要做三千二百万次单独的回归计算。假设是10天的窗口来看的话,需要做3亿2千万次单独的回归计算。

开始编写、回测和交易一个统计套利策略需要足够的微观交易、统计学和扎实的计算机编程背景。

并且当统计套利逐步成熟以后,发掘可行的统计套利策略需要做两方面的竞争:

1. 用更快的速度落单

2. 找到新的方法来通过市场数据发现相关性

1的方法是在追求高频交易的极致速度,但是除了提供一定可能的流动性以外,高频交易并没有给整个社会带来过多的好处。

而我们相信通过新的方法找到相关性可以找到更低相关性和更低风险的投资方法。

浅谈算法交易的演变

算法交易和它的未来

华尔街和金融机构的文化一直是诞生于信息的闭塞与不公开,保持秘密也是金融行业的常态。世界正在变化 - 如今很多信息都在趋于免费。但是新的闭塞是人才:那些有天分能从数据中挖掘出真相的人才,兴许这批数据科学家、quants、工程师可以挖掘出更有意思的算法。

当新的投资方法被发现之后,可能利用新的非市场数据的数据源,比如新闻事件、推ter、雪球等,也有可能是完全新的从未听过的某种思想。

[3]: https://en.wikipedia.org/wiki/Homma_Munehisa

来自: http://zhuanlan.zhihu.com/ricequant/20250478