理论泛滥的时代,我们无需再继续争论。数据的时代,一切以数据结果为准。历史数据的统计或许对我们有很多启发,为此合晶睿智订阅,开始一个新的文章系列DataSay,欢迎大家提出问题,根据问题的热度,Aris会择机用数据统计的方式展示给大家。
猜想:历史总是会重复,我是否可以用最近20个交易日的走势数据,到历史中寻找与其走势最接近的部分,并用该部分后5个交易走势,预测当前未来5个交易日的走势?
这个想法不错,但是如何判断两段走势的匹配程度呢?其实声波也是K线图,我们用语音识别的方法用于匹配程度比较…… 由此引入DWT距离概念:
DWT:动态时间弯曲距离
在日常的生活中我们最经常使用的距离毫无疑问应该是欧式距离,但是对于一些特殊情况,欧氏距离存在着其很明显的缺陷,比如说时间序列,举个比较简单的例子,序列A:1,1,1,10,2,3,序列B:1,1,1,2,10,3,如果用欧氏距离,也就是distance[i][j]=(b[j]-a[i])*(b[j]-a[i])来计算的话,总的距离和应该是128,应该说这个距离是非常大的,而实际上这个序列的图像是十分相似的,这种情况下就有人开始考虑寻找新的时间序列距离的计算方法,然后提出了DTW算法,这种方法在语音识别,机器学习方便有着很重要的作用。这个算法是基于动态规划(DP)的思想,解决了发音长短不一的模板匹配问题,简单来说,就是通过构建一个邻接矩阵,寻找最短路径和。
开始清除Matlab神器,开始编写程度。
1. 从Wind数据库中,提取2005年到现在的数据(沪深300指数、上证综数、深圳成指)。
2. 将2016年2月3日之前的20个交易日的数据,带入到历史中寻找与其最匹配的一个…… 一个太少了,我们选取最接近的五个距离。
3. Run…… Run,结果如下:
沪深300指数未来5日预测(Now is 2016/2/2)
上证综合指数未来5日预测(Now is 2016/2/2)
深证成份指数未来5日预测(Now is 2016/2/2)
读者会问,这次的程序与数据公开不,其实这个程序是Aris2013年写的。需要更新一下,还要考虑是否将这数据作为DataSay每日必更新的数据呢?如果有需要,写评论哦……
DataSay历史文章: