数据今天可用的金额有可能改变世界如何运作的能力. 公司像谷歌正在不断发明创新的方法来收集和处理,我们整个网络提交数据.
同时, creative quantitative traders are constantly looking for new ways to find an edge in today’s markets. 这只是时间的问题这两种力量相撞前.
达米安沙莱和Ahmed贝勒·哈杰·AYED发表了一篇论文在七月 2013 题目 预测金融市场与谷歌趋势并没有那么随意关键词. 本文的目的是评估该搜索从谷歌趋势的数据索赔的可信度,可以用来预测主要的市场举措.
在文章的最后, 沙莱和贝尔·哈吉·AYED断定关键字组, 他们是否与资助或不, 没有提供任何合理的证据,他们可以稳健预测市场走势. 然而, 有证据表明,适用于特定资产特定关键字可以产生盈利的交易策略.
这是一个令人难以置信的激动人心,非常外的现成的方法来交易,我认为是一个迷人的读. 我印象特别深刻与关注的沙莱和贝勒·哈杰·AYED支付给所有不同偏见的人存在于他们的回溯测试结果和以前的研究,他们援引量.
下面是一些他们解决有趣的偏见:
刀具偏置
作者提到的工具偏见 “最容易被忽视的偏差。” 他们解释说,它描述了一个使用计算机的硬件或软件,这是不可用的数据的时间被分析的情况.
这种类型的偏见被引为理由,很多backtests以前好看 2003, 但失败后,以产生相同的结果. 作者进一步解释一下:
在旧的数据与现代工具查找预见性确实容易比它应该是.
数据偏差
沙莱和贝尔·哈吉·AYED度过了他们的偏见很大一部分部分打破各种不同类型的 数据偏差 这是影响这一战略的回溯测试.
最明显的数据偏差的事实是,谷歌趋势的数据只能追溯到八月 2008. 在此之前任何分析完全是投机.
作者还涉及一个事实,即在事后多次数据被调整. 他们用GDP数字的例子被释放,然后再调整. 后台测试将只能看到最后的数字, so it won’t account for the original and then the adjustment.
也有调整案件中的数据的一段时间内的格式. 作者解释说,谷歌趋势调整,他们在使用的数据类型 2012. 因此, 从之前的数据 2012 从后产生的数据结构不同 2012.
Challot和贝尔·哈吉·AYED还指出,所产生的影响 生存偏差 对回测.
关键字偏置
关键字偏见是最有趣的偏见是,纸包. 该作者引用了原文件选择了是故意偏袒金融市场的关键词.
Challot和贝尔·哈吉·AYED了这一步创建三个非偏置关键字组比较金融关键字. 这导致一些有趣的结果基于随机关键字,比如 “骨癌” 和 “月球巡逻” 相比于像specificaly选择关键字 “债务。”
其他偏见
继续通过识别其他一些偏见认为出席的作者, 包括编码错误, 未来的关键词, 数据窥探, 和缺乏交易手续费.
然而, 尽管所有这些偏见所影响的回溯测试, 沙莱和贝尔·哈吉·AYED还发现一个有利可图的策略可以建立在使用谷歌趋势的数据作为交易信号的想法.