A quantidade de dados que está disponível hoje tem a capacidade de alterar a forma como o mundo funciona. Empresas como Google estão inventando continuamente novas maneiras criativas para coletar e processar os dados que nos submetemos em toda a web.
Ao mesmo tempo, comerciantes quantitativos criativas estão constantemente à procura de novas maneiras de encontrar uma vantagem nos mercados de hoje. Era só uma questão de tempo até essas duas forças colidiram.
Damien Challet e Ahmed Bel Hadj Ayed publicou um artigo em julho de 2013 intitulou Prevendo os mercados financeiros com o Google Trends e palavras-chave não tão aleatórios. O objetivo do trabalho foi avaliar a credibilidade das afirmações de que a pesquisa de dados disponíveis a partir do Google Trends poderia ser usada para prever grandes movimentos do mercado.
No final do papel, Challet e Bel Hadj Ayed concluir que os grupos de palavras-chave, se eles foram relacionados para financiar ou não, não oferecem qualquer evidência razoável de que eles poderiam robustamente prever os movimentos do mercado. Contudo, há evidências de que as palavras-chave específicas aplicadas a activos específicos poderia produzir estratégias de negociação rentáveis.
Esta é uma abordagem incrivelmente emocionante e muito fora-the-box à negociação que eu encontrei para ser uma leitura fascinante. Fiquei particularmente impressionado com a quantidade de atenção que Challet e Bel Hadj Ayed pago a todos os diferentes vieses que estavam presentes em ambos os seus resultados de backtesting e do estudo anterior que eles estavam citando.
Aqui estão alguns dos vieses interessantes que eles abordados:
Ferramenta de Bias
Os autores que se refere o viés ferramenta como “o viés mais negligenciado.” Eles explicaram que ele descreve a situação em que a pessoa está usando hardware ou software que não estava disponível no momento dos dados que estão sendo analisados.
Este tipo de preconceito é citado como o motivo que muitas backtests olhar bem antes 2003, mas não conseguem apresentar os mesmos resultados após. Os autores explicam um pouco mais:
Encontrar previsibilidade em dados antigos com ferramentas modernas é realmente mais fácil do que deveria ser.
Dados Biases
Challet e Bel Hadj Ayed passou uma grande parte de seus preconceitos seção de quebrar todos os diferentes tipos de vieses de dados que estavam afetando o backtesting desta estratégia.
O viés de dados mais óbvia era o fato de que os dados do Google Trends só remonta a Agosto de 2008. Qualquer análise antes que o tempo é completamente especulativa.
Os autores também abordam o fato de que muitas vezes os dados são ajustados após o fato. Eles usam o exemplo dos números do PIB a serem libertados e, em seguida, ajustado posteriormente. O backtest só vai perceber o número final, por isso não irá representar o original e, em seguida, o ajustamento.
Há também casos de ajustes no formato de dados ao longo do tempo. Os autores explicam que o Google Trends ajustado o tipo de dados que eles usam em 2012. Portanto, os dados antes de 2012 é estruturado de forma diferente a partir dos dados produzidos depois 2012.
Challot e Bel Hadj Ayed também apontam o impacto que viés de sobrevivência tem no backtest.
Viés de palavras-chave
Os preconceitos de palavras-chave foram os preconceitos mais interessantes que o papel coberto. O artigo original que os autores foram citando escolheu palavras-chave que foram intencionalmente tendenciosa para os mercados financeiros.
Challot e Bel Hadj Ayed levou isso um passo adiante, criando três grupos não-tendenciosa de palavras-chave para comparar a palavra-chave financeiro com. Isso levou a resultados interessantes com base em palavras-chave aleatórias como “câncer ósseo” e “Patrulha da lua” em comparação com as palavras-chave selecionadas como specificaly “dívida.”
Outros Preconceitos
Os autores continuaram identificando uma série de outros vieses que estavam presentes, incluindo erros de codificação, palavras-chave futuras, snooping dados, e uma falta de taxas de transação.
Contudo, Apesar de todos esses preconceitos que estão afetando o backtesting, Challet e Bel Hadj Ayed ainda descobriu que uma estratégia rentável poderia ser construída sobre a idéia de usar os dados do Google Trends como um sinal de negociação.
Chris Vermeulen diz
This is a really great piece and the embedded links are very useful also. I use Google trend all the time for various things in my life and business and believe it has great value to those who understand the data.
Backtesting is no easy task if you want near accurate results, that is for sure.
Obrigado por compartilhar!
Andrew Selby diz
Obrigado, Chris! Glad you enjoyed it!
berry diz
Leider muss ich sagen, muss der Artikel überarbeitet werden, da sehr viele gravierende Satzbaufehler enthalten sind 🙂 aber im groben mehr oder weniger verständlich.
Shaun Overton diz
It’s far from perfect…