A quantidade de dados que está disponível hoje tem a capacidade de alterar a forma como o mundo funciona. Empresas como Google estão inventando continuamente novas maneiras criativas para coletar e processar os dados que nos submetemos em toda a web.
Ao mesmo tempo, comerciantes quantitativos criativas estão constantemente à procura de novas maneiras de encontrar uma vantagem nos mercados de hoje. Era só uma questão de tempo até essas duas forças colidiram.
Damien Challet e Ahmed Bel Hadj Ayed publicou um artigo em julho de 2013 intitulou Prevendo os mercados financeiros com o Google Trends e palavras-chave não tão aleatórios. O objetivo do trabalho foi avaliar a credibilidade das afirmações de que a pesquisa de dados disponíveis a partir do Google Trends poderia ser usada para prever grandes movimentos do mercado.
No final do papel, Challet e Bel Hadj Ayed concluir que os grupos de palavras-chave, se eles foram relacionados para financiar ou não, não oferecem qualquer evidência razoável de que eles poderiam robustamente prever os movimentos do mercado. Contudo, há evidências de que as palavras-chave específicas aplicadas a activos específicos poderia produzir estratégias de negociação rentáveis.
Esta é uma abordagem incrivelmente emocionante e muito fora-the-box à negociação que eu encontrei para ser uma leitura fascinante. Fiquei particularmente impressionado com a quantidade de atenção que Challet e Bel Hadj Ayed pago a todos os diferentes vieses que estavam presentes em ambos os seus resultados de backtesting e do estudo anterior que eles estavam citando.
Aqui estão alguns dos vieses interessantes que eles abordados:
Ferramenta de Bias
Os autores que se refere o viés ferramenta como “o viés mais negligenciado.” Eles explicaram que ele descreve a situação em que a pessoa está usando hardware ou software que não estava disponível no momento dos dados que estão sendo analisados.
Este tipo de preconceito é citado como o motivo que muitas backtests olhar bem antes 2003, mas não conseguem apresentar os mesmos resultados após. Os autores explicam um pouco mais:
Encontrar previsibilidade em dados antigos com ferramentas modernas é realmente mais fácil do que deveria ser.
Dados Biases
Challet e Bel Hadj Ayed passou uma grande parte de seus preconceitos seção de quebrar todos os diferentes tipos de vieses de dados que estavam afetando o backtesting desta estratégia.
O viés de dados mais óbvia era o fato de que os dados do Google Trends só remonta a Agosto de 2008. Qualquer análise antes que o tempo é completamente especulativa.
Os autores também abordam o fato de que muitas vezes os dados são ajustados após o fato. Eles usam o exemplo dos números do PIB a serem libertados e, em seguida, ajustado posteriormente. O backtest só vai perceber o número final, por isso não irá representar o original e, em seguida, o ajustamento.
Há também casos de ajustes no formato de dados ao longo do tempo. Os autores explicam que o Google Trends ajustado o tipo de dados que eles usam em 2012. Portanto, os dados antes de 2012 é estruturado de forma diferente a partir dos dados produzidos depois 2012.
Challot e Bel Hadj Ayed também apontam o impacto que viés de sobrevivência tem no backtest.
Viés de palavras-chave
Os preconceitos de palavras-chave foram os preconceitos mais interessantes que o papel coberto. O artigo original que os autores foram citando escolheu palavras-chave que foram intencionalmente tendenciosa para os mercados financeiros.
Challot e Bel Hadj Ayed levou isso um passo adiante, criando três grupos não-tendenciosa de palavras-chave para comparar a palavra-chave financeiro com. Isso levou a resultados interessantes com base em palavras-chave aleatórias como “câncer ósseo” e “Patrulha da lua” em comparação com as palavras-chave selecionadas como specificaly “dívida.”
Outros Preconceitos
Os autores continuaram identificando uma série de outros vieses que estavam presentes, incluindo erros de codificação, palavras-chave futuras, snooping dados, e uma falta de taxas de transação.
Contudo, Apesar de todos esses preconceitos que estão afetando o backtesting, Challet e Bel Hadj Ayed ainda descobriu que uma estratégia rentável poderia ser construída sobre a idéia de usar os dados do Google Trends como um sinal de negociação.