domingo, 27 de agosto de 2017

Explicação do modelo

Para os que estiverem interessados em uma explicação um pouco mais técnica, pode-se dizer que os dados utilizados são os números de gols feitos por cada time, indexados pela rodada em que o jogo ocorreu, por quem era o adversário, e por quem era o mandante da partida. Diz-se, então, que esses números de gols são quantidades aleatórias, explicadas pela qualidade ofensiva do time no ataque, pela qualidade defensiva do time na defesa e pela qualidade do mando de campo do mandante (apenas quando o mandante é o time no ataque).
A partir dos dados, e por meio de um modelo de regressão, é possível estimar essas forças específicas de cada time. No entanto, nosso interesse principal não é classificar os times de acordo com suas forças, mas, usá-las para prever resultados futuros. Isso é feito através de simulações via MCMC (Markov Chain Monte Carlo).
Essas simulações concedem amostras (geralmente de tamanho 3000) para as forças de cada time, e essas amostras são usadas para gerar previsões para as observações futuras, para o número de gols feitos por cada time nas rodadas ainda não disputadas. Tem-se, então, probabilidades aproximadas de vitória, empate e derrota dos times de uma partida, e essas probabilidades são acumuladas para gerar previsões para o resto do campeonato, o que nos confere probabilidades aproximadas de um time ser campeão, de se classificar para uma competição internacional, ou de ser rebaixado.
Para quem estiver interessado, há uma apresentação de slides com mais informações, além de alguns resultados, a usada por mim na JIC de 2016, disponível aqui.

Apresentação do modelo

Numa partida de futebol, vence quem fizer mais gols, o que significa que quem estiver interessado em prever o vencedor de uma partida deve se preocupar com o número de gols feitos por ambas as equipes. Paralelamente, prever resultados de partidas de futebol esbarra em vários problemas, com o principal deles sendo a enorme quantidade de fatores que afetam o que ocorre nos jogos.O número de gols feitos por um time numa partida pode, por exemplo, depender de: se estava jogando em casa ou não, contusões de jogadores importantes, sua qualidade, qualidade do adversário, etc.
Dessa forma, ao tentar explicá-los por meio de um modelo, escolhe-se que fatores considerar, e de que maneira. Não é surpreendente que haja, então, tantos modelos diferentes com o mesmo objetivo: prevê-los. Em nosso modelo, escolhemos definir que a quantidade de gols marcados por uma equipe num jogo depende de seu ataque, da defesa de seu adversário, de seu mando de campo (caso seja o mandante) e de particularidades de sua liga. Assim, trabalhamos com a ideia de que cada plantel tem suas forças inerentes, e que elas são diferentes entre si, ou seja, que jogar em casa afeta de modos diferentes os desempenhos de Flamengo e Grêmio, por exemplo.
Portanto, qualquer previsão que façamos depende de como estimamos as diferentes aptidões dentro de um campeonato, além dos efeitos que a própria liga tem sobre o futebol jogado nela. As estimativas são geradas a partir das seguintes informações: número de gols feitos por uma equipe, quem era seu adversário e quem era o mandante da partida.
Por meio dessas estimativas, fazemos previsões para cada um dos jogos ainda não realizados, através de simulações. A partir das previsões para múltiplos jogos pode-se, então, fazer previsões para o desempenho do time ao final da competição, e essas aparecerão como afirmações sobre a probabilidade de um time ser campeão, ser rebaixado, ou disputar uma competição internacional.

Objetivo do site

O objetivo desse site é divulgar os resultados obtidos pelo modelo de previsão de resultados de futebol trabalhado em meu projeto de Iniciação Científica com o professor Dani Gamerman. Desejamos, por meio dele, mostrar a todos os aficionados do esporte um dos muitos benefícios que a análise estatística pode trazer para a compreensão de qualquer objeto de estudo, inclusive o futebol.