Para os que estiverem interessados em uma explicação um pouco mais técnica, pode-se dizer que os dados utilizados são os números de gols feitos por cada time, indexados pela rodada em que o jogo ocorreu, por quem era o adversário, e por quem era o mandante da partida. Diz-se, então, que esses números de gols são quantidades aleatórias, explicadas pela qualidade ofensiva do time no ataque, pela qualidade defensiva do time na defesa e pela qualidade do mando de campo do mandante (apenas quando o mandante é o time no ataque).
A partir dos dados, e por meio de um modelo de regressão, é possível estimar essas forças específicas de cada time. No entanto, nosso interesse principal não é classificar os times de acordo com suas forças, mas, usá-las para prever resultados futuros. Isso é feito através de simulações via MCMC (Markov Chain Monte Carlo).
Essas simulações concedem amostras (geralmente de tamanho 3000) para as forças de cada time, e essas amostras são usadas para gerar previsões para as observações futuras, para o número de gols feitos por cada time nas rodadas ainda não disputadas. Tem-se, então, probabilidades aproximadas de vitória, empate e derrota dos times de uma partida, e essas probabilidades são acumuladas para gerar previsões para o resto do campeonato, o que nos confere probabilidades aproximadas de um time ser campeão, de se classificar para uma competição internacional, ou de ser rebaixado.
Para quem estiver interessado, há uma apresentação de slides com mais informações, além de alguns resultados, a usada por mim na JIC de 2016, disponível aqui.
Nenhum comentário:
Postar um comentário