Un piccolo post sulla matematica, la statistica e il calcio, i attesa della partita pomeridiana dell'Italia ai Mondiali 2010.
Gli Europei del 2008 hanno visto il trionfo della Spagna, che ha espresso il miglior calcio della competizione, a detta di molti critici e appassionati, e che ha avuto la strada spianata grazie alla vittoria ai rigori contro l'Italia. In molti tra i tifosi italiani, in ogni caso, hanno ritenuto, forse a torto forse a ragione, che l'Italia avrebbe sicuramente vinto la competizione sconfiggendo la Spagna, poi alla fine laureatasi campione. Eppure osservando il seguente grafico, non si direbbe proprio:
La nostra nazionale, anche se non di molto, è risultata sostanzialmente la peggiore delle 6 squadre considerate (tra queste un Portogallo estremamente altanelante, unica squadra ad avere le potenzialità per avvicinare le prestazioni spagnole, almeno in base a questo primo grafico).
Questo grafico abbastanza interessante, nella cui parte superiore sono riassunte le prestazioni dei singoli calciatori (almeno di quelli selezionati), è stato prodotto da Jordi Duch, Joshua Waitzman, Luís Amaral nell'articolo Quantifying the Performance of Individual Players in a Team Activity. Il gruppo di ricercatori, provenienti da ambiti disciplinari differenti, hanno elaborato i dati statistici ufficiali dell'Uefa, producendo questo e altri interessanti grafici.
Per realizzare la loro elaborazione e valutare l'influenza del singolo all'interno della squadra, sono state costruite delle reti sul flusso della palla accorso tra i giocatori della squadra. In questa rete, ogni nodo rappresenta un giocatore, mentre ogni linea o arco è rappresentato con uno spessore proporzionale con il numero di passaggi andati a buon fine tra i due nodi. Sono stati anche inseriti i dati riguardanti i tiri, sia quelli verso la porta, sia quelli da lunga distanza, rappresentati entrambi da due nodi distinti.
Questa sorta di grafico di flusso è stato costruito per ogni partita. In particolare viene presentato il grafico delle sfide della Spagna contro Italia, Russia e Germania, ovvero le partite ad eliminazione diretta:
Si nota come, sia con la Russia, sia con l'Italia, la mole di gioco dei campioni è stata importante e solo l'Italia è riuscita a tenere testa a questo predominio. Anche a livello di tiri l'Italia è più vicina alla Spagna di quanto non siano state le altre sfidanti. Per quel che riguarda la mole di gioco, solo la Germania è riuscita a limitare e superare i campioni, anche se, come evidente dal grafico, sfruttando al massimo la fase difensiva, e come sappiamo questo è servito a molto poco ai tedeschi.
Torniamo ora all'articolo: per modellizzare le squadre e quindi ottenere le migliori informazioni sulla squadra e sui singoli giocatori, i ricercatori sono partiti con il presupposto che l'obiettivo principale di ogni sfidante è segnare nella porta avversaria, quindi ottenere e mantenere il possesso palla e tirare ogni volta che l'avversario da un'opportunità. L'accuratezza di un giocatore è valutata per la fase dei passaggi attraverso il rapporto tra i passaggi andati a buon fine e il totale di passaggi tentati, mentre quella di tiro come il rapporto tra i tiri andati a segno e quelli totali.
Combinando il grafico di flusso dei passaggi e della precisione di tiro per ciascun giocatore, i ricercatori hanno dato ad ogni possibile percorso ottenibile sulla rete la probabilità che questo percorso finisca con un tiro. In questo modo si è potuto valutare anche la prestazione di ogni singolo giocatore, a partire dal numero di percorsi di questo genere cui ogni calciatore partecipa. E visto che sono scienziati e non critici dello sport, ecco che vengono anche considerate le prestazioni difensive, ovvero tutte i percorsi che si concludono con un recupero della palla.
Tutto questo concorre a definire la prestazione $\rho^A_i$ di ogni singolo giocatore $i$ della squadra $A$ per ogni partita, definita come il valore normalizzato del logaritmo del flusso di gioco del giocatore.
Giocando un po' con la matematica semplice che sta alla base delle reti e dei sistemi complessi, si possono estendere le prestazioni del singolo giocatore alla squadra, iniziando a valutare la prestazione di un gruppo $n$ di giocatori:
\[\left < \rho^A \right >_n \equiv \frac{1}{n} \sum_{i=1}^n \rho_i^A\]
dove le prestazioni nella somma sono ordinate in modo decrescente.
A questo punto è possibile valutare la differenza di prestazione tra due squadre, definita come
\[\delta_n \equiv \left | \left < \rho^A \right >_n - \left < \rho^B \right >_n \right |\]
che fornirà un indicatore per valutare la prestazione condizionata al risultato finale della partita (vittoria, sconfitta, pareggio). Come si può notare, nella definizione ci si restringe a un ristretto gruppo di calciatori, ma basta porre $n$ con il numero di giocatori della squadra per avere un indice di valutazione per la differenza di prestazione tra le due squadre esaminate.
I ricercatori, successivamente, valutano attraverso un intergrale della funzione di distribuzione delle differenze condizionate la differenza di prestazione complessiva tra le squadre esaminate. In questa parte del lavoro, però, non sarebbe stato male specificare qualche dettaglio matematico in più, certo è che alla luce dei risultati dell'Europeo, lo studio statistico sembra ben descrivere i fatti sportivi. Questo, dall'ottica dei ricercatori, non solo fornisce spunto per l'applicazione del metodo anche in altri ambiti (ad esempio i rapporti accademici tra gli autori della ricerca), ma anche suggerisce la maturità raggiunta da approcci di questo genere nello studio di sistemi complessi negli ambiti più disparati.
Per maggiori dettagli, leggere World Cup Science: Soccer's Greatest Player Is ..., segnalatomi da Emanuela Zerbinatti, che ringhrazio!
Stomachion
Network Bar
giovedì 24 giugno 2010
Iscriviti a:
Commenti sul post (Atom)
Nessun commento:
Posta un commento