Z dvoch čísel predpovie celú sezónu: Ako vznikal náš superpočítač?
09.08.2025 07:44
Autor: Adam Gábor
Analytik prináša do československých futbalových vôd jedinečný koncept superpočítača, ktorý je schopný simulovať celé sezóny.
Portál Analytik bude svoje predpovede stavať na špeciálnom nástroji. Náš vlastný superpočítač, ktorého inšpiráciou bol populárny predikčný model spoločnosti OPTA, je hotový a pripravený k používaniu.
Čo je to superpočítač?
Aj keď znie názov veľkolepo, nemusíš si predstavovať žiadny dvojmetrový hardvér blikajúci v serverovni pod prúdom chladného vzduchu či robota, ktorý má za skrytý cieľ vyhladiť ľudstvo. Pod pojmom superpočítač sa skrýva inteligentný softvérový model, program poháňaný umelou inteligenciou, ktorý je navrhnutý iba na jediný účel - predpovedať výsledky nadchádzajúcich stretnutí. Náš superpočítač prijme ako vstup tímy alebo žreb súťaže a kolo za kolom súťaž simuluje - paralelne toľkokrát, koľko chceme.
Ilustračný obrázok neurónovej siete - matematického modelu, na ktorom je náš superpočítač postavený
Model položený na silných dátach
Základom každého inteligentného systému sú dáta, a inak tomu nie je ani pri našom modeli. Superpočítač sme nakŕmili viac než 100 000 historickými výsledkami. Išlo o zápasy z rokov 2000 až 2025 odohrané v TOP 7 európskych ligách (Anglicko, Španielsko, Francúzsko, Nemecko, Taliansko, Portugalsko, Holandsko) a pohárovej Európe.
Okrem výsledkov mal model pri tréningu k dispozícii aj údaje o sile jednotlivých tímov, k čomu sme využili metriku Elo skóre, ktorú možno poznáš zo šachu. Elo funguje jednoducho - ak zápas vyhráš, tvoje skóre sa zvýši, a ak zápas prehráš, klesne. A to priamo úmerne k tomu, aké skóre má tvoj súper. Za zdolanie Realu Madrid teda získaš väčšiu odmenu ako za porážku Prešova. Okrem toho pozná superpočítač formu oboch tímov - krátkodobú, dlhodobú, a aj momentum, teda dynamiku, ktorá ukazuje, či sa forma zlepšuje alebo zhoršuje. Práve tieto dva údaje - Elo a Forma, sú jediné dva údaje, ktoré ku každému tímu vstupujúcemu do simulácie vyžadujeme - preto ten clickbaitový názov s dvoma číslami.
Realita je ale trošku zložitejšia. Napríklad pri Premier League, lige s 380 zápasmi, potrebujeme pre každý zápas 12 údajov (názvy tímov a ich aktuálne body, Elo, krátkodobú formu, dlhodobú formu a momentum formy), čo predstavuje 4 560 údajov pre jednu simuláciu celej sezóny. V prípade, že takúto sezónu simulujeme až 10 000-krát, náš superpočítač musí vykonávať matematické operácie s viac než 45 miliónmi údajov.
Rozdelenie pravdepodobností v našom 105-tisícovom datasete - takmer polovica zápasov sa končí výhrou domácich
Tréning najpresnejšieho modelu
Naprogramovať superpočítaču mozog nie je jednoduchá záležitosť. Víťazný model sa vyberal z desiatok kandidátov, medzi ktorými sme usporiadali interný turnaj. Každý z kandidátov volil pri svojom učení jemne inú stratégiu, a naším hlavným kritériom nebola iba presnosť modelu pri určovaní finálneho výsledku. Je dôležité, aby sa náš model nebál predpovedať aj nepopulárne výsledky, akými sú napríklad remízy.
Vo všeobecnosti platí (a to si pokojne vyskúšaj aj naživo so svojimi kamošmi), že keď dáš niekomu tipnúť výsledok zápasu, málokedy sa rozhodne pre remízu, skôr sa prikloní k jednej či druhej strane. V obrázku vyššie ale vidíme, že sa deľbou bodov končí každý štvrtý zápas. Náš šampión teda musel maximalizovať svoju presnosť, ale zároveň dbať na to, aby dostatočne často tipoval remízu.
Superpočítač je poháňaný neurónovou sieťou so vstupnou vrstvou a troma ďalšími vrstvami - pričom posledná má tri neuróny. Každý predstavuje jednu možnosť výsledku - výhru domácich, remízu, alebo výhru hostí. Použitá matematická funkcia Softmax zabezpečí, že sa tieto tri hodnoty interpretujú ako pravdepodobnosť jednej náhodnej udalosti, teda ich súčet sa rovná 100 percentám. Ak ťa zaujíma technickejšia analýza a rozbor architektúry počítača, prečítaj si výskum, ktorý sme k modelu napísali - nájdeš ho na konci článku.
Porovnanie rôznych metód predikcie zápasu - náhodného tipu, hádania podľa formy, podľa Elo skóre, a použitia nášho víťazného predikčného modelu, ktorý určí výsledok zápasu (Domáci / Remíza / Hostia) vo viac než 50 % prípadov
Čo sa bude diať teraz?
Náš superpočítač rozhodne nedokáže veštiť a nedá sa naň úplne spoľahnúť, preto treba jeho výstupy brať kriticky a so štipkou nadhľadu. Futbal je vždy plný prekvapení a napríklad taký titul Leicesteru by nepredpovedal ani ten najdokonalejší model. Superpočítač by mal byť pomocníkom, pretože je na rozdiel od nás či od teba na 100 % objektívny, bez emócií a bez predsudkov. Jeho predikcie nájdete už čoskoro v našich článkoch - plánujeme sa pozrieť na zúbok všetkým z európskych TOP 5 líg a priniesť naše tipy na ich konečné tabuľky.
Celý výskum k Superpočítaču nájdeš TU (v angličtine).


