Logo FS.sk

Z dvoch čísel predpovie celú sezónu: Ako vznikal náš superpočítač?

09.08.2025 07:44

Z dvoch čísel predpovie celú sezónu: Ako vznikal náš superpočítač?

Autor: Adam Gábor

Reklamný banner
Reklama

Analytik prináša do československých futbalových vôd jedinečný koncept superpočítača, ktorý je schopný simulovať celé sezóny.

Portál Analytik bude svoje predpovede stavať na špeciálnom nástroji. Náš vlastný superpočítač, ktorého inšpiráciou bol populárny predikčný model spoločnosti OPTA, je hotový a pripravený k používaniu.


Čo je to superpočítač?

Aj keď znie názov veľkolepo, nemusíš si predstavovať žiadny dvojmetrový hardvér blikajúci v serverovni pod prúdom chladného vzduchu či robota, ktorý má za skrytý cieľ vyhladiť ľudstvo. Pod pojmom superpočítač sa skrýva inteligentný softvérový model, program poháňaný umelou inteligenciou, ktorý je navrhnutý iba na jediný účel - predpovedať výsledky nadchádzajúcich stretnutí. Náš superpočítač prijme ako vstup tímy alebo žreb súťaže a kolo za kolom súťaž simuluje - paralelne toľkokrát, koľko chceme.


Z dvoch čísel predpovie celú sezónu: Ako vznikal náš superpočítač?

Ilustračný obrázok neurónovej siete - matematického modelu, na ktorom je náš superpočítač postavený


Model položený na silných dátach

Základom každého inteligentného systému sú dáta, a inak tomu nie je ani pri našom modeli. Superpočítač sme nakŕmili viac než 100 000 historickými výsledkami. Išlo o zápasy z rokov 2000 až 2025 odohrané v TOP 7 európskych ligách (Anglicko, Španielsko, Francúzsko, Nemecko, Taliansko, Portugalsko, Holandsko) a pohárovej Európe.


Okrem výsledkov mal model pri tréningu k dispozícii aj údaje o sile jednotlivých tímov, k čomu sme využili metriku Elo skóre, ktorú možno poznáš zo šachu. Elo funguje jednoducho - ak zápas vyhráš, tvoje skóre sa zvýši, a ak zápas prehráš, klesne. A to priamo úmerne k tomu, aké skóre má tvoj súper. Za zdolanie Realu Madrid teda získaš väčšiu odmenu ako za porážku Prešova. Okrem toho pozná superpočítač formu oboch tímov - krátkodobú, dlhodobú, a aj momentum, teda dynamiku, ktorá ukazuje, či sa forma zlepšuje alebo zhoršuje. Práve tieto dva údaje - Elo a Forma, sú jediné dva údaje, ktoré ku každému tímu vstupujúcemu do simulácie vyžadujeme - preto ten clickbaitový názov s dvoma číslami.


Realita je ale trošku zložitejšia. Napríklad pri Premier League, lige s 380 zápasmi, potrebujeme pre každý zápas 12 údajov (názvy tímov a ich aktuálne body, Elo, krátkodobú formu, dlhodobú formu a momentum formy), čo predstavuje 4 560 údajov pre jednu simuláciu celej sezóny. V prípade, že takúto sezónu simulujeme až 10 000-krát, náš superpočítač musí vykonávať matematické operácie s viac než 45 miliónmi údajov.


Z dvoch čísel predpovie celú sezónu: Ako vznikal náš superpočítač?

Rozdelenie pravdepodobností v našom 105-tisícovom datasete - takmer polovica zápasov sa končí výhrou domácich


Tréning najpresnejšieho modelu

Naprogramovať superpočítaču mozog nie je jednoduchá záležitosť. Víťazný model sa vyberal z desiatok kandidátov, medzi ktorými sme usporiadali interný turnaj. Každý z kandidátov volil pri svojom učení jemne inú stratégiu, a naším hlavným kritériom nebola iba presnosť modelu pri určovaní finálneho výsledku. Je dôležité, aby sa náš model nebál predpovedať aj nepopulárne výsledky, akými sú napríklad remízy.


Vo všeobecnosti platí (a to si pokojne vyskúšaj aj naživo so svojimi kamošmi), že keď dáš niekomu tipnúť výsledok zápasu, málokedy sa rozhodne pre remízu, skôr sa prikloní k jednej či druhej strane. V obrázku vyššie ale vidíme, že sa deľbou bodov končí každý štvrtý zápas. Náš šampión teda musel maximalizovať svoju presnosť, ale zároveň dbať na to, aby dostatočne často tipoval remízu.


Superpočítač je poháňaný neurónovou sieťou so vstupnou vrstvou a troma ďalšími vrstvami - pričom posledná má tri neuróny. Každý predstavuje jednu možnosť výsledku - výhru domácich, remízu, alebo výhru hostí. Použitá matematická funkcia Softmax zabezpečí, že sa tieto tri hodnoty interpretujú ako pravdepodobnosť jednej náhodnej udalosti, teda ich súčet sa rovná 100 percentám. Ak ťa zaujíma technickejšia analýza a rozbor architektúry počítača, prečítaj si výskum, ktorý sme k modelu napísali - nájdeš ho na konci článku.


Z dvoch čísel predpovie celú sezónu: Ako vznikal náš superpočítač?

Porovnanie rôznych metód predikcie zápasu - náhodného tipu, hádania podľa formy, podľa Elo skóre, a použitia nášho víťazného predikčného modelu, ktorý určí výsledok zápasu (Domáci / Remíza / Hostia) vo viac než 50 % prípadov


Čo sa bude diať teraz?

Náš superpočítač rozhodne nedokáže veštiť a nedá sa naň úplne spoľahnúť, preto treba jeho výstupy brať kriticky a so štipkou nadhľadu. Futbal je vždy plný prekvapení a napríklad taký titul Leicesteru by nepredpovedal ani ten najdokonalejší model. Superpočítač by mal byť pomocníkom, pretože je na rozdiel od nás či od teba na 100 % objektívny, bez emócií a bez predsudkov. Jeho predikcie nájdete už čoskoro v našich článkoch - plánujeme sa pozrieť na zúbok všetkým z európskych TOP 5 líg a priniesť naše tipy na ich konečné tabuľky.


Celý výskum k Superpočítaču nájdeš TU (v angličtine).

Reklamný banner
Reklama

Diskusia (0)

Pre pridanie komentára sa prosím prihláste.