Šachy a pravděpodobnost
Je tomu asi čtvrt roku nazpět, co jsem byl ve svém školním kabinetě obdařen návštěvou pana Popa. Možná jej spousta z Vás zná. Sám se nazývá poutníkem ve světě abstraktních prostorů a miluje diskuse na téma matematika a život. Čas od času mne vyhledá ve škole a když zrovna neučím pokouší se mne seznamovat s různými novými objevy svého bádání. Většinou se však každá diskuse stočí k některé ze strategických her a končí hledáním optimální strategie. Nejinak tomu bylo i onoho listopadového večera.
Na programu dne však nebyly piškvorky, ren-ju, solber či programování go, jako při předchozích seancích ale ELO. Pan Pop se živě zajímal o jeho výpočet a tak jsme dlouze a vášnivě diskutovali o tom, co je to vlastně za číslo a jakou má vypovídací hodnotu. To vše až do okamžiku než mi konečně objasnil účel své dnešní návštěvy. Nechtěl ani tak znát jak se ELO počítá, to samozřejmě dávno věděl, ale mnohem víc jej zajímalo jestli lze podobné rovnice aplikovat na soutěže družstev a pokud ano, co se stane, nastoupí-li proti sobě dva vyrovnané šachové týmy, z nichž jeden seřadí své hráče podle ELA a druhý posadí nejslabšího hráče na první šachovnici a pořadí na ostatních zachová. V tu chvíli jsem se téměř na několik minut odmlčel a v hlavě se mi začaly hromadit desítky rovnic. Je s podivem, jak mě tenhle člověk vždycky dokáže vtáhnout do svého světa, kterým 99 % ostatní populace naprosto opovrhuje.
Spustil jsem tedy Matlab, vytáhl stoh napůl nepopsaných papírů (většinou na podobné výpočty používám staré fyzikální referáty studentů) a pustil se do počítání. Občas jsme nakreslili v Matlabu nějaký ten graf abychom viděli, co nám to vlastně vychází a při každém výsledku, který odpovídal Popovu předpokladu, se na jeho neoholené tváři rozzářil jasný úsměv. Když jsme však po dvou hodinách museli diskusi přerušit, slíbil jsem mu, že pár rovnic ještě dopočítám a své výsledky mu při jeho nejbližší návštěvě předám. Od té doby však už uplynuly dva měsíce a pan Pop se stále neobjevil. A tak jsem se rozhodl využít trocha volna ve zkouškovém období a napsat těchto pár řádek. Třeba se někde ve vzdálených končinách, které momentálně obývá, dostane k internetu a pokud ne, možná se najde někdo jiný, komu následujících pár rovnic udělá stejnou radost jako mě.
Vezměme to tedy po pořádku. Myšlenka, která stála na začátku všeho toho počítání, byla primitivně jednoduchá. Mějme dva zcela vyrovnané osmičlenné týmy. Označme si je pro jednoduchost A a B a nechť ELA hráčů A-týmu tvoří aritmetickou posloupnost s diferencí d. To znamená, že hráč na první šachovnici má ELO: E1, hráč na druhé E2 = E1-d, na třetí E3 = E1-2d atd. až konečně hráč na poslední, tedy osmé šachovnici má ELO E8= E1-7d. Pokud zvolíme například E1 = 2200 a d = 50, obdržíme na jednotlivých deskách posloupnost EL 2200, 2150, 2100, …, 1850. Hráči B-týmu jsou stejně dobří jako hráči týmu A a je zřejmé, že kdyby obě družstva proti sobě nastoupila tak, že by obsadila všech osm šachovnic v pořadí, jaké odpovídá ELO koeficientům jednotlivých šachistů, byla by nejpravděpodobnějším výsledkem zápasu remíza a pravděpodobnosti vítězství každého z obou týmů by byly naprosto vyrovnané. K důkazu takového tvrzení není samozřejmě zapotřebí žádné komplikované matematiky a snadno jej pochopí i ten, kdo s matematikou skoncoval v osmé třídě základní školy. Situace však začne být zajímavá v okamžiku, kdy se družstvo B rozhodne před zápasem přesadit svého nejslabšího hráče z poslední desky na první šachovnici. V tom okamžiku už spolu nehrají dvojice naprosto vyrovnaných hráčů, ale právě naopak. Družstvo A má díky této rošádě na první šachovnici převahu v ELO hodnocení rovnou D E1 = E1 - E8 = 7d zatímco na všech ostatních šachovnicích je slabší o D E2 = E1 - E2 = d. Budeme-li konkrétní a použijeme-li hodnoty z předchozího příkladu, pak jednotlivé dvojice, které se spolu utkají, mají ELA: 2200 – 1850, 2150 – 2200, 2100 – 2150, …, 1850 – 1900. Otázka zní: Bude tento přesun jednoho hráče mít vliv na celkový výsledek zápasu? A pokud ano, jak ovlivní pravděpodobnost výhry prvního či druhého družstva?
Abychom mohli odpovědět nyní, budeme se muset nejprve seznámit s tím, co to vlastně ono ELO je a jakou má vypovídací hodnotu o výkonech každého hráče. K detailnímu pochopení jeho významu je třeba sáhnout k prostředkům statistické matematiky. Vezměme to tedy od začátku.
Celá šachisty tolik používaná teorie maďarského profesora matematiky Arpáda Ela je postavena na normálním (Gaussově) rozdělení, jemuž odpovídá hustota pravděpodobnosti popsaná funkcí
, (1)
kde veličina s představuje směrodatnou odchylku a výraz stojící před exponenciální funkcí je tzv. normovací konstanta, zajišťující, že integrál od mínus do plus nekonečna je roven jedné. Pravděpodobnost výskytu nějakého jevu je pak dána integrálem této funkce v mezích, které ohraničují studovanou událost. Elo tedy vyšel při sestavování systému hodnotícího šachisty právě z takto definované hustoty pravděpodobnosti a stanovil pravděpodobnost vítězství hráče nad svým soupeřem jako funkci rozdílu jejich ELO koeficientů, která má tvar:
. (2)
Právě popsaná rovnice se běžně nazývá distribuční funkce a veličina D představuje zmiňovaný rozdíl ELO bodů, takže použijeme-li dosavadní symboliku, platí D = D E a již popisovaná s je směrodatná odchylka, pro kterou profesor Elo stanovil hodnotu 200. Každý, kdo je trochu zběhlý v matematice, však ví, že výpočet integrálu z předchozí rovnice je v obecných mezích analyticky neřešitelný. Lze spočítat pouze v mezích od mínus do plus nekonečna, ale i v tomto případě nejjednodušší cesta k úspěchu vede přes umocnění na druhou, dvojí substituci a převod do polárních souřadnic. Proto bývá uvedená funkce nahrazována její přibližnou aproximací ve tvaru:
(3)
V praxi to tedy vypadá například takto: Hráč A má ELO 1800 a hráč B o 150 víc, tedy 1950. Pokud se spolu utkají, je pravděpodobnost, že vyhraje silnější hráč dána rovnicí (2), případně rovnicí (3). Pokud za D dosadíme hodnotu 150 obdržíme podle rovnice (2), že p(D) = 77,3 %. Dosadíme-li tutéž hodnotu do rovnice (3) dostaneme přibližný výsledek 70,3 %. Jinými slovy hráč B vyhraje s pravděpodobností 77 % a naopak riziko jeho porážky je 23 %. Jak vypadá průběh distribuční funkce popsané rovnicí (2) případně (3) je vidět na obrázku 2. Je jasné, že funkce musí být symetrická kolem hodnoty 0, protože utkají-li se spolu dva stejně silní hráči, bude mít každý z nich stejnou šanci na vítězství. Naopak poroste-li D nade všechny meze, musí se pravděpodobnost vítězství silnějšího hráče blížit jedničce. Srovnáním původní distribuční funkce popsané rovnicí (2) a její přibližné aproximace snadno zjistíme, že aproximační křivka nekopíruje zcela ideálně původní funkci a proto budou všechny následující výpočty provedeny podle rovnice (2).
Obr. 1: Hustota pravděpodobnosti defino-vaná rovnicí (1) se směrodatnou odchyl-kou s = 200. |
Obr. 2: Distribuční funkce (modrá) a její přibližná aproximace (zelená). |
Nyní, když máme k dispozici alespoň jednoduchý matematický aparát, můžeme se vrátit zpět k našemu problému. Zkusme pro začátek spočítat nejpravděpodobnější počet bodů, které družstvo B v zápase získá. Je zřejmé, že na první šachovnici je šance na úspěch nevalná, zato zbývajících sedm dává reálnou šanci na celkové vítězství v zápase. Vzhledem k tomu, že ELA všech hráčů jsou ekvidistatně seřazena je družstvo B na 2. až 8. šachovnici o 50 ELO bodů silnější, zatímco na první desce zaostává o 350 bodů. Nejpravděpodobnější výsledek je za normálních okolností určen součinem pravděpodobnosti a počtu jevů, platí tedy
, (4)
což v našem případě znamená, že družstvo B by za předpokladu spojitého spektra možných výsledků, získalo v zápase s největší pravděpodobností
bodů.
Integrál v první závorce má převrácené meze, proto bude jeho hodnota záporná. Z výsledku je vidět, že nejpravděpodobnější počet bodů získaných v zápase je vyšší než čtyři, což na první pohled znamená, že družstvo B si oproti případu, kdy hráči nastoupili seřazeni beze změn rozhodně polepšilo. Celá úvaha má však dva háčky. Za prvé spektrum možných výsledků není spojité ale diskrétní, takže 4,23 bodu žádné družstvo v žádném zápase rozhodně nikdy nezískáJ a za druhé to, že nejpravdě-podobnější výsledek je vyšší než 4, ještě neznamená, že pravděpodobnost celkového vítězství se tím oproti původnímu stavu nějak zvýšila. To budeme muset teprve ověřit dalším výpočtem. Než se však do něj pustíme, podívejme se na obrázek 3. Znázorňuje závislost nejpravděpodobnějšího zisku bodů v závislosti na D E tedy rozdílu ELO bodů hráčů na sousedních šachovnicích. Z něj vidět, že družstvu B se přehození jednoho hráče z poslední na první šachovnici vždy vyplatí a to tím víc, čím větší je rozdíl ve výkonnosti dvou po sobě jdoucích hráčů. Jen tak pro zajímavost, aby si někdo nemyslel, že popsaný příklad je na hony vzdálen reálné situaci, průměrný rozdíl ELO bodů mezi dvěma šachovnicemi je v letošní 1. divizi 46 bodů, tedy téměř tolik, kolik máme v našem příkladu.
Pokračujme však dál. To co nás opravdu zajímá není nejpravděpodobnější počet bodů získaných v zápase, ale pravděpodobnost s jakou družstvo B v zápase zvítězí. Abychom však mohli pokračovat, bude zapotřebí modifikovat původní Elovu distribuční funkci tak, aby v sobě zahrnovala i pravděpodobnost remízy. Původní definice se totiž tváří, jako by remíza nebyla vůbec možná, zatímco reálná situace je úplně jiná. Podíváme-li především do velmistrovské praxe zjistíme, že při souboji dvou vyrovnaných šachistů je naopak remíza tím nejpravděpodobnějším výsledkem. Budeme tedy po nové funkci chtít aby si zachovala vlastnosti té původní, ale navíc aby umožňovala i remízový výsledek partie. Asi nejlepší způsob jak původní funkci upravit, bude spočívat v pomyslném rozložení partie do dvou minizápasů. Hráč partii vyhraje, pokud zvítězí v obou minizápasech, prohraje, pokud prohraje v obou minizápasech a remizuje, pokud jeden zápas prohraje a druhý vyhraje. Pro příslušné pravděpodobnosti tedy platí:
(5)
(6)
(7)
Veličiny pv, pr a pp představují postupně pravděpodobnost výhry, remízy a prohry, veličina p(D)
je distribuční funkce popsaná rovnicí (2). Jak vypadá průběh
modifikované distribuční funkce je vidět na dalším obrázku. Není až tak
úplně důležité, jak přesně vystihuje zelená křivka reálnou situaci
(stejně dobří velmistři spolu remizují skoro vždy, zatímco u
začátečníků je remíza výjimkou), důležité je, že zachovává přesně ty
vlastnosti, které pro další výpočet budeme potřebovat. Tj. limita pro plus i mínus nekonečno je nula a funkce je symetrická kolem střední hodnoty. Navíc pro každé D platí, že pv + pr + pp = 1.
Abychom mohli nyní vypočítat s jakou pravděpodobností družstvo B porazí družstvo A, bude zapotřebí spočítat pravděpodobnosti jednotlivých výsledků. To však nebude vůbec jednoduchý úkol, neboť závěrečné skóre zápasu může nabýt 17 různých hodnot v rozmezí od 8:0 až do 0:8. Přitom například stav 4:4 může být uskutečněn až 1107 různými způsoby! Naštěstí nás v době rozpuku výpočetní techniky nemusí taková situace trápit a veškeré výpočty tak za nás uskuteční stroj. My se spokojíme pouze s obecným odhadem stavu a konstatováním, že pravděpodobnost celkového vítězství je dána vztahem
, (8)
kde pi představuje pravděpodobnost, že družstvo dosáhne právě i bodů. Přitom časově nejnáročnějším úkolem je právě výpočet pi. Ta je totiž určena součtem pravděpodobností všech stavů, které odpovídají danému bodovému zisku. Počet takových stavů je však dán poměrně komplikovanou závislostí na i. Pro i = 0 je sice výraz ještě jednoduchý, neboť družstvo musí prohrát na všech osmi šachovnicích, aby získalo 0 bodů, avšak například již pro i = 1,5 je počet všech možností jak takového součtu dosáhnout dán součtem všech tříprvkových kombinací z osmi (tři remízy) a dvouprvkových variací bez opakování (jedna remíza, jedna výhra). V celkovém součtu to pak dává 112 možností. Svěříme-li však všechny tyto komplikace počítači obdržíme následující rozdělení odpovídajících pravděpodobností:
Obr. 5: Rozdělení pravděpodobnosti mož-ných bodových zisků při zachování pořadí na jednotlivých šachovnicích. |
Obr. 6: Rozdělení pravděpodobnosti mož-ných bodových zisků při přehození jedné šachovnice. |
Obr. 7: Rozdělení pravděpodobnosti mož-ných bodových zisků při přehození dvou šachovnic. |
Obr. 8: Rozdělení pravděpodobnosti mož-ných bodových zisků při přehození tří šachovnic. |
První obrázek reprezentuje situaci, kdy obě družstva proti sobě nastoupí v nezměněném pořadí, tedy nejsilnější hráč na první šachovnici, slabší na druhé atd. až nejslabší hráč na poslední desce. Rozdělovací funkce je v takovém případě naprosto symetrická a nejpravděpodobnější výsledek zápasu je remíza 4:4. Sečteme-li pravděpodobnosti jednotlivých případů, zjistíme, že družstvo B zvítězí s pravděpodobností 40,2 %, remizuje s pravděpodobností 19,6 % a prohraje s pravděpodobností opět 40,2 %. Tedy nic, co bychom neočekávali.
Situace na druhém obrázku již znázorňuje problém, o kterém celou dobu diskutujeme, tedy stav, kdy družstvo B, přemístí svého nejslabšího hráče na první šachovnici, zatímco družstvo A nechá vše při starém. Výsledek tohoto jednoduchého taktického přesunu je víc než zajímavý. Nejpravděpodobnějším výsledkem zápasu je nyní vítězství družstva B v poměru 4,5:3,5. Přesun jednoho hráče také ovlivní celkovou pravděpodobnost vítězství tohoto týmu. Jeho šance na výhru je nyní 49,8 %, tedy téměř o 10 % víc než v předchozím případě.
Ještě lépe se pak jeví přesunutí ne jednoho, ale hned dvou nejslabších hráčů na první dvě šachovnice. V takovém případě se pravděpodobnost výhry zvýší až na 52,7 % (v případě, ze nejslabší hráč okupuje druhou desku a druhý nejslabší sedí na první šachovnici) a dokonce 53,3 % pokud se nejslabší hráč nechá posadit na první šachovnici a druhý nejslabší sedí na druhé desce. Kompletní tabulku nejzajímavějších permutací máte zde:
Tab. 1:
bez přehození |
8® 1 |
8® 2, 7® 1 |
8® 1, 7® 2 |
8® 3, 7® 2, 6® 1 |
|
pv |
40,2 % |
49,8 % |
52,7 % |
53,3 % |
47,6 % |
pr |
19,6 % |
20,3 % |
21,6 % |
21,4 % |
24,9 % |
pp |
40,2 % |
29,9 % |
25,7 % |
25,3 % |
27,5 % |
Tato tabulka nám zároveň dává definitivní odpověď na otázku položenou na začátku celého článku. Ovlivní přemístění nejslabšího hráče z poslední na první šachovnici výsledek zápasu? Odpověď zní: ANO. A to dokonce velmi významně. Přitom významnost tohoto vlivu je závislá pouze na diferenci ve výkonnostech jednotlivých hráčů v obou družstvech.
Spolu s odpovědí však vyvolá novou otázku. Když už víme, jaké má pořadí hráčů na jednotlivých šachovnicích vliv na výsledek zápasu, nemohl by slabší tým využít obdobné strategie k posílení svých šancí v zápase se silnějším družstvem? Už nebudu zdržovat unavené čtenáře novým odvozováním a výpočtem a rovnou se podíváme se na konkrétní situaci. Ať nechodíme daleko pro příklad, sáhněme opět do letošní 1. divize. Seřadíme-li všechny týmy podle průměrného ELA hráčů na prvních osmi šachovnicích, zjistíme, že posledních pět družstev má průměry: 1910 (Loko B), 1893 (Spoje), 1881 (Chvalšiny), 1879 (J. Hradec) a 1795 (S. Ústí). Vynechme nejslabší Sezimovo Ústí, které spasí pouze souhra hvězdných výkonů všech hráčů a podívejme se na situaci očima Hradce. Jeho odstup od B-družstva Lokomotivy je pouhých 31 ELO bodů. Jakou bude mít proti ní za normálních okolností šanci a jakou šanci bude mít po zvážení předchozích výpočtů? Opět předpokládejme, že průměrný rozdíl ve výkonnosti dvou po sobě jdoucích šachistů je 50 bodů a podívejme se na výsledky výpočtů.
Obr. 9: Pravděpodobnostní distribuce možných výsledků vzájemného zápasu dvou družstev, z nichž jedno je v průměru o 31 ELO bodů slabší. |
Obr. 10: Obdobná situace jako v předchozím případě za předpokladu, že slabší družstvo přesadí dva své nejslabší hráče na první dvě šachovnice. |
Už z obou grafů je zřejmé, že snaha Hradce bude alespoň v pravděpodobnostní rovině korunována úspěchem. Zatímco v případě, kdy obě družstva nastoupí v “normálním” pořadí hráčů na všech šachovnicích, prohraje slabší tým s pravděpodobností přesně 60 %, v případě, že první dvě desky slabšího týmu obsadí jeho nejslabší hráči, sníží se riziko porážky na pouhých 41,6 %. Výsledky oproti dalším konkurentům v boji o záchranu budou samozřejmě ještě lepší. Jedinou vadou na kráse celé teorie je fakt, že podobnou rošádu na prvních dvou šachovnicích může provést i silnější tým a celá snaha tak přijde vniveč. Čtenář sice může namítnout, že slabší družstvo může posunout ne dvě, ale čtyři šachovnice a docílit tak stejného efektu, jenže v tom případě by se výrazně zvýšilo riziko porážky s týmy, které žádné přesuny neprovedly a vzhledem k povinnosti zachovat pořadí hráčů na soupisce ve všech zápasech soutěže by nakonec víc ztratilo než získalo. Ale to již není předmětem naší diskuse.
To, co jsem se tu na předchozích řádcích snažil dokázat, byl fakt, že nejoptimálnější seřazení hráčů na soupisce není jejich seskládání podle ELA, ale ať to zní jakkoliv neuvěřitelně, je to za podmínek definovaných v předchozích odstavcích pořadí dané posloupností 8, 7, 1, 2, … 6. K přesnému a detailnímu důkazu by však bylo zapotřebí mnohem víc, než 7 popsaných stránek. Ale to už přenechám každému čtenáři jako samostatnou práciJ .
Na závěr už jen malé upozornění. Všechno, co jsem tu odvodil je pouze matematika, která nemůže postihnout vše, co se kolem takového šachového utkání odehrává. Nemá schopnost předvídat dohody kapitánů, onemocnění klíčových hráčů nebo pozdní příjezd některého z družstev. Zkrátka berte toto všechno spíše jako hru s čísly, než jako návod na sestavování soupisek pro příští sezónu.