Om datakåringer av verdens beste spillere


Shak Mamedyarov er en av de største eksponentene for rå angrepssjakk i verdenstoppen
Foto: Wikipedia Commons  |  Karpidis from Piraeus

 

I disse dager blir "Performence Rating" - en vurdering av hvor få feil en gjør i sjakk - målt direkte av datamaskinen - brukt stadig oftere i sjakk. Det har blitt en populær måte å måle spilleres spillestyrke på. Hos LiChess kan du lage egne, automatiserte, analyser som viser din tapte markedsverdi - ifølge computeren - målt som gjennomsnittlig verditap av centibønder. Hos Chess DB - en av internetts flotteste databaser - kan man få oversikt over hvordan de beste i verdens spiller i forhold til en beregning utført av computeren. De bruker nok ikke siste skrik innen denne teknologi, for GM Gheorghiu troner på topp foran Capablanca på andreplass der. Det handler om å gjøre få feil - og det er jo ikke nødvendigvis det samme som å spille god sjakk. Ja, for Magnus er nede på 266. plass i denne "kåringen". Chess.com har sitt eget system, som er regnet som noe av det mest moderne, mens dataguru Ken Regan har sitt eget system som brukes for å ta juksemakere. Mange har altså tenkt på dette med datavurderinger i sjakk. Hvor mye gir du bort i forhold til perfekt spill? Siden jeg har tenkt mye på dette temaet lenge før det ble en realitet - vil jeg i denne artikkelen komme med noen av mine betraktninger. Dersom du trenger mer info om temaet - les gjerne VG sin enkle versjon av det hele - eller en mer vitenskapelig artikkel her.

Men har ikke alle slike vurderinger gjort av datamaskiner (og Gud forby, synsing utført av mennesker!) store svakheter? Jo, selvsagt! Og disse målingene eller datavurderingene legger til grunn en del premisser som ikke er sanne - ergo må utfallet også bli "usant".

De tre største svakhetene ved det å måle et feilvurderingstall på sjakkpartier er, slik jeg ser det, følgende:

A) Datamaskinen spiller ikke perfekt sjakk og vet ikke hva perfekt sjakk er for noe. Det er fortsatt et slags filosofisk spørsmål hva best sjakk virkelig er for noe.

B) Den menneskelige faktoren i spillet betyr noe - og den ligger i rommet mellom dine trekk og motstanderens trekk! Så kun å måle en parts trekk gir ikke den fulle og hele sannhet.

C) I forlengelsen av disse to punktene har vi det faktum at "perfekte partier er remis" - og at perfekt spill derfor tenderer til å helle mot remis. Derfor blir sterke forsvarsspillere, som kun er villig til å ta en svært liten risiko, "premiert" og sterke angrepsspillere som tar skje i egen hånd blir diskreditert i slike feilsnitts-beregninger vurdert av datamaskinen.

La oss filosofere litt rundt dette:

A) En illustrasjon på at dette med perfekt sjakk ikke er så lett

Hvem vil gjøre det best i en VM-turnering mellom Stockfish, Komodo, Fischer, Magnus, Gud og Djevelen? Hvem vet? Gud vil nok slå de feilbarlige menneskene Fischer og Magnus, men han vil kanskje remisere resten av feltet fordi han blir for forutsigbar med sitt "perfekte spill". Mot djevelen fordi djevelen vet at triks preller av på Guds overflate og han prøver derfor å spille sitt beste spill. Stockfish og Komodo fordi de spiller svært godt, og ikke går på noen av fintene til Gud. Gud prøver jo ikke å finte, men kun å spille gode trekk - han blir dermed forutsigbar. Djevelen slår menneskene med sine djevelske planer, men taper så mot Komodo da han prøver seg på en finte som maskinen avviser. Så remiserer djevelen Stockfish - klok av skade. Møtet mellom Stockfish og Komodo går denne gang i Komodos favør og VM vinnes dermed av Komodo som har nerver av stål (bra mot mennesker og Gud), spillestyrke som fy (bra mot Stockfish og djevelen) og samtidig litt hell (den slo jo rivalen Stockfish). Slik kan en tenke seg at Guds perfeksjon ikke slår inn - selv om han ikke kan tape noe parti - for sjakk er et spill som søker det imperfekte i søken etter å vinne. Det er nemlig feilene som berettiger sjakkens eksistens. Poenget mitt her er at en hele tiden spiller en motstander - denne motstanderens trekk tas ikke inn i feilvurderingsmålingene - og dermed blir målingene ikke like relevante som de kunne vært. Perfekt sjakk kan altså være så mangt.


B) Den menneskelige faktoren i sjakk

Judit Polgar sa en gang noe klokt. Nemlig at sjakk er 70-80% psykologi. Det ligger en sannhet begravet i denne påstanden selv om jeg ikke kan kvantifisere, eller på noen annen måte verifisere, tallene hun gir. Poenget mitt er uansett at det finnes en 9-rad som det kan spilles på - slik Karpov i sin tid snakket varmt om den 9-raden, snakker jeg nå varmt om den. Jeg skal ikke dra hele regla her, men dra inn fire klare faktorer som teller når en spiller sjakk, og som handler om det enkelte menneske, dets psykologi, dets særegenheter i sjakken og om de psykologiske mulighetene på brettet og i samspillet med motstanderen. Vi ser på disse fire faktorene her:


1. Kreativitet: Kreativitet i sjakken er vanskelig å måle. Allikevel vet alle at stor kreativitet kan gi bedre resultater. Det er en korrelasjon ute og går. Simen Agdestein er i så måte et strålende eksempel på en spiller som ofte finner disse uventede, kreative trekkene som slår den sedate sjakkspilleren helt ut, og får han til å dette ned fra sin høye hest der han føler seg så trygg og solid. 
Men hva er kreativitet? Slik jeg ser det er kreativitet i stor grad det å finne gamle eller nye ideer, og lenke dem sammen på en uventet måte. Ofte må en skape ting gjennom originalitet og kompleksitet - som begge deler er viktige innen det psykologiske spillet i sjakk. Kunstneren er per definisjon kreativ. Han skaper noe som aldri før er skapt og vi kaller det derfor for et kunstverk. I sjakken er de som er først ute med ideene sine kunstnere - det er de som er de kreative. Vi andre er kopister som gjentar det som er prøvd ut tidligere. Når slike målinger gjøres av computeren - for å måle feilene som gjøres i et enkeltparti måler den ikke kreativitet: Om det er en idé som kommer bardus på motstanderen eller om det er en sliten idé som et offer på h7 - som alle kjenne igjen. Det spiller ingen rolle for computervurderingen - selv om det kan gjøre stor forskjell på resultatet. Den kreative spilleren blir altså på en måte snytt i slike tester om han gjør noe smart og helt nytt - for alle som kopierer det smarte i ettertid - vil få den samme kreditten og «spillestyrken» i fremtiden...

2. Å utnytte motstanderens akilleshæl: Å utnytte feil hos motstanderen er essensielt i sjakken, men ofte vanskelig. Tenk deg at motstanderen din ofte liker å rokere sent, at han ofte går på rov med dronningen en gang for mye, eller at han har en preferanse for å rokere motsatt vei når sjansen byr seg. Når du vet dette på forhånd, eller finner det ut underveis, kan du i en match justere spillet ditt slik at det utnytter disse tendensene. Skape feil av dem. Kanskje koster det deg litt på Stockfish sin evalering i utgangspunktet - men gaven du får i enden av tunnelen vet du er større ut fra innsikt. Allikevel vil denne typen innsikt, og spill på innsikten, tape for deg i en analysesituasjon slik analysene er gjort i dag. Det måles jo ikke resultater - og det måles jo ikke opp mot motstanderens spill/feil.

Det som måles i disse feilberegningene som maskinen gjør er hva du selv gir bort i forhold til computerens "perfekte spille". Dette gir altså det utslaget at en Lasker vil score svært dårlig på slike tester - selv om han kanskje vant mer overbevisende mot f.eks. Rubinstein - enn det Capablanca gjorde. Disse feilvurderingsanalysene viser nemlig ikke hvor overbevisende en vinner i enkeltpartier - men i stedet viser de en stor mengde partier - og hvor mange "feil" en gjør i disse. Poenget mitt her er altså at det er en menneskelig faktor oppe i det hele - en nerve hos motstanderen som en kan trykke på - som igjen gir resultater som maskinen ikke fanger opp. Det beste eksempelet fra nyere tid på dette er Anands svartspill i VM i Bonn i 2008 der han spilte noe maskinen vil se på som spekulativ sjakk. Og det var det kanskje. Men det var en iskald, kalkulert risiko som lå bak, og et angrepsspill som førte frem. Vi må alltid huske på at så lenge sjakkens berettigelse er tilstede så vil det begås feil - derfor er spekulasjon helt innenfor - og ofte godt - om den er iskaldt beregnet.

3. Angrepsspill scorer dårlig: Dette er litt i samme gate som punktet over. Tenk deg Topalov, i matchen mot Kramnik, eller i VM 2005 i Mexico. Tenk deg Kasparov i det brutale partiet mot Topalov i 1999. Heftig angrepsspill som er godt forankret, og som har et element av overraskelse i seg, vil være vanskelig å møte selv for sterke forsvarsspillere. Det fungerer nemlig mot mennesker fordi motstanderens datamessige feilvurdering går mer opp enn din egen! Det er her hunden er begravet. Det en bør trakte etter som sjakkspiller er nemlig ikke å ha lavest mulig teoretisk "feilvurderingstall" når en setter seg ved brettet for å slå sin motstander. Da ender en opp som Gud i "vår turnering" over. En spiller "for perfekt". Målet er i stedet å spille så mye bedre en klarer enn motstanderen sin. Så mye bedre som overhodet mulig! Det nytter ikke å spille på 0.00 hvis motstanderen spiller på 0.05. Da blir det remis! Matematisk kan det uttrykkes slik. I stedet for å tenke at "mitt feilvurderingstall skal være lavest mulig" - så bør en tenke "min motstanders feilvurderingstall minus mitt feilvurderingstall skal være størst mulig"! Poenget er altså alltid å skape en størst mulig kløft mellom reelt spill hos deg og motstanderen din. Dette måles ikke i slike tester. Derfor scorer angrepsspill, der du lokker motstanderen din ut på glattisen, for så å slå han med erfaring - ikke like bra som forsvarsspill der du hele tiden søker det "perfekte" i troen på at det scorer best slik.

4. Kompleksitetsgrad i sjakk scorer dårlig: Er du god i sjakk - lønner det seg å være god på det komplekse. Bobby Fischer var en mester i å finne en rød tråd, og en mening, i selv de mest kompliserte stillinger. Han vant ofte partiene sine i stor stil til syvende og sist, etter mye komplisert, og elegant spill underveis der kompleksitetsgraden ofte var stor. Dermed ble han den mest suverene verdensmesteren i nyere tid - i forhold til sin samtid. Hvorfor er det slik at gode spillere, som behersker stor kompleksitetsgrad, vil bli mer suverene? Fordi dess mer komplekst et spill er - dess viktigere er ferdigheter og spillestyrke. I mer komplekse spill enn sjakk - la oss si i spillet go - betyr spillestyrke enda mer, og forskjellen i spillestyrke gir enda større utslag. Så ved å øke kompleksitetsgraden kan du øke scoren din - om du er best forberedt på det som vil skje. Behersker du denne typen spill gir det grobunn for suverenitet. Dette er vanskelig å implementere i feilvurderings-analyser og spillere som spiller enkel sjakk scorer derfor bedre. Tenk deg et parti i klubben hvor du spiller bevisst på det å spille svært enkel sjakk. Det kan gi mange avbytter tidlig, kjent bondestruktur - gjerne med symmetri. Et langt tårnsluttspill som det står skrevet om i bøkene. Da er du trolig sikret et lavt feilvurderingstall fra maskinen - men spilte du egentlig god sjakk likevel?


Svaret mitt er nei, mens svaret til maskinen er ja. Så nå vet du hvorfor jeg tenker som jeg gjør. Dette med computerstatistiske feilvurderinger av sjakkpartier er meget interessant og spennende å lese om - men må tas med to klyper salt. Det finnes nemlig ingen fasit på det å måle spillet opp mot «det perfekte» - og derfor blir ikke resultatene helt reelle.

I ukas parti skal vi se Mamedyarov spille et spennende parti der han spiller på mange strenger, og med stor kompleksitetsgrad vant han et nydelig spill. Allikevel er maskinen kanskje litt hard mot han. Det bør legges til at Shak Mamedyarov har vunnet 9 av sine 22 siste partier og har passert 2800 i rating. Jeg tror altså at vi enn så lenge skal holde oss til at rating er en god måte å bedømme sjakkspilleres reelle spillestyrke på.

 

Vi tar en titt på Mamedyarovs spill med Stockfishanalyser hos LiChess

 

Vi tar en titt på Mamedyarovs spill med menneskelige analyser her hos Sjakkfantomet:

 

16 kommentarer

Arve

29.05.2017 kl.10:28

Jeg tror du tar feil vedr Komodos`muligheter i det innbyrdes partiet mot Djevelen; mistenker at silikonmonsteret ville fått juling nok til å søke desperat etter nærmeste nervesanatorium resten av turneringen. Og Gud ville sannsynligvis blitt så frustrert over Djevelens gode poengfangst at han desperat gamblet ivei et Wienerparti mot Fischer og tapte. En mer fullstendig turneringsrapport savnes her altså ... Neida .. ;))

Mye av dette blir noe tungt for en computerhatende gammel middelhavsfarer, men særdeles fornøyelig lesning likevel. Avsnittet om turneringen er jo helt kostelig! Terningkast fem fra meg.

Sven

29.05.2017 kl.12:09

Arve,

Nå var det hyggelig med en kommentar her gitt. Sidene har mange lesere, men få som kommenterer for tiden - har vel noe med at temaet ikke er Magnus Carlsen...

Avsnittet om Gud, Djevelen, Komodo, Stockfich, Fischer og Djevelen var laget for å illustrere et poeng - nemlig at det må en kombinasjon av djevelskap og kalkulert risiko inn i spillet for å øke sjansen for å vippe noen av pinnen og at sjakk er et spill der det "perfekte" kanskje ikke er det høyeste målet allikevel - selv om mange liker å tro det.

Arve

29.05.2017 kl.17:37

Ja jeg tror nok Herr Walker kan trøste seg med at bloggen blir lest av mange selvom kommentarfeltet ikke bugner bestandig. Til neste år er det vel kandidatturnering og ny tittelkamp, så da smeller det nok igjen. Personlig syntes jeg det nevnte avsnittet var så fornøyelig at jeg ikke greide å motstå en kommentar.

Og hvem vet - kanskje det blir Djevelen mot Gud (Carlsen vs So) i tittelkampen også :-) en gammel hedning gleder seg allerede. (Nå bør jeg trykke delete her - men skitt au!)

Sven

29.05.2017 kl.17:45

Er jo litt artig med liv i kommentarfeltet og kanskje tar det seg opp under Norway Chess, vi får se. Ellers tenker jeg at Gudstro So får ut nok djevelskap på brettet til å skremme Magnus litt i disse dager ;-)

Ole Morten Persen

29.05.2017 kl.18:25

Gud (og Djevelen) ville tapt alle partier på walkover siden de ikke eksisterer.

EvigOptimist

29.05.2017 kl.22:48

Fisher ville også slitt litt siden han er død. Stockfich og Komodo mangler hender og har derfor problemer med å flytte brikkene. Så Magnus vinner komfortabelt.

Ole Morten Persen

30.05.2017 kl.02:09

En annen ting er at en slik turnering umulig kan være en VM-turnering, men en kandidatturnering om retten til å møte Kasparov, tidenes beste spiller (enn så lenge...). Jeg finner det rett og slett ikke troverdig at ikke Kasparov ble invitert her!

Fredrik

30.05.2017 kl.20:21

Gode poenger om slike analyser. For å låne et uttrykk fra poker føler jeg det er bedre å snakke om EV (Expected value) per trekk enn conputerens avvik fra det 'optimale' trekket.

Husker bl.a parti seks fra VM 2013 hvor mange gjerne kunne styrt partiet mot en 'perfekt' remis men hvor Magnus tok risiko (det så hvertfall slik ut for en skarve amatør :-)) som nok likevel økte hans forventede verdi for partiet.

Sven

30.05.2017 kl.21:20

Takk for hyggelig og innsiktfull kommentar, Fredrik. Ser ut som du skjønte poenget fint :-)

Ole Morten Persen

30.05.2017 kl.23:24

Nja...to trekk kan ha samme EV, men et kan være et mer high variance play og det andre et mer low variance play. Et eksempel: En spiller velger å avvikle til et helt tørt, teoretisk remissluttspill. Dette vil være low variance play. Alternativt kan han gå for en veldig komplisert variant som objektivt sett leder til en trekkgjentakelse ved korrekt spill, men der det er mange muligheter til å trå feil. Dette vil være eksempel på et high variance play. Men begge vil ha samme EV. Dersom det har høyere EV, så vil også computerens evaluering se dette, i hvert fall dersom det er relativt betydelig forskjell.

Jon

30.05.2017 kl.23:43

Hahahaha! Har aldri kost og ledd slik over en sjakkspalte! Første del med Gud, menneske og djevel, pluss Komodo og tørrfisken, var virkelig fornøyelig!

Men har ikke vitenskapen vist at Einstein tok feil? Gud spiller faktisk med terninger, og dermed er det ikke sikkert at Gud ville ført dette perfekte spillet som du påstår ikke ville føre frem til seier ;)

Sven

30.05.2017 kl.23:55

Jon,

Hyggelig at du lo litt og hygget deg - det var halve meningen ;-)

Ellers finnes det mange gudelærer - og jeg leker meg med den kanskje mest utbredte religiøse mytologien i "fortellingen" jeg har laget og jeg tror over 90% av leserne skjønner hvor jeg vil.

For de som ikke gjør det: Sjakk er et feilbarlig spill der en spiller også opp mot den menneskelige faktoren i spillet - altså vår feilbarlighet. I turneringsspill vil derfor ting som kreativitet, kompleksitet, heftig angrepsspill og det å utnytte svakhetstrekk hos motspilleren alltid være del av spillet...

Pussig nok har jeg aldri sett noen skrive om dette temaet før - så fant ut at det var dags for det ;-)

Jon

31.05.2017 kl.23:37

Jeg skjønte hvor du ville. Du skjønte sikkert også hvor jeg ville. Syns det er litt artigere med en gud som spiller med terningen enn en som ikke gjør det ;)

Sven

31.05.2017 kl.23:59

Jon,

Skjønte godt hva du mente, Jon. Men skrev i lys av at jeg ikke ønsket en ytterligere utgliding av temaet da et par stykker lenger opp kom med vel plumpe utsagn.

Jeg hadde forresten en kvante-kjemiker til far som hadde både embetseksamen i teologi og et doktorgrads-studie i kvantemekanikk og selvfølgelig embetseksamen i kvantekjemi. Så jeg har hørt mye om Kjøbenhavndebattene mellom Bohr og Einstein og har en viss forståelse av Kjøbenhavnfortolkningen selv om den fort blir veldig abstrakt.

Med en slik far ble det fort endel bøker om vitenskap, astrofysikk og slikt i ungdommen for hans begeistring over det å forstå universets lover smittet lett over. Husker for eksempel godt når NRK meldte at Einstein-Podolsky-Rosen-paradokset nå var oppklart av franskmannen Alain Aspect som viste at Einstein hadde tatt feil i en antakelse i kvantemekanikken. Min far jublet som om Oddvar Brå vant 50-mila og jeg skjønte at denne smarte fyren i Frankrike og hans folk virkelig hadde gjort noe stort - og dermed gikk det en time med til å forklare meg hva eksperimentet til Aspect gikk ut på...

Slik var min far i et nøtteskall - og denne avsporingen fra sjakk tok jeg for å hedre min smarte far som lærte meg så mye - for han ville fylt 80 år den 29. mai 2017 om han fikk levd så lenge.

Jon

01.06.2017 kl.23:16

Ja, tenkte på den franskmannen som viste at Einstein tok feil. Tida flyr. Det begynner vel å bli noen år siden. Fint å hedre din far som ville blitt 80. Kan jo da nevne at i likhet med ham, har jeg også teologisk embetseksamen, men har aldri fått gjort noe med min naturvitenskapelige interesser.

God pinse!

Sven

01.06.2017 kl.23:24

Jon,

God pinse til deg også Jon.

Nå blir det igjen på Magnus Carlsen at fokuset vil ligge her hos Sjakkfantomet. I hvert fall i de neste tre ukene, så får vi se hvor mye ballade Magnus klarer å stelle i stand i Stavanger!

Ellers håper jeg flest mulig av dere er med meg og følger Sjakkspalta.no som har daglige oppdateringer :-) Er ikke det fint da?

Skriv en ny kommentar

Sjakkfantomet

Sjakkfantomet

48, Tromsø

Sven Wisløff Nilssen - Visejuniornorgesmester i brettsjakk 1989. Norgesmester i postsjakk 1995. To ganger deltaker i eliteklassen både i brettsjakk og postsjakk. I dag, avdanket sjakkspiller med fortsatt lidenskap for spillet. Kontaktadresse: sjakkfantomet[a]gmail.com

Søk hos Sjakkfantomet:

only search Sjakkfantomet

free counters

2700chess.com for more details and full list

Daily chess puzzle

Kategorier

Arkiv

hits