Bewertungsrelevanzreduktion

Externe Links:


CSS
Computerschach-Forum:


umfangreiches Forum zum Thema Computerschach und speziell auch zum Programm "Stockfish"

Stockfish
Development Versions


Die aktuellsten Versionen von Stockfish

Interne Links:


Behting-Studie

Eine für fast alle Schachprogramme unlösbare Studie

Stellungsbewertungen und NAG- bzw. Informator-Symbole

Schachspieler pflegen Stellungen auf dem Brett unter Verwendung derartiger Symbole wie folgt zu taxieren:

ausgeglichene Stellung oder Remis (=) – NAG $10,
leichter Vorteil für Weiß (⩲) oder Schwarz (⩱) – NAG $14/$15,
moderater Vorteil für Weiß (±) oder Schwarz (∓) – NAG $16/$17,
klarer Vorteil für Weiß (+-) oder Schwarz (-+) – NAG $18/$19,
extremer Vorteil für Weiß (+--) oder Schwarz (-++) – NAG $20/$21.

Ergänzend sei noch erwähnt die unklare Stellung (∝) – NAG $13. Sie gehört eigentlich nicht hierher, da sie gerade zum Ausdruck bringt, dass eine Stellungsbewertung nicht möglich ist.

Vorbehalt: Die deutschen Umschreibungen sind Eigengewächse und selbstredend keineswegs verbindlich. Näheres ist hier zu finden.

„NAG“ bedeutet übrigens „Numeric Annotation Glyphs“.

Solche Stellungseinschätzungen sind durchaus praktisch: Sie verschwenden wenig Raum und mit einem Blick lassen sie einen Bewertungsbereich erkennen. Nur stellt sich die Frage, wie solche Bewertungen zustande kommen. Pi mal Daumen? Oder geht es auch etwas genauer? Es würde schon einen Fortschritt darstellen, wenn sie begrenzt würden von irgendwie definierten Schachprogrammbewertungen in Bauerneinheiten, mit denen Schachengines Stellungsungleichgewichte bzw. -vorteile oder -nachteile zahlenmäßig ausdrücken. Aber woher solche Definitionen nehmen, wenn nicht stehlen? Ab welcher Stellungsbewertung einer Schachengine lässt sich zum Beispiel von einem leichten Vorteil für Weiß sprechen, ab 0,10 Bauerneinheiten oder ab 0,20 – wenn man einmal von individuellen Über- oder Untertreibungen der Engines bei der Höhe ihrer Bewertungen absieht? Und wie lässt sich hier ein objektiver Maßstab finden?

Am Ende dieses Artikels werden hierzu 3 mathematisch abgeleitete Vorschläge mit entsprechenden Formeln unterbreitet werden. Und die Zugbewertungssymbole (!! – ! – !? – ?! – ? – ??) werden bei der Gelegenheit auch gleich aufs Korn genommen. Zuvor sind jedoch diverse statistische und mathematische Grundlagen zu erarbeiten.

Patzerrelevanz oder höflicher: Bewertungsrelevanz

Schachprogramme bewerten Stellungen gewöhnlich in Hundertstel von Bauerneinheiten und wenn man vom Rechenknecht ausgespuckte Varianten in einer Stellung vergleicht, erkennt man die Bewertungsdifferenz bzw. Fehlermarge zwischen der besten und einer minderwertigen Variante.

Wie relevant sind aber eigentlich Fehlzüge und deren Bewertung? Beispiel: In einer verlorenen Stellung nach kompensationslosem Verlust der Dame stellt man ohne Not zusätzlich noch eine weitere Figur ein. Das Schachprogramm wird dieses Malheur mit einer deutlich höheren Bewertung zugunsten des Gegners quittieren. Wie relevant ist aber nun eine solche Differenz zwischen der neuen und der vorherigen Stellungsbewertung in einer praktisch schon verlorenen Partie? Objektiv – also von subjektiven Fehlzügen des Gegners mal abgesehen – eigentlich gar nicht! Der Patzer wird die Partie nach menschlichem Ermessen auch ohne den neuerlichen Fehlzug bei beiderseits bestem Spiel nicht mehr retten können.

Diese Schlussfolgerung zieht die Frage nach sich, ab welcher Bewertung denn eine Partie objektiv als gewonnen oder verloren gelten kann. Kommt darauf an. Man könnte ironisch sagen: Je Stümper desto höher. Je höher die Bewertung, desto eher kann man darauf bauen, dass der Vorsprung nicht mehr vermasselt wird, wobei man bei heutigen Schachcomputerprogrammen mehr Vertrauen investieren darf, als beim Homo sapiens. Und wenn man es mit einem potentiellen Patzer zu tun hat, sollte man zum Beispiel in einer scheinbaren Verluststellung nicht vorzeitig die Flinte ins Korn werfen, wie etwa Kasparov weiland in der 2. Wettkampfpartie gegen Deep Blue im Jahr 1997.

Computerschachstatistiken

Was also tun? Man nehme Abschied vom Menschen-Stümper-Schach, wende sich dem stärksten Computerschachprogramm zu und analysiere dessen Partien unter der Fragestellung, ab welcher Bewertung dieses Programm seine Partien gewonnen hat – oder auch nicht. Das derzeit beste Programm ist Stockfish. Es verfügt über eine ELO von circa 3400 und ist downloadbar. Und die aussagekräftigsten Partien finden sich vermutlich im Internet unter „TCEC“ („Top Chess Engine Championship“) bzw. – „Season 9 – 01.05.2016“ und „Superfinal 11.11.2016“. Gründe: Hohe Bedenkzeit, Gegner war die derzeit scheinbar zweitbeste Schachengine Houdini und alle Stellungsbewertungen sind Zug für Zug nachvollziehbar.

Was lässt sich nun aus den insgesamt 100 Partien dieses epischen Wettkampfes ablesen?

Stockfish gewann offiziell 17 Partien, eigentlich jedoch nur 16. Am Ende der 17. Partie, bei der Stockfish ein unverdienter Sieg zugeschanzt wurde, zeigten beide Engines übereinstimmend eine Bewertung von 0,00 an, weil die Stellung nicht innerhalb von 50 Zügen für Stockfish zu gewinnen war.

Nicht wie offiziell angegeben 75, sondern 76 Partien endeten demnach mit Remis. Und in all diesen Partien ist nun die höchste Bewertung zu suchen, die Stockfish zu seinen Gunsten angab. Wohlgemerkt eine positive Bewertung, die nicht zum Sieg verwertet werden konnte. Diese höchste Bewertung findet sich mit 1,75 – wer hätte das gedacht – ausgerechnet in der ominösen Partie 17, die wegen der 50-Züge-Regel nicht gewonnen werden konnte. Nun suche man in allen 16 Gewinnpartien nach der kleinsten Bewertung, die nach 1,75 auftaucht. Sie lautet 1.79 und kommt sogar in drei Partien vor: in der 43., 55. und 83. Partie. In allen 16 Gewinnpartien hat Stockfish mindestens diese Bewertung erreicht und immer gewonnen.

Wem der statistische Wert von 1.75 zu niedrig erscheint, der betrachte mal im TCEC-Turnier 2016 die Stockfish-Partien im vorherigen „Stage 3 – 23.07.2016“. Dort war die höchste Bewertung in allen 34 Stockfish-Remispartien lediglich armselige 0,87!

Bestätigt wird 1,75 übrigens noch von einem kleinen Wettkampf, an dem Stockfish unter dem Namen Brainfish beteiligt war. Die höchste Bewertung in den 7 Remis-Partien war 1,71. Erstaunliche Koinzidenz!

Und zuletzt sei noch ein Gerücht kolportiert, das da lautet, die Chessbase-GUI würde eine Bewertung von 1,60 als mutmaßlichen Gewinn einstufen. Anscheinend etwas zu tief gegriffen.

Ist die Bewertung von 1,79 also der statistische point of no return (Punkt ab dem keine Rückkehr zum Remis stattfindet)? Mitnichten. Die Datenbasis von knapp über 100 Partien ist für ein verlässliches Urteil viel zu klein. Man recherchiere zum Beispiel in den Partien des TCEC-Superfinals 6.11.2015 in Season 8 zwischen den Engines Stockfish und Komodo. Dort findet sich in Partie 22, Zug 62, eine Stellung, die Stockfish mit 26,13 bewertete (Komodo übrigens mit 4,22). Der angebliche Gewinn entpuppte sich schon zwei Züge später, als beide Engines reumütig ihre Bewertung auf 0 reduzierten (Stockfish nach 2.873.800 kN), als Halluzination, präziser als Dauerschach.

Auch wenn solche Ausreißer höchst selten vorkommen, verbieten sie die Gleichsetzung irgendeiner Bewertung (selbst von 26,13 – wie man sehen konnte) mit einer Relevanz von exakt 0 %. Anders ausgedrückt: Es gibt keinen point of no return.

Nun muss man sich noch der Frage zuwenden, bei welcher Bewertung denn nun so etwas wie ein Gleichgewicht zwischen Remis- und Gewinnpartien zu verorten ist. Es müsste sich um eine Bewertung handeln, bei der, einmal erreicht, sich alle betroffenen Partien in 50 %-Gewinnpartien und 50 %-Remispartien scheiden. Zieht man wiederum das TCEC-Partiematerial vom „Superfinal“ heran, bei dem bekanntlich 16 Stockfish-Gewinnpartien zu verzeichnen waren, wird man 16 Remispartien finden, in denen jeweils mindestens eine Bewertung von 0,62 anzutreffen ist. Anders ausgedrückt: In 32 Partien wurde von Stockfish eine Bewertung von 0,62 erreicht und in jeweils 16 Partien war das Ergebnis Remis oder 1-0. Nochmals anders ausgedrückt: Eine erreichte Bewertung von 0,62 war im Hinblick auf den Sieg für Stockfish statistisch bereits die halbe Miete.

Update: Im Juni 2017 wurden auf dieser Webseite 150 Partien mit längerer Bedenkzeit zwischen „Stockfish 090617 64 POPCNT“ und „Komodo 11.01 64-bit“ veröffentlicht. Stockfish gewann 25 Partien, Komodo nur 6. Stockfish war also zu diesem Zeitpunkt nach wie vor die Nummer 1. In den 25 Remis-Partien mit den höchsten Stockfish-Bewertungen lagen diese im Bereich zwischen 0,52 (Partie 43) und 1,85 (Partie 4). Die TCEC-Resultate wurden damit weitgehend bestätigt.

Weiteres Update: Im September 2017 erschien die Engine „Houdini 6“ über die auf dieser Webseite folgendes zu lesen ist:

„The evaluations have again been calibrated to correlate directly with the win expectancy in the position. A +1.00 pawn advantage gives a 75% chance of winning the game against an equal opponent at blitz time control. At +1.50 the engine will win 90% of the time, and at +2.50 about 99% of the time. To win nearly 50% of the time, you need and advantage of about +0.60 pawn.“

Zu Deutsch:

„Die Bewertungen sind wieder so kalibriert worden, dass sie direkt mit der Gewinnwahrscheinlichkeit in der Position korrelieren. Ein +1,00 Vorteil in Bauerneinheiten ergibt eine 75 % Wahrscheinlichkeit gegen einen gleichwertigen Gegner im Blitzspiel zu gewinnen. Bei +1,50 gewinnt die Engine zu 90 % und bei +2,50 etwa zu 99 %. Um fast zu 50% zu gewinnen, wird ein Vorteil von etwa +0,60 Bauerneinheiten benötigt.“

Halten wir fest: Auf dem Weg der Bewertung zwischen 0,00 und Unendlich (∞) nimmt deren Relevanz kontinuierlich ab. Beginnend mit 100 % über 50 % beim hier frech unterstellten Wert von 0,62 endet sie im Unendlichen mit 0 %. Was lässt sich damit nun anfangen?

Ein Beispiel: Die Bewertung für den besten Zug beträgt 2,00. Nun passiert ein Missgeschick: ein Fehlzug wegen Figurenverlust mit einer Bewertung von -1,00. Die Bewertungsdifferenz beträgt -3,00. Wie relevant ist dieser Figurenverlust? Offensichtlich weniger als -3,00.

Im Einzelnen: zwischen 2,00 und 0,62 wächst die Relevanz kontinuierlich; bei 0,62 beträgt sie 50 %; bei 0,00 erreicht sie ihren Höchstwert mit 100 %; -0,62 schlägt dann wieder mit 50 % zu Buche und bei -1,00 endet sie mit einem Wert von deutlich unter 50 %.

Mathematische Bewertungsrelevanzreduktion

Interessant wäre jetzt die Summe dieser Einzelwerte. Rechnerisch machbar, aber etwas kompliziert. Die mathematisch Versierten haben sicherlich längst erkannt, dass dieses Auf und Ab mit einer mathematischen Funktion ausgedrückt werden müsste, für die gilt: Je mehr man sich von der y-Achse beiderseits entfernt, desto kleiner wird die Ordinate, die reduzierte Bewertung an diesem Punkt auf der x-Achse, bis sie schließlich beiderseits im Unendlichen die x-Achse „berührt“.

Vorschlag: Eine Exponentialfunktion der allgemeinen Form f(x) = a^(x*b). Solche Exponentialfunktionen haben den Vorteil, dass immer der Punkt P(0;1) erfüllt ist und sie sich im (positiven) Unendlichen der x-Achse annähern. Genau das, was wir brauchen. Anstatt sich nun mit dem Punkt P(0,62;0,5) eindeutig zu positionieren, setze man in die Funktion den allgemeinen Punkt P(x_0_5;0,5) ein. Das Resultat der Exponentialfunktion ist dann

f(x) = 0,5^(x/x_0_5).

Für den Wert x_0_5 = 0,62 sieht das dann folgendermaßen aus:

Exponentialfunktion.jpg


Diese Funktion ist nicht achsensymmetrisch und gilt erst mal nur für x ≥ 0. Man könnte sie nun per f(x) = 0,5^(|x|/x_0_5) künstlich achsensymmetrisch machen, bringt aber im Ergebnis nichts. Dazu später mehr.

Die Funktionsgleichung steht. Wie errechnet sich nun aber die wirklich relevante Bewertungsdifferenz über eine bestimmte Strecke auf der x-Achse, zum Beispiel zwischen 2,00 und -1,00? Die Funktion f(x) ergibt ja nur den jeweiligen y-Wert eines speziellen Punkts entlang der x-Achse. So genial wie einfach: per Integralfunktion. Alle Werte zwischen der x-Achse und der Funktionskurve summiert, also der dortige Flächeninhalt zwischen der besten Bewertung (zum Beispiel 2,00) und der minderwertigen Bewertung (zum Beispiel -1,00), stellen das bestimmte Integral – sprich die relevante Bewertungsdifferenz – dieser Funktion dar.

Zur Berechnung des Integrals wird die Stammfunktion der Funktionsgleichung benötigt. Laut dem Computerprogramm Maxima lautet sie:

F(x) = -x_0_5/(ln(2)*2^(x/x_0_5)).

Verwendet werden kann sie aber wiederum nur für x ≥ 0. Für die zuvor angesprochene Betragsfunktion f(x) = (1/2)^(|x|/x_0_5) vermag Maxima keine Stammfunktion zu ermitteln. Ist aber kein Beinbruch.

Die y-achsensymmetrische Stammfunktion lautet

F(x) = -x_0_5/(ln(2)*2^(|x|/x_0_5))

und hat für den Wert x_0_5 = 0,62 folgendes Bild:

Integralfunktion.jpg


Sodann lässt sich die relevante Bewertungsdifferenz als bestimmtes Integral wie folgt berechnen:

im ausschließlich negativen x-Bereich (x <= 0) mit F(Integral_Beginn) - F(Integral_Ende) und
im ausschließlich positiven x-Bereich (x > 0) mit F(Integral_Ende) - F(Integral_Beginn),
wobei Integral_Beginn der niedrigere Wert und Integral_Ende der höhere Wert auf der x-Achse ist.

Die komplette Formel zur Berechnung des Integrals in Maxima lautet:

if Integral_Beginn<0 and Integral_Ende<=0 then
(x_0_5*2^(Integral_Ende/x_0_5))/log(2)-(x_0_5*2^(Integral_Beginn/x_0_5))/log(2)
elseif Integral_Beginn>=0 and Integral_Ende>0 then
x_0_5/(log(2)*2^(Integral_Beginn/x_0_5))-x_0_5/(log(2)*2^(Integral_Ende/x_0_5))
else -(x_0_5*2^(Integral_Beginn/x_0_5))/log(2)-x_0_5/(log(2)*2^(Integral_Ende/x_0_5))+(2*x_0_5)/log(2)

Zu beachten ist bei obiger Maxima-Formel, dass Maxima statt der üblichen Schreibweise ln(x) für den natürlichen Logarithmus die Schreibweise log(x) erfordert. Sollte man also die obige Formel anderweitig verwenden, wäre „log“ durch „ln“ zu ersetzen.

Realisiert ist die Bewertungsrelevanzreduktion im Programm AquaPGN (Update März 2017), kostenlos erhältlich auf dieser Webseite.

Und wen es danach gelüsten sollte, die obige kryptische Formel einer Bewährungsprobe zu unterziehen, mag sich am nachfolgenden interaktiven Formular delektieren - nicht ohne zuvor die Ausführung von Javascript-Code zu ermöglichen.

Probabilistisches Partieresultat

Ein netter Nebeneffekt der obigen Integralberechnung ist die Ermittlung des probabilistischen („der Wahrscheinlichkeit nach“) Partieresultats für jede Zugbewertung.
Hierzu benötigt man erst einmal das bestimmte Integral von -∞ bis zur Bewertung des maßgeblichen Zuges (in der Formel „x“ genannt) als Dividend. Die Maxima-Formel lautet

if x<=0 then
(x_0_5*2^(x/x_0_5))/log(2)
else
(-x_0_5/(log(2)*2^(x/x_0_5))+(2*x_0_5)/log(2))

Wiederum der Hinweis: „log“ bedeutet hier den natürlichen Logarithmus!

Ferner wird benötigt das komplette bestimmte Integral im gesamten Bewertungsbereich von -∞ bis +∞ als Divisor. Es lautet (2*x_0_5)/ln(2) oder in Maxima (2*x_0_5)/log(2). Genau genommen handelt es sich dabei um einen simplifizierten Grenzwert, der auch bei beiderseits extremen x-Werten nie vollständig erreicht wird.

Sodann berechne man das probabilistische Partieresultat als Division beider Werte. Die resultierende Formel kommt ohne Logarithmus aus und ist erstaunlich schlank:

if x<=0 then 2^(x/x_0_5-1) else 1-2^(-x/x_0_5-1)

Also etwas besser strukturiert:
für negative Bewertungen 2^[(x/x_0_5) – 1] und
für positive Bewertungen 1 – {2^[(-x/x_0_5) - 1]}

Eine Enginebewertung von exakt 0 hat zum Resultat 0,50, also ein Remis. Ein Resultat von 0,00 wäre ein fast sicherer Gewinn für Schwarz, ein 1,00 ein fast sicherer Gewinn für Weiß. Und eine Enginebewertung von genau x_0_5 führt zum Resultat 0,75, also einem Wert, der exakt zwischen Gewinn für Weiß und Remis liegt. Die Resultate sind somit besser interpretierbar aus der Sicht von Weiß.

Nur am Rande: Diese Berechnung des probabilistischen Partieausgangs ließe sich auch ziemlich präzise bewerkstelligen anhand einer Sigmoid-Funktion. Ein Kandidat für eine solche Funktion wäre etwa:
f(x) = x/(2*sqrt(3*x_0_5^2+x^2))+1/2

Selbstredend finden sich die probabilistischen Partieresultat auch im interaktiven Formular.

Konkretisierung der Stellungsbewertungsbereiche

Mit den erarbeiteten mathematischen Grundlagen lassen sich nun die eingangs des Artikels angeführten 9 Bewertungsbereiche näher beschreiben. Jeweils 4 Bewertungsbereiche liegen im positiven und negativen Bereich. Die ausgeglichene Stellung gilt bei minimalen Vorteilen für Weiß und Schwarz um den Wert Null herum. Der Bereich des minimalen Vorteils jeweils für Weiß oder Schwarz beträgt daher nur 50 % des gesamten ausgeglichenen Bereichs.

Vorschlag für die 9 Bewertungsbereiche – Schema 5/40 5/40 4/40 4/40 2/40 2/40 4/40 4/40 5/40 5/40 des Gesamtintegrals:

Hier erfolgt eine Annahme, die zwar nicht zwingend, jedoch sehr plausibel ist: Das Ende des Bereichs „moderater Vorteil für Weiß“ und der Beginn des Bereichs „klarer Vorteil für Weiß“ sollte exakt mit dem x-Wert zusammenfallen, für den das Gewinn-Remis-Gleichgewicht gilt, also zum Beispiel 0,62. Für diesen Wert wurde in den obigen Formeln der Ausdruck „x_0_5“ verwendet. Umgekehrt für Schwarz: Das Ende des Bereichs „moderater Vorteil für Schwarz“ und der Beginn des Bereichs „klarer Vorteil für Schwarz“ sollte exakt mit dem x-Wert zusammenfallen, für den das negative Gewinn-Remis-Gleichgewicht gilt, also zum Beispiel -0,62. Mit dieser Grundannahme steht fest, dass leichter bzw. moderater Vorteil statistisch für eine Tendenz zum Remis und klarer bzw. extremer Vorteil statistisch für eine Tendenz zum Gewinn steht. Nur nebenbei: Nun wird auch verständlich, warum hier 4 Vorteilsbereiche für jede Partei (entsprechend den NAG-Vorgaben) den üblicherweise verwendeten drei Vorteilsbereichen vorgezogen wurden.

Nun wieder etwas Mathematik:

Die Aufgabe besteht nun darin, diese einzelnen Vorteilsbereiche zu quantifizieren. Würde man etwa einen Weiß-Zug mit einem überwältigenden Vorteil von 100,00 vergleichen mit einem Patzerzug, der zum Remis (0,00) führt, wäre die absolute Bewertungsdifferenz 100,00, die relevante Bewertungsdifferenz jedoch nur das praktisch komplette bestimmte Integral im ausschließlich positiven Bereich der x-Achse (welches wiederum identisch ist mit dem bestimmten Integral im ausschließlich negativen Bereich der x-Achse). Als mathematische Formel: x_0_5/ln(2). Im Fall von x_0_5 = 0,62 wären das dann 0,89447. Nächstes Gedankenexperiment: Würde man jetzt einen Weiß-Zug mit einem Vorteil von x_0_5 exakt an der Grenze zwischen moderatem und klarem Vorteil vergleichen mit einem Patzerzug, der zum Remis (0,00) führt, wäre die absolute Bewertungsdifferenz x_0_5, die relevante Bewertungsdifferenz jedoch nur die Hälfte des kompletten bestimmten Integrals im positiven Bereich der x-Achse. Als mathematische Formel: x_0_5/(2*ln(2)). Im Fall von x_0_5 = 0,62 wären das dann 0,89447 : 2 = 0,4472.

Wenn man sich nun daranmacht, die Stellungsbewertungen an der Grenze zwischen ausgeglichener Stellung und leichtem Vorteil, an der Grenze zwischen leichtem und moderatem Vorteil und an der Grenze zwischen moderatem und klarem Vorteil jeweils für Weiß/Schwarz zu quantifizieren, müsste man diesen Integralwert von x_0_5/(2*ln(2)) in 3 Bereiche unterteilen:

20% = x_0_5/(10*ln(2)) für den Bereich ausgeglichene Stellung,
40% = x_0_5/(5*ln(2)) für den Bereich leichter Vorteil für Weiß/Schwarz und
40% = x_0_5/(5*ln(2)) für den Bereich moderater Vorteil für Weiß/Schwarz.

Daraus lassen sich nun für Weiß und Schwarz errechnen folgende Grenzwerte zwischen

ausgeglichener Stellung und leichter Vorteil für Weiß/Schwarz:
±(ln(10/9)*x_0_5)/ln(2)
leichter Vorteil für Weiß und moderater Vorteil für Weiß/Schwarz:
±(ln(10/7)*x_0_5)/ln(2)
moderater Vorteil für Weiß und klarer Vorteil für Weiß/Schwarz:
±x_0_5 (wer hätte das gedacht?)

Im Fall von x_0_5 = 0,62 wären das folgende konkrete Grenzwerte:

zwischen ausgeglichener Stellung und leichtem Vorteil für Weiß/Schwarz: ±0,094
zwischen leichtem Vorteil für Weiß und moderatem Vorteil für Weiß/Schwarz: ±0,319
zwischen moderater Vorteil für Weiß und klarem Vorteil für Weiß/Schwarz: ±0,62


Ähnlich verläuft es nun bei der Berechnung des Grenzwerts zwischen klarem und extremem Vorteil jeweils für Weiß/Schwarz, wobei nur der Unterschied besteht, dass für die 2. Hälfte des gesamten Integralwerts auf der positiven/negativen x-Achse nur zwei gleich große Bewertungsbereiche zur Verfügung stehen.

Der Grenzwert lautet: ±2*x_0_5
und im Fall von x_0_5 = 0,62: ±1,24

Die beiden letzten Grenzwerte ±x_0_5 und ±2*x_0_5 erleichtern die Sache ungemein: Sie fallen zusammen mit dem einfachen bzw. doppelten Betrag des unterstellten Gewinn-Remis-Gleichgewichts und sind in der Praxis ohne umfangreiche Rechnerei bekannt.

Alternativer Vorschlag für die 9 Bewertungsbereiche – Schema 1/9 1/9 1/9 1/9 1/18 1/18 1/9 1/9 1/9 1/9 des Gesamtintegrals:

Sollte man die obige Leitlinie, wonach das Ende des Bereichs „moderater Vorteil für Weiß/Schwarz“ und der Beginn des Bereichs „klarer Vorteil für Weiß/Schwarz“ exakt mit den Bewertungen zusammenfallen, für die das positive bzw. negative Gewinn-Remis-Gleichgewicht gilt, verwerfen und wiederum 4 positive bzw. negative Vorteilsbereiche diesmal jedoch gleicher Quantität präferieren, würden die Formeln zur Berechnung der Grenzwerte etwas komplizierter ausfallen:

zwischen ausgeglichener Stellung und leichtem Vorteil für Weiß/Schwarz:
±((ln(9)-3*ln(2))*x_0_5)/ln(2)
zwischen leichtem Vorteil für Weiß/Schwarz und moderatem Vorteil für Weiß/Schwarz:
±((ln(3)-ln(2))*x_0_5)/ln(2)
zwischen moderatem Vorteil für Weiß/Schwarz und klarem Vorteil für Weiß/Schwarz:
±((ln(9)-2*ln(2))*x_0_5)/ln(2)
zwischen klarem Vorteil für Weiß/Schwarz und extremem Vorteil für Weiß/Schwarz:
±((ln(9)-ln(2))*x_0_5)/ln(2)

Im Fall von x_0_5 = 0,62 wären das folgende konkrete Grenzwerte:

zwischen ausgeglichener Stellung und leichtem Vorteil für Weiß/Schwarz: ±0,1053
zwischen leichtem Vorteil für Weiß/Schwarz und moderatem Vorteil für Weiß/Schwarz: ±0,362
zwischen moderatem Vorteil für Weiß/Schwarz und klarem Vorteil für Weiß/Schwarz: ±0,7253
zwischen klarem Vorteil für Weiß/Schwarz und extremem Vorteil für Weiß/Schwarz: ±1,3453


Alternativer Vorschlag für lediglich 7 Bewertungsbereiche – Schema 1/7 1/7 1/7 1/14 1/14 1/7 1/7 1/7 des Gesamtintegrals:

„Extremer Vorteil für Weiß (+--) oder Schwarz (-++) – NAG $20/$21“ mag nicht jedermanns Sache sein. Für diese Zeitgenossen nun eine mathematische Analyse von 3 Vorteilsbereichen gleicher Quantität jeweils für Weiß/Schwarz. Die Formeln zur Berechnung der Grenzwerte lauten:

zwischen ausgeglichener Stellung und leichtem Vorteil für Weiß/Schwarz:
±((ln(7/3)-ln(2))*x_0_5)/ln(2)
zwischen leichtem Vorteil für Weiß/Schwarz: und moderatem Vorteil für Weiß/Schwarz:
±((ln(7)-2*ln(2))*x_0_5)/ln(2)
zwischen moderatem Vorteil für Weiß/Schwarz: und klarem Vorteil für Weiß/Schwarz:
±((ln(7)-ln(2))*x_0_5)/ln(2)

Im Fall von x_0_5 = 0,62 wären das folgende konkrete Grenzwerte:

zwischen ausgeglichener Stellung und leichtem Vorteil für Weiß/Schwarz: ±0,137
zwischen leichtem Vorteil für Weiß und moderatem Vorteil für Weiß/Schwarz: ±0,5005
zwischen moderatem Vorteil für Weiß und klarem Vorteil für Weiß/Schwarz: ±1,1205

Im interaktiven Formular werden die Stellungsbewertungssymbole und die Grenzwerte zwischen den Symbolen aufgeführt, letztere jeweils in einer eigenen Zeile für jedes der 3 Schemata.

Am Rande noch ein Tipp: Sofern der geneigte Leser die Stellungsbewertungssymbole zu verwenden trachten, ihrer indes nicht habhaft werden sollte, könnte folgender Link auf den AqChessUnicode-Font hilfreich sein. Dieser liegt der Schach-GUI „Aquarium“ bei.

Und wer nicht abgeneigt wäre, diese Schachsonderzeichen zwecks Kommentierung in Texten direkt mit der Tastatur einzugeben und ein Windows-Betriebssystem sein Eigen nennt, mag sich auf dieser Webseite über den „Keyboard Layout Creator“ kundig machen.

Zugbewertungen und NAG- bzw. Informator-Symbole

Als da wären:

brillanter Zug (!!) – NAG $3,
beeindruckender Zug (!) – NAG $1,
ansprechender Zug (!?) – NAG $5,
fragwürdiger Zug (?!) – NAG $6,
schwacher Zug (?) – NAG $2,
miserabler Zug (??) – NAG $4.

Vorbehalt: Diese deutschen Umschreibungen sind wiederum Eigengewächse und selbstredend keineswegs verbindlich.

Es mag abgeschmackt erscheinen, diese Zugbewertungssymbole im Folgenden quasi automatisiert aus Enginebewertungen abzuleiten, da sie häufig anhand eines tieferen Verständnisses der Stellung gewählt werden und sich nicht an Enginebewertungen orientieren. Beispiel: In einer Stellung gibt es ganz offensichtlich nur einen einzigen vernünftigen Zug, den jedes Kind zu finden vermag, alle anderen Züge wären miserabel. Diesem einen Zug nun das Qualitätsmerkmal ‼ zu attestieren, wäre mehr als dämlich. Oder etwas subtiler: In verlorener Position stellt ein objektiv schwacher, also theoretisch widerlegbarer Zug eine Falle, die die Chance zur Wiederbelebung birgt. Ein typischer „interessanter Zug (!?) – NAG $5“, der vielleicht nicht mit „?“ oder dergleichen charakterisiert werden sollte. Gleichwohl kann es durchaus in vielen Fällen sinnvoll sein, aus einem Vergleich der Enginebewertungen für zwei Züge derartige Zugbewertungssymbole zu bestimmen, vor allem dann, wenn keine Gelegenheit besteht, eine Stellung genauer unter die Lupe zu nehmen, etwa bei automatischen Partieanalysen.

Ausgangspunkt für die Bestimmung des Zugbewertungssymbols ist einmal natürlich der reale ausgeführte Zug, zum anderen bei schlechten Zügen der beste Alternativzug, bei guten Zügen der zweitbeste Alternativzug. Für diese beiden Züge ist – wie oben dargelegt – die relevanzreduzierte Bewertungsdifferenz zu ermitteln und diese wiederum in das Zugbewertungssymbol zu übersetzen. Dabei wird der gesamte Bewertungsbereich von -∞ bis +∞, dessen bestimmtes Integral (2*x_0_5)/ln(2) beträgt, in nicht nur 6, sondern 7 oder 8 Bereiche unterteilt. Es gibt ja nicht nur die 6 Bereiche, für die ein Zugbewertungssymbol zu vergeben ist, sondern auch den neutralen Bereich eines Zuges, der in etwa gleichwertig mit dem besten oder zweitbesten Zug ist. Dieser neutrale Bereich geht zur Hälfte in die positive Bewertungsrichtung und zur Hälfte in die negative. Man kann nun entweder einen neutralen Bereich mit demselben Integralbereich wie die nachfolgenden Bereiche verwenden oder einen doppelt so großen neutralen Bereich, der aus 2 Bereichen mit üblicher Integralgröße bestünde, einen für jede Bewertungsrichtung. Entweder wären es dann insgesamt 7 oder aber 8 Integralbereiche (bei letzterer Variante 2 Integralbereiche für den neutralen Bereich).

Wohlgemerkt: Wir sprechen hier von Integralbereichen, also den relevanten Bewertungsdifferenzen, nicht zu verwechseln mit den absoluten Differenzen zwischen 2 Zugbewertungen auf der x-Achse. Letztere fallen bei gegebener relevanter Bewertungsdifferenz ganz unterschiedlich aus, je nachdem, an welcher Stelle sich die Zugbewertungen auf der x-Achse befinden. Je weiter sich diese von der y-Achse, also von der Zugbewertung 0,00 entfernen, desto mehr wächst bei gegebener relevanter Bewertungsdifferenz ihre Distanz zueinander, da die bestimmten Integrale dort flacher ausfallen.

Mathematisch ist es sogar möglich, unter Heranziehung eines bestimmten Gewinn-Remis-Gleichgewichts sowie einer gegebenen Zugbewertung (x_alt) denjenigen Grenzwert einer neuen Zugbewertung (x_neu) zu berechnen, der sich im Fall eines Zuges mit irgendeinem Zugbewertungssymbol ergäbe. Schwer zu verstehen, also ein Beispiel: Gegeben ist ein fehlerhafter Zug von Weiß mit einer Bewertung von -0,30 und ein Gewinn-Remis-Gleichgewicht von 0,62. Ab welcher Bewertung würde sich ein alternativer guter Zug von Weiß gegenüber dem schwachen (und zugleich nächstbesten) Zug ein Zugbewertungssymbol „!!“ verdienen? Je nach dem angewendeten Schema wird die Antwort zum Beispiel 0,50, 0,56 oder 0,21 lauten. Hierzu wird folgende allgemeine Maxima-Formel herangezogen:

if x_alt<=0 and (x_0_5*2^(x_alt/x_0_5))/log(2)+(2*Faktor_plus_minus*x_0_5)/log(2) <= x_0_5/log(2) then
(x_0_5*2^(x_alt/x_0_5))/log(2)+(2*Faktor_plus_minus*x_0_5)/log(2) = (x_0_5*2^(x_neu/x_0_5))/log(2)
elseif x_alt<=0 and (x_0_5*2^(x_alt/x_0_5))/log(2)+(2*Faktor_plus_minus*x_0_5)/log(2) > x_0_5/log(2) then
(x_0_5*2^(x_alt/x_0_5))/log(2)+(2*Faktor_plus_minus*x_0_5)/log(2) = (2*x_0_5)/log(2)-x_0_5/(log(2)*2^(x_neu/x_0_5))
elseif x_alt>0 and (x_0_5*2^(x_alt/x_0_5))/log(2)+(2*Faktor_plus_minus*x_0_5)/log(2) <= x_0_5/log(2) then
-x_0_5/(log(2)*2^(x_alt/x_0_5))+(2*Faktor_plus_minus*x_0_5)/log(2)+(2*x_0_5)/log(2) = (x_0_5*2^(x_neu/x_0_5))/log(2)
else
-x_0_5/(log(2)*2^(x_alt/x_0_5))+(2*Faktor_plus_minus*x_0_5)/log(2)+(2*x_0_5)/log(2) = (2*x_0_5)/log(2)-x_0_5/(log(2)*2^(x_neu/x_0_5))

Der „Faktor_plus_minus“ hängt vom Schema sowie vom Zugbewertungssymbol ab und beinhaltet einen positiven oder negativen Bruchteil des Gesamtintegrals, zum Beispiel bei „!!“ 1/14 + 1/7 + 1/7 = 5/14, 1/8 + 1/8 + 1/8 = 3/8, 1/20 + 2/20 + 2/20 = 1/4 oder 1/12 + 1/12 + 1/12 = 1/4. Bei „??“ wären diese Werte negativ.

In das obige Gleichungssystem müssen neben diesem Faktor noch die konkreten Werte für x_0_5 und x_alt eingegeben werden, damit die maßgebliche Gleichungsalternative ausfindig gemacht werden kann. Und schlussendlich braucht es dann noch eine Auflösung der gefundenen Gleichung nach „x_neu“, was man getrost Maxima per „solve(Gleichung, x_neu), numer“ überlassen kann. Wenn hingegen Maxima nicht zur Verfügung steht, zum Beispiel weil man gerade in einem anderen Computerprogramm steckt, kann man sich der folgenden Formeln zur Ermittlung der maßgeblichen Bewertung „x_neu“ bedienen, wenn denn die korrekte Gleichungsalternative bekannt ist:

für x_alt und x_neu <= 0:

x_neu = (x_0_5*log(2^(x_alt/x_0_5)+2*Faktor_plus_minus))/log(2)

für x_alt <= 0 und x_neu > 0:

x_neu = (x_0_5*log(-1/(2^(x_alt/x_0_5)+2*Faktor_plus_minus-2)))/log(2)

für x_alt > 0 und x_neu <= 0:

x_neu = (x_0_5*log(Faktor_plus_minus*2^(x_alt/x_0_5+1)+2^(x_alt/x_0_5+1)-1)-log(2)*x_alt)/log(2)

für x_alt und x_neu > 0:

x_neu = (x_0_5*log(-2^(x_alt/x_0_5)/(Faktor_plus_minus*2^(x_alt/x_0_5+1)-1)))/log(2)

Wiederum der Hinweis, dass Maxima statt der üblichen Schreibweise ln(x) für den natürlichen Logarithmus die Schreibweise log(x) erfordert. Übrigens auch Javascript („Math.log()“). Sollte man also die obigen Formeln anderweitig verwenden, wäre „log“ durch „ln“ zu ersetzen.

Wie groß sollen nun diese relevanten Bewertungsdifferenzen ausfallen? Man könnte – eventuell mit Ausnahme des neutralen Bereichs – den gesamten Bewertungsbereich in gleiche Teile partitionieren oder die Unterteilung danach ausrichten, dass etwa ein brillanter Zug bereits zu konstatieren ist, wenn er das Gewinn-Remis-Gleichgewicht überschreitet und der nächstbeste Zug mit der Bewertung 0,00 Vorlieb nehmen muss. Die erste Alternative geht mit den Zugbewertungssymbolen eher sparsam um, die zweite ist generöser.

Vorschlag für sparsame Zugbewertungssymbole:

Hier beträgt jeder einzelne der Integralbereiche, womit wiederum nichts anderes als die relevanten Bewertungsdifferenzen gemeint sind, bei
7 Bereichen (2*x_0_5)/(7*ln(2)), im Fall von x_0_5 = 0,62 somit 0,255, und
8 Bereichen x_0_5/(4*ln(2)), im Fall von x_0_5 = 0,62 somit 0,223.

Im nachfolgenden interaktiven Formular wird demzufolge einem Zug zugeordnet

bei 7 Bereichen mit Schema 1/7 1/7 1/7 1/14 1/14 1/7 1/7 1/7 jeweils des Gesamtintegrals ein

!! wenn zwischen seiner Bewertung und der Bewertung des nächstbesten Zuges eine relevante Bewertungsdifferenz von mindestens (0,5 + 1 + 1) x (2*x_0_5)/(7*ln(2)) = (5*x_0_5)/(7*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,638;

! wenn zwischen seiner Bewertung und der Bewertung des nächstbesten Zuges eine relevante Bewertungsdifferenz von mindestens (0,5 + 1) x (2*x_0_5)/(7*ln(2)) = (3*x_0_5)/(7*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,383;

!? wenn zwischen seiner Bewertung und der Bewertung des nächstbesten Zuges eine relevante Bewertungsdifferenz von mindestens 0,5 x (2*x_0_5)/(7*ln(2)) = x_0_5/(7*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,127;

?! wenn zwischen seiner Bewertung und der Bewertung des besten Zuges eine relevante Bewertungsdifferenz von mindestens 0,5 x (2*x_0_5)/(7*ln(2)) = x_0_5/(7*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,127;

? wenn zwischen seiner Bewertung und der Bewertung des besten Zuges eine relevante Bewertungsdifferenz von mindestens (0,5 + 1) x (2*x_0_5)/(7*ln(2)) = (3*x_0_5)/(7*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,383;

?? wenn zwischen seiner Bewertung und der Bewertung des besten Zuges eine relevante Bewertungsdifferenz von mindestens (0,5 + 1 + 1) x (2*x_0_5)/(7*ln(2)) = (5*x_0_5)/(7*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,638;

bei 8 Bereichen mit Schema 1/8 1/8 1/8 1/8 1/8 1/8 1/8 1/8 jeweils des Gesamtintegrals ein

!! wenn zwischen seiner Bewertung und der Bewertung des nächstbesten Zuges eine relevante Bewertungsdifferenz von mindestens (1 + 1 + 1) x x_0_5/(4*ln(2)) = (3*x_0_5)/(4*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,6708;

! wenn zwischen seiner Bewertung und der Bewertung des nächstbesten Zuges eine relevante Bewertungsdifferenz von mindestens (1 + 1) x x_0_5/(4*ln(2)) = x_0_5/(2*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,447;

!? wenn zwischen seiner Bewertung und der Bewertung des nächstbesten Zuges eine relevante Bewertungsdifferenz von mindestens 1 x x_0_5/(4*ln(2)) = x_0_5/(4*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,223;

?! wenn zwischen seiner Bewertung und der Bewertung des besten Zuges eine relevante Bewertungsdifferenz von mindestens 1 x x_0_5/(4*ln(2)) = x_0_5/(4*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,223;

? wenn zwischen seiner Bewertung und der Bewertung des besten Zuges eine relevante Bewertungsdifferenz von mindestens (1 + 1) x x_0_5/(4*ln(2)) = x_0_5/(2*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,447;

?? wenn zwischen seiner Bewertung und der Bewertung des besten Zuges eine relevante Bewertungsdifferenz von mindestens (1 + 1 + 1) x x_0_5/(4*ln(2)) = (3*x_0_5)/(4*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,6708.

Der Vorteil des Schemas mit 8 Bereichen ist der Zugbewertungsübergang von „!?“ zu „!“ exakt am Gewinn-Remis-Gleichgewicht bzw. von „?!“ zu „?“ exakt am negativen Gewinn-Remis-Gleichgewicht, falls die Bewertung des Vergleichszuges 0 beträgt. Im Fall von x_0_5 = 0,62 wird also zum Beispiel bei Ausführung eines korrekten Zuges mit Bewertung 0,62 und einem nächstbesten Zug mit Bewertung 0,00 die Zugbewertung „!“ lauten, während im Falle einer Bewertung von 0,61 für den korrekten Zug die Zugbewertung mit weniger euphorischen „!?“ ausfiele.

Natürlich kommen solche Zugbewertungssymbole nur zum Tragen, wenn überhaupt entsprechend hohe bestimmte Integrale – pardon: relevante Bewertungsdifferenzen – zur Verfügung stehen. Ein korrekter Zug von Weiß mit einer Enginebewertung von -10,00 wird sich kaum ein „!?“, „!“ oder „!!“ verdienen, selbst wenn der zweitbeste Zug bei -100,00 liegt. Diese positive Bewertungsdifferenz ist schlicht irrelevant und daher wird sie mit einer relevanten Bewertungsdifferenz von annähernd 0,00 quittiert. Eine verlorene Stellung ist und bleibt verloren, selbst mit den besten Zügen. Das ist eben der Effekt der Bewertungsrelevanzreduktion.

Vorschlag für generöse Zugbewertungssymbole:

Hier sind die einzelnen Integralbereiche recht unterschiedlich verteilt. Im nachfolgenden interaktiven Formular wird einem Zug zugeordnet

beim Schema 5/20 2/20 2/20 1/20 1/20 2/20 2/20 5/20 jeweils des Gesamtintegrals ein

!! wenn zwischen seiner Bewertung und der Bewertung des nächstbesten Zuges eine relevante Bewertungsdifferenz von mindestens (1 + 2 + 2) x (x_0_5/(10*ln(2)) = x_0_5/(2*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,447;

! wenn zwischen seiner Bewertung und der Bewertung des nächstbesten Zuges eine relevante Bewertungsdifferenz von mindestens (1 + 2) x (x_0_5)/(10*ln(2)) = (3*x_0_5)/(10*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,268;

!? wenn zwischen seiner Bewertung und der Bewertung des nächstbesten Zuges eine relevante Bewertungsdifferenz von mindestens 1 x x_0_5/(10*ln(2)) = x_0_5/(10*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,089;

?! wenn zwischen seiner Bewertung und der Bewertung des besten Zuges eine relevante Bewertungsdifferenz von mindestens 1 x x_0_5/(10*ln(2)) = x_0_5/(10*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,089;

? wenn zwischen seiner Bewertung und der Bewertung des besten Zuges eine relevante Bewertungsdifferenz von mindestens (1 + 2) x (x_0_5)/(10*ln(2)) = (3*x_0_5)/(10*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,268;

?? wenn zwischen seiner Bewertung und der Bewertung des besten Zuges eine relevante Bewertungsdifferenz von mindestens (1 + 2 + 2) x (x_0_5/(10*ln(2)) = x_0_5/(2*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,447;

beim Schema 3/12 1/12 1/12 1/12 1/12 1/12 1/12 3/12 jeweils des Gesamtintegrals ein

!! wenn zwischen seiner Bewertung und der Bewertung des nächstbesten Zuges eine relevante Bewertungsdifferenz von mindestens (1 + 1 + 1) x x_0_5/(6*ln(2)) = x_0_5/(2*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,447;

! wenn zwischen seiner Bewertung und der Bewertung des nächstbesten Zuges eine relevante Bewertungsdifferenz von mindestens (1 + 1) x x_0_5/(6*ln(2)) = x_0_5/(3*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,298;

!? wenn zwischen seiner Bewertung und der Bewertung des nächstbesten Zuges eine relevante Bewertungsdifferenz von mindestens 1 x x_0_5/(6*ln(2)) = x_0_5/(6*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,149;

?! wenn zwischen seiner Bewertung und der Bewertung des besten Zuges eine relevante Bewertungsdifferenz von mindestens 1 x x_0_5/(6*ln(2)) = x_0_5/(6*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,149;

? wenn zwischen seiner Bewertung und der Bewertung des besten Zuges eine relevante Bewertungsdifferenz von mindestens (1 + 1) x x_0_5/(6*ln(2)) = x_0_5/(3*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,298;

?? wenn zwischen seiner Bewertung und der Bewertung des besten Zuges eine relevante Bewertungsdifferenz von mindestens (1 + 1 + 1) x x_0_5/(6*ln(2)) = x_0_5/(2*ln(2)) liegt, im Fall von x_0_5 = 0,62 somit 0,447.

Die Grenzwerte zwischen den Symbolen werden im interaktiven Formular nach den Zeilen mit den Schemata aufgeführt, sofern es die Algebra hergibt. Falls nicht, wird die Zeichenfolge „------“ ausgegeben. Die Reihenfolge der Grenzwerte resultiert aus derjenigen der Zugbewertungssymbole !! ! !? ?! ? ?? mit dem korrekten oder fehlerhaften Zug als Ausgangspunkt.

Der Faktor Mensch

Das Gewinn-Remis-Gleichgewicht in Höhe von circa 0,62 oder 0,52 oder 0,60 gilt wohlgemerkt für weitgehend optimales Schachspiel, wie es Schachengines wie etwa Stockfish heutzutage praktizieren, nicht jedoch für Schachspieler, nicht einmal für Großmeister, die auch viel zu häufig Bockmist spielen und daher mit einem deutlich höheren Gewinn-Remis-Gleichgewicht Vorlieb nehmen müssten. Der Einwand, dass diese Maßzahl doch durch die Patzer ihrer Gegner der Gattung Homo sapiens wieder gedrückt würde, vermag nicht zu verfangen. Eine suboptimale Schachkunst kann nicht durch das suboptimale gegnerische Spiel aufgewertet werden. Menschliche Schachspieler müssten sich schon den besten Schachengines stellen, um ihr wahres Gewinn-Remis-Gleichgewicht zu bestimmen. Großmeister gehen solchen Vergleichen mehr und mehr aus dem Wege, um Blamagen zu entgehen. Von Gewinnen könnte dabei schon gar keine Rede mehr sein und auch Remisen wären rar gesät. Blieben nur mehr Vorgabepartien. Mit ihnen ließe sich austesten, wie viele Bauern dem Computergegner in der Anfangsstellung weggenommen werden müssten, um dem ungeschoren gebliebenen Meister Gewinne und Remisen in nennenswertem Umfang zu ermöglichen. So ließe sich dann doch noch das großmeisterliche Gewinn-Remis-Gleichgewicht bestimmen.

Da nun mal derartiges Partiematerial aus Begegnungen zwischen Mensch und Maschine nicht zur Verfügung steht, verbleibt gegenwärtig und vermutlich auch auf ewige Zeiten nur die halbgare Möglichkeit, Partien zwischen Menschen auszuwerten. Wobei man immer im Auge behalten sollte, dass die daraus resultierenden Ergebnisse durch die zweifelhafte Spielweise des Gegners verwässert wurden. Schwamm drüber.

Gesagt, getan per Analyse von 144 WM-Kämpfen zwischen Karpov und Kasparov in den Jahren 1984 bis 1990. Die allerletzte Partie bleibt unberücksichtigt, da Kasparov dort bei deutlichem Vorteil mit Karpov ein Remis vereinbarte, obwohl der Gewinn – wie es im Schachslang heißt – nur eine Frage der Technik war. Ihm genügte halt ein Remis zum Gewinn des WM-Titels. Alle Partien wurden von Stockfish bei kurzer Bedenkzeit mit einer Tiefe von durchschnittlich knapp über 20 Halbzügen oberflächlich analysiert.

Um es kurz zu machen: Kasparov gewann 21 Mal, Karpov 19 Mal. Die 21 bzw. 19 höchsten Bewertungen in Remispartien lagen bei Kasparov zwischen 3,67 und 1,00, bei Karpov zwischen 7,80 und 1,04. Wer mag, kann daraus ein Gewinn-Remis-Gleichgewicht von mindestens 1,00 ablesen …

Ach ja, noch eine Besonderheit, die bei Stockfish-Partien kaum zu Tage tritt: In 5 Partien wurde trotz einer positiven Bewertung von mindestens 1,26 die Partie noch in den Sand gesetzt. Und 1,26 bedeuten nach den oben dargestellten Vorgaben zumindest klaren Vorteil. Aber wohl weniger für Großmeister. Kasparov vergeigte die 18. Partie im WM-Kampf 1986 sogar trotz eines deutlichen 3,67! Das muss ihm erst einmal jemand nachmachen. Man sollte hier also den Begriff Gewinn-Remis-Gleichgewicht besser ersetzen durch Gewinn-Remis/Verlust-Gleichgewicht.


Bewertungs-Relevanz-Reduktion







 Eingaben - jeweils in Bauerneinheiten im Format "(-##)#(,##)" 





 Resultate: Bewertungsdifferenzen 

 Probabilistische Partieresultate 
 bei korrektem Zug 


 bei fehlerhaftem Zug 



 Stellungsbewertungssymbole: +–– +– ± ⩲ = ⩱ ∓ –+ –++
 Schema 5/40 5/40 4/40 4/40 4/40 4/40 4/40 5/40 5/40 



 Schema 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 



 Schema 1/7 1/7 1/7 1/7 1/7 1/7 1/7 




 Zugbewertungssymbole: !! ! !? ?! ? ?? 
 2 sparsame Schemata bei korrektem Zug 



 2 generöse Schemata bei korrektem Zug 



 2 sparsame Schemata bei fehlerhaftem Zug 



 2 generöse Schemata bei fehlerhaftem Zug 






Exkurs: „Remisbreite“

Der immer wieder herumgeisternde Begriff „Remisbreite“ soll hiermit ein wenig unter die kritische Lupe genommen werden. Denn mit ihm wird ja suggeriert, dass er mit dem Bewertungsbereich „ausgeglichene Stellung oder Remis (=) – NAG $10“ zusammenfallen würde. Zum Leidwesen des Lesers tritt jedoch ein reichlich verschiedenartiges Verständnis dieses Begriffs zu Tage.

1. Variante:

„Houdini beharrt auf Txc6 und gibt in Tiefe 25 eine Bewertung 0.76 + an, womit die Remisbreite vermutlich noch nicht überschritten ist.“ (http://forum.computerschach.de/ Thema Endspielkönnen gefragt Von Joe Boden Datum 2013-02-09 13:03)

„Man glaubt also bei Houdini, ein (gewonnenes) Endspiel sei noch in der Remisbreite, wenn er +0.80 anzeigt ...“ (Schachfeld).

Damit wird suggeriert, anhand einer Stellungsbewertung einer Schachengine im niedrigen Bereich ließe sich eine Aussage über den Remisausgang der Partie treffen. Nun fängt ja jeder Partiegewinn mal klein an, nämlich mit einem minimalen Vorteil, selbst vielleicht schon nach dem ersten Zug. Und wenn man dann nach einer solchermaßen gewonnenen Partie die Schachengine auf die ersten Züge ansetzt und sich von ihr überzeugen lässt, dass die Partie keineswegs mit einem Anzugsvorteil von deutlich mehr als +0,80 startete, wird man vielleicht ins Grübeln kommen. Und der Konter per späterer Fehlzüge, die das Desaster ausgelöst haben sollen, verfängt da wenig, wenn der Patzer z. B. Stockfish heißt und eine ELO von annähernd 3500 hat. Man führe sich die TCEC-Verlustpartien von Stockfish zu Gemüte. Dort wird man jede Menge von Partien finden, die für diese Engine trotz einer negativen „Remisbreite“ von circa -0,76 oder -0,80 im Desaster endeten, obwohl sie ja nicht gerade dafür bekannt ist, mit ihren Stellungen innerhalb der angeblichen „Remisbreite“ fahrlässig umzugehen. Wer sonst außer Stockfish sollte in der Lage sein, solche Stellungen Remis zu halten?

2. Variante:

„Wenn während einer Partie keine Seite gewinnbringenden Vorteil hat, dann sagt man auch, „die Partie befindet sich innerhalb der Remisbreite“.“ (Wikipedia).

„Remisbreite
Spielraum für eine Stellungsbewertung, die bei bestem Spiel auf beiden Seiten letztendlich zum Remis führen wird. Im Beispiel steht Weiß schlechter, befindet sich allerdings noch in der Remisbreite, da er mit seinem König die Umwandlung des Bauern verhindern kann. Käme er aber auf die Idee 1.Kh1 zu spielen, z.B. in der Hoffnung auf 1...f2 und Patt, hätte er die Remisbreite verlassen und Schwarz könnte nun bei bestem Spiel den Sieg erzwingen, und zwar durch 1...Kg4 samt Gewinn der Opposition. Ob sich die Grundstellung des Schachspiels in der Remisbreite befindet, oder ob vielleicht Weiß den Sieg erzwingen könnte, ist zu komplex, um beantwortet werden zu können.“ (www.schwachspieler.de).

Hier wird mit „Remisbreite“ ein ominöser „Spielraum für eine Stellungsbewertung“ in Verbindung gebracht bei einem erzwungenen Remis durch bestimmte Züge bei bestem Spiel, das sich anscheinend beweisen lässt. Im Zusammenhang mit einem nachweislichen Remis jedoch das Wort „Breite“ auch nur in den Mund zu nehmen, zeugt von verquerer Logik. Remis ist 0,00, nichts anderes. In diesem Fall müsste ein Schachprogramm nicht nur eine Stellungsbewertung von 0,00, sondern auch eine oder mehrere Remisvarianten abliefern, die nach den Denkgesetzen oder nach Endspiel-Tablebases zwingend sind. Sowas geht nur in speziellen Stellungen, insbesondere in allen maximal 7-Steiner-Stellungen, die komplett ausanalysiert sind, alle anderen sind eben so komplex, dass man sich mit einer Stellungsbewertung zwischen Null und Matt begnügen muss, ohne daraus irgendwelche zwingenden Schlüsse auf den Partieausgang ziehen zu können. Und wenn ein Schachprogramm in einer wirklichen Remisstellung eine von 0,00 abweichende Larifari-Bewertung zeigen würde, hätte das Programm ein Code-Problem und würde dies nicht den alogischen Begriff „Remisbreite“ rechtfertigen.

Wäre ein Remis wie üblich nicht nachweisbar, sollte man schon gleich gar nicht mit dem Begriff „Remisbreite“ eine angebliche Kenntnis vorgaukeln, die man angesichts der Komplexität einer Schachpartie gar nicht haben kann. Dann regiert hinsichtlich aller Erwägungen über den Partieausgang nur noch die Statistik (das eigentliche Thema dieses Artikels) und Eröffnungssammlungen mit Gewinn-, Remis- und Verlustquoten ein und derselben Stellung können davon ein Lied singen.

Kommentareingabe - edit comment:

Name*
Vorname
Kommentar*
Comment*
Email
Homepage
Telefon
Code *
neu laden / reload

 

vionlink comments by vision impress webdesign






 

Finito ♦ Aus die Maus ♦ Schicht im Schacht ♦ Klappe zu - Affe tot

So long ♦ See You Later, Alligator - In A While, Crocodile ♦ Over And Out