Spielstärke ist eine Sache

by on01. Juli 2013

Gut spielen ist eine Sache und kann sicher nicht schaden - wichtiger und turnierentscheidend ist aber, besser (oder eventuell nur weniger schlecht) zu spielen als der jeweilige Gegner. Und wenn der Gegner auch gut spielt, landet man im Tabellenkeller ohne selber allzu viel falsch gemacht zu haben? Das wird ein etwas anderer Rückblick auf Tal Memorial - Basis sind Daten von IM Ken Regan die er hier veröffentlichte, dann meine eigene simple statistische Analyse, dann einige Gedanken dazu. Das Ergebnis des Turniers setze ich als bekannt voraus, man findet es aber auch in Ken Regans Liste die ich erst mal kopiere:


Report from MoscowTalMem2013cat22AllR3d13L, excluding repeats and |prev-eval| > 3

IPR error bars are +- 200-250 typically (two-sigma)
First-line matches to Rybka 3 1-cpu at depth 13:

Player Name Matches/Turns = Pct., AE, IPR Opponents' figures Diff, Score

--------------------------------------------------------------------------------------------
Anand, Viswanat: 173/274 = 63.10%, 0.0499, 2837 178/275 = 64.70%, 0.0444, 2926 -89, -2
Andreikin, Dmit: 140/228 = 61.40%, 0.0326, 2960 134/226 = 59.30%, 0.0448, 2878 +82, +1
Carlsen, Magnus: 162/296 = 54.70%, 0.0361, 2932 167/296 = 56.40%, 0.0398, 2834 +98, +2
Caruana, Fabian: 218/379 = 57.50%, 0.0375, 2855 203/383 = 53.00%, 0.0476, 2731 +124, +1
Gelfand, Boris : 140/223 = 62.80%, 0.0390, 2988 118/219 = 53.90%, 0.0596, 2611 +377, +3
Karjakin, Serge: 220/413 = 53.30%, 0.0413, 2724 220/413 = 53.30%, 0.0371, 2837 -113, -1
Kramnik, Vladim: 142/242 = 58.70%, 0.0493, 2841 155/243 = 63.80%, 0.0337, 2926 -85, -3
Mamedyarov, Sha: 149/252 = 59.10%, 0.0384, 2946 147/252 = 58.30%, 0.0457, 2810 +136, +1
Morozevich, Ale: 189/357 = 52.90%, 0.0573, 2641 221/359 = 61.60%, 0.0426, 2898 -257, -2
Nakamura, Hikar: 164/283 = 58.00%, 0.0674, 2568 154/281 = 54.80%, 0.0613, 2691 -123, =

Totals for all players in MoscowTalMem2013cat22AllR3d13L: 1697 / 2947 = 57.58%

Aggregate difference in MoscowTalMem2013cat22AllR3d13L: 132.8752 / 2947 = 0.0451
Overall tourney IPR: 2819 +- 50, avg. rating 2777 (Cat. 22), diff +42.

ipr

Tabelle nochmal als Bild


IPR ist "intrinsic performance rating", AE ist "average scaled error per move". Um Missverständnissen vorzubeugen: "Gut" und "schlecht" ist im weiteren Text relativ, bezogen auf dieses Teilnehmerfeld. Eine ähnliche Analyse wäre denkbar für ein Amateurturnier, wobei man dann bei allen IPRs die erste 2 durch eine 1 ersetzen müsste. Unter "Anwendungen" (2 Applications) nennt Regan in seinem Research Prospectus jede Menge. "Cheating testing" ist wohl (leider) am bekanntesten, spielt aber hier keine Rolle - ich gehe davon aus, dass beim Tal Memorial alles mit rechten Dingen zuging. Zuerst erwähnt er "Skill assessment" - sowohl allgemein als auch in bestimmten Stellungen z.B. Endspiele, taktische und positionelle Stellungen, Angriff und Verteidigung. Dann "Player training" - wenn man Schwachpunkte erkannt hat, kann man gezielter daran arbeiten? Irgendwann auch noch der Einfluss verschiedener Bedenkzeiten auf die Qualität der Partien, darauf werde ich später kurz eingehen.

Gelfand-trophy
 

Turniersieger Boris Gelfand (Quelle: Turnierseite)

Eine Zahl bzw. einen Spieler hat Regan fett hervorgehoben. Dazu kann ich mich kurz fassen: Gelfand hat demnach am besten gespielt, und seine Gegner gegen ihn am schlechtesten. Letzteres bedeutet wohl vor allem, dass sie in manchen Stellungen nicht zurecht kamen, dann sind Fehler quasi unvermeidlich. Also hat Gelfand völlig verdient gewonnen, und das mit (fast) 45 Jahren: seinen Geburtstag feierte er tags danach, das schönste Geschenk machte er sich selbst. Interessanter sind drei andere Spieler, dazu drei Excel-Grafiken:

Wie wichtig ist es, selbst gut zu spielen?

IPR vs points

Es schadet natürlich nicht, beeinflusst das Ergebnis jedoch (statistisch gesehen) nur zu 31%. Was auffällt: Kramnik und Anand haben "eigentlich" viel besser gespielt als ihr Ergebnis vermuten lässt, und Nakamura deutlich schlechter. Die anderen sieben Spieler definieren eine saubere Regression mit r2=0,87.

Welchen Einfluss hat das gegnerische Niveau?

Opponent IPR vs points

Das sieht schon etwas besser aus und kann immerhin 53% des Endstands erklären. Das heisst, Partien werden eher durch gegnerische Fehler entschieden als durch brilliante eigene Züge? Im vorderen Mittelfeld liegen die Datenpunkte aber irgendwo, und Nakamura hält sich am wenigsten an die statistischen Regeln. Klar, wer selbst auch schlecht spielt profitiert nur bedingt vom schlechten gegnerischen Spiel. Wenn man "Own IPR" und "Opponent IPR" zusammen betrachtet, spielten alle anderen ein Superturnier - Nakamura UND seine jeweiligen Gegner dagegen quasi Wijk aan Zee B.

Kann beides zusammen alles erklären?

Delta IPR vs points

Sagen wir, fast alles, immerhin 73%. Aber auch hier haben vier Spieler (Kramnik, Anand, Karjakin und schon wieder Nakamura) vergleichbar schlechter gespielt als ihre Gegner und bekamen dafür drei bis viereinhalb Punkte. Und womit kann man die übrigen 27% erklären?

Nun, ich habe Regans Daten bisher wortwörtlich genommen - was er selber nicht tut, da ist ja der recht grosse Fehlerbalken von +200/-250. Allerdings fällt Nakamura in der ersten Grafik selbst dann unter die Regressionsgerade, wenn man seine IPR auf 2768 anhebt. Ausserdem sind es immer Durchschnittswerte, einzelne Partien oder Partiephasen können davon ziemlich abweichen. Und das war wohl vor allem bei ihm der Fall:

Nakamura schlechte Laune

Nakamura mit am Ende +4=1-4 (Quelle: Turnierseite) - das Foto stammt aus dem Bericht zur neunten und letzten Runde. Auch die Form seines Rasierapparats schwankte während dem Turnier.

Wenn er alle Partien auf Niveau IPR 2568 gespielt hätte, wäre er sicher souverän Letzter geworden. Einige Male war er aber wohl deutlich besser (IPR 2900?), und andere Male noch schlechter (IPR 2250?). Bei vergleichbarem Durchschnittswert und noch extremerer Verteilung - sieben Glanzpartien mit IPR 3000 und zwei Anfängerpartien mit IPR 1200 - kann man das Turnier sogar gewinnen, das sollte reichen für +4 oder +5.

Und was war los bei Anand und Kramnik? Laut Ken Regan haben ihre Gegner nahezu perfekt gespielt - da half es auch nicht, dass ihre eigene IPR knapp über dem Mittelwert aller Spieler lag (der allerdings von Nakamura und Morozevich kräftig gedrückt wurde). Waren sie gegen die (Ex-)Weltmeister besonders motiviert, zumal früh deutlich wurde, dass diese in diesem Turnier verwundbar waren? Kramniks IPR-Schnitt wurde aber vielleicht durch seine Partie gleich in der ersten Runde gegen Carlsen angehoben - die war relativ lang, und lange spielte (auch) er fehlerfrei bevor er am Ende doch - für seine Verhältnisse kräftig - daneben griff. Und Anand spielte eine völlig perfekte Remispartie gegen Karjakin, in der er wohl nur seine Vorbereitung reproduzieren musste. Da folgten beide übrigens - vielleicht ohne es zu wissen - bis zum Schluss zwei Fernpartien zwischen Spielern mit Elo ca. 2400.

Kleiner Exkurs: Je länger die Bedenkzeit, desto höher das Niveau? Im Blitz spielt wohl jeder schlechter als mit klassischer Bedenkzeit. Wenn zwei Spieler bei klassischer Bedenkzeit ebenbürtig sind und einer von beiden im Blitz deutlich besser ist, bedeutet es, dass Spieler X 90% seiner Spielstärke behält und Spieler Y nur 75%? Bei klassischer Bedenkzeit kann es blinde Flecke geben: man verwirft zwei oder drei Züge und spielt dann - da die Uhr tickt und man sich irgendwann entscheiden muss - einen vierten noch schlechteren, ohne ihn genauer zu überprüfen. Sonderfall ist: man will gewinnen, zwei drei Züge führen (vermeintlich) zum Remis, der gespielte vierte dann zum Verlust. Spontan fallen mir drei Beispiele ein, jeweils zu einem frühen Zeitpunkt in der Partie: Gelfand-Kramnik im Kandidatenturnier (18.-Se8?? blieb für Vlad ohne Folgen), Carlsen-Caruana beim Tal Memorial 2013 (da musste Carlsen sich nach 17.Sc5? noch anstrengen, um die Partie tatsächlich zu verlieren - wobei Caruana die Tablebase-Phase perfekt spielte), und Richter-Laan einige Etagen tiefer (da war nach 17.Td3?? sofort Schluss). Im Fernschach gibt es ähnliches sicher nicht (oder es war ein Schreibfehler).

Auch ohne Ken Regans Daten ist die Korrelation zwischen Elo und Ergebnis übrigens mit Carlsen Null, und ohne Carlsen eher negativ. Carlsen sprengt ja die Eloskala und spielte in diesem Turnier sicher nicht schlecht, aber auch keinesfalls überragend. Vom Rest spielten Kramnik und Anand unter ihren Elo-Verhältnissen, und neben Gelfand auch Andreikin recht deutlich darüber - wobei Andreikin demnächst in Dortmund auch mal auf Gewinn spielen "muss" statt immer (sogar gegen Nakamura) immer solide auf Remis. Nur Kramnik unterbrach Andreikins Remisserie ... .

schachseminareanzeigeIn meiner "Turniervorschau" (geschrieben nach der dritten Runde, da war manches bereits von der Wirklichkeit überholt) hatte ich Gelfand als Favoriten für den letzten Platz genannt - nicht weil ich ihm das gönnte oder wünschte, aber einer muss eben in diesem starken Feld Letzter werden, und Andreikins Ergebnis war/ist für mich keine Überraschung. Damit lag ich voll daneben, ebenso mit Kramnik als Kandidat für den Turniersieg (hatte sich schon nach zwei Runden erledigt) - jetzt hat er knapp einen Monat Pause bis Dortmund, vielleicht genug um sich von den Strapazen des Kandidatenturniers zu erholen. Nakamura und Morozevich hatte ich, bei entsprechend schlechter Form, auch als Kandidaten für den letzten Platz betrachtet, und IPR gibt mir da Recht. 

Zum Schluss: Mindestens einem Leser ist aufgefallen, dass ich inzwischen auch für den Schach-Ticker schreibe. Das heisst sicher nicht, dass ich "gewechselt" bin - auch hier werde ich weiterhin schreiben: einige Ideen habe ich noch, nun noch Zeit um diese umzusetzen ... . In der Praxis ist es wohl abwechselnd, da ich demnächst "dort" auch für den FIDE Grand Prix in Berlin Beijing zuständig bin.

Die Teilnahme an unserer Kommentarfunktion ist nur registrierten Mitgliedern möglich.
Login und Registrierung finden Sie in der rechten Spalte.