Spielstärke Maßzahlen – Teil 4

Sicher hatte man beim Herangehen an die Vorstellung dieses Systems gewisse Erwartungen. Aus Erfahrung weiß man, dass eine derartige Idee eigentlich nur auf Widerstand stoßen kann. Kasparov schreibt in seiner Buchserie „My great Predecessors“ einmal, dass er eine unglaubliche Kombination gefunden hatte, natürlich mit einem Opfer eingeleitet, und dass ihm diese Kombination von allen Seiten um die Ohren gehauen werden sollte. Warum die Konkurrenz nun, anstatt womöglich Beifall zu klatschen, einzig Freude daran hatte, die Fehlerhaftigkeit der Kombination aufzudecken, sich lediglich mühte, eine Verteidigungsidee zu finden, und selbst wenn es im Variantendschungel nur diesen einen winzig schmalen Grat gegeben haben sollte, den man nur mit übermenschlichen Kräften zu finden imstande wäre, und welcher auch, bei optimaler Spielführung beiderseits, nur im Remis (und nicht etwa in Gegners Sieg) mündet, dann, so die Überzeugung, würden sie wieder ruhig in den Schlaf finden, während sie andernfalls etwas quälen (dies eine eigene Weiterleitung der Gedanken), beantwortete er so:

„Brillance always seems to cause some kind of envy.“ Die Brillanz erzeugt Neid. Er führt weiter, dass sich jeder irgendwie die Frage aufwirft: „Why can´t I do that?“ Warum bin ich nicht darauf gekommen? Es kann nicht gut sein, so ist man überzeugt.

Nun ist dies eine kleine Geschichte, nur eine, zur Einleitung, zum Aufwärmen, zum Schmunzelnd vielleicht, und soll um Gottes Willen nicht zu irgendeinem Vergleich herhalten, am allerwenigsten mit der eigenen Person.

Es war jedoch bereits erwähnt, dass man mit der Aufdeckung von Schwachstellen rechnen würde, dass sie, speziell von dem Mathematiker, dem das System ursprünglich vorgestellt war (in ziemlich anderer Form) sogar in gewisser Weise gelungen war („das gibt es schon, Herr Paulsen!“), dass man aber dennoch bei der Überzeugung blieb, dass es besser ist als das verwendete System, und also zu dem Entschluss gelangte, es einmal darzulegen.

Nun stellte sich weiterhin die Frage, in welcher Form man es hier anbieten könnte. Auch damit hat man sich beschäftigt, vor allem in Absprache mit dem Betreiber der Webseite. Kürzere Texte, so das (eine) Zauberwort. Das andere war jenes: nur keine Formeln (dies eine eigene Überzeugung, dass es nicht gerade anziehen wirkt mit denselben). Also: verbal erörtern, herleiten, logisch erklären.

Die kleineren Häppchen bedeuten lange nicht, dass man auf noch ausstehende (oder eben in den Kommentaren gestellte) Fragen keine Antworten wüsste. Andererseits ist es ja unmöglich, ALLE Probleme auf einmal aus der Welt zu schaffen. Wie ginge das? Nur in einem kompletten Text, und dieser sollte ja gerade vermieden werden.

Also: man fühlt sich in einer Schusslinie und weiß nicht recht, wie man in sie geraten ist.

Ein weiteres Zauberwort lautet übrigens so: Kompetenz. Wie erlangt man sie? Es gibt hierzulande eine Neigung, diese ausschließlich an akademischen Graden festzumachen. Da diesseits der Tastatur kein derartiger Grad ins Feld geführt werden kann – und der kritische Leser vermutlich darüber sehr wohl informiert ist – wird eh alles in Frage gestellt. Es kann ja gar nicht stimmen, was der Mann schreibt, da er nachweislich von nichts eine Ahnung hat. Nun ja, in diesem Problem sah man zweifellos die größte Hürde (und fühlt sich bestätigt). Insofern jedoch dienten die kleinen, kurzen Textpassagen bisher der möglichen Zusprache einer gewissen Kompetenz. Möglich, dass dieser Versuch bereits jetzt als gescheitert angesehen werden muss.

1) Eine einfache Überprüfungsmöglichkeit für die Formel

kurz vorher noch einmal die „Formel“. Man dividiert seine Spielstärke p1 durch 1-p1, also p1/(1-p1). Dieser Quotient ist die Maßzahl für das Verhältnis von gewonnenen Punkten zu abgegebenen Punkten. Für den Gegner tut man das gleiche. Sein Quotient ist p2/(1-p2). Diese beiden Quotienten dividiert man durcheinander und erhält den Quotienten q. Dieses Ergebnis q ist die Zahl, in welchem Verhältnis sich die 100 zu vergebenden Prozente aufteilen müssten. Um also für beide Seiten ihre Prozentzahlen zu ermitteln muss man nun 1/(q+1) errechnen. Dies ist die eigenen Erwartung, Der Gegenwert 1- 1/(q+1) davon ist die Erwartung des Gegners. Die Summe der beiden Erwartungen ist 1.

Es wurden also derartig viele Kritikpunkte angefunden, allesamt untermauert mit Kommentar Verfassers eigener, überragender und jene des ursprünglichen Autors weitaus in den Schatten stellender Kompetenz (welche sich oftmals in der Bombardierung mit Formeln und Zitaten, also rein und anerkannt „wissenschaftlicher Arbeit“, darstellt), dass man kaum weiß, wo man anfangen soll mit der Aufarbeitung.

In Teil 3 war zu lesen, dass die Formel stimmt und nicht weiter überprüft werden müsse. Nun ist dies anerkanntermaßen unzulässig, wie angemerkt wurde. Nur war es eben andererseits nicht geplant, einen Formelwald zu hinterlassen. Wie man auf Formeln kommt, dies muss jeder, der daran Freude hat, für sich selbst herausfinden. Man spürt, dass es eine korrekte, richtige Verrechnungsmöglichkeit der verfügbaren Größen gibt und man muss sich dieser annähern. Sofern die Verrechnungsmöglichkeit fehlerhaft ist, wird es sich recht bald herausstellen.

Eine exzellente Möglichkeit, es herauszufinden, besteht immer darin, Anforderungen an das System für Trivialfälle zu überprüfen: erfüllt sich das, was ich als Ergebnis erwarte, in jedem dieser einfachen Fälle?

Hier gibt es zwei Trivialfälle: der eine ist der, dass vor einer Schachpartie einer der beiden Spieler 50% als Spielstärke hat. Hier war die Voraussetzung gemacht, dass die Spielstärke eines jeden Spielers ausdrücken soll, wie viel Prozent er gegen den Durchschnittsspieler erzielt (oder besser: zu erzielen erwartet). Insofern müsste man, bei Einsetzen in die Formel der Werte „eigene Spielstärke“ und „Gegners Spielstärke bei 50%“ als Ergebnis eine Erwartung für die Partie in Höhe der eigenen Spielstärke herausbekommen.

Dies ist auf einfachste Weise erfüllt: man dividiert, laut Formel, die eigene Prozentzahl, also die SpielSTÄRKE, durch die abgegebenen Prozente, in dem Sinne also die „SpielSCHWÄCHE“. Dieser Quotient ist eine Verhältniszahl, welche die Spielstärken untereinander vergleichbar macht. Wenn man dies für beide Spieler tut, dann erhält man für den Spieler mit den 50% einen Quotienten von 1 (50/50=1). Bei Division des eigenen Verhältniswertes durch 1 bleibt man stets auf seinem eigenen Verhältniswert. Wenn man nun die Erwartung zurückrechnet auf 100%, so hat man exakt die eigene Spielstärke als Erwartung für die Partie gegen den Durchschnittsspieler. Trivialfall 1: die Formel erfüllt die Bedingung.

Der andere Fall ist der, zwei gleich starke Spieler gegeneinander antreten zu lassen. Nun ist der Fall auch hier denkbar einfach: man erhält für beide den gleichen Quotienten bei der oben beschriebenen Division, dividiert man diese beiden Quotienten durcheinander, so erhält man garantiert eine 1, wenn man diese 1 nun auf 100% aufteilen möchte (nach der angegebenen Formel: 1/(1+1)), so erhält man eine 1/2 beziehungsweise eine 50% Erwartung für beide Spieler.

Nichts anderes hätte man (abgesehen von der Schwarz-Weiß Problematik, die später erörtert werden soll) zu erwarten: zwei gleich starke Spieler haben gegeneinander jeweils 50%. Also: Trivialfall 2 ist ebenfalls von der Formel abgedeckt.

Ein sehr gutes Indiz dafür, dass die Formel richtig ist. Bei weiteren wesentlichen Berechnungen stellt man im Übrigen fest, dass man niemals den Bereich 0 bis 1 verlassen kann. Auch dies ein Kriterium für Stimmigkeit.

Rein intuitiv, und da möge man sich an die eigene Kindheit entsinnen, bringt übrigens die Formel genau das zum Ausdruck, was eben Kinder ab und an untereinander sagen: „Ich bin 10 Mal besser als du.“ Wenn es tatsächlich so ist, so wäre die Aufteilung nicht etwa 90:10, denn das wäre ja nur 9 Mal so gut, sondern tatsächlich müsste sie sein 90.9090 : 9.0909, wie man ziemlich einfach, allein an den beiden Zahlen sieht: sie dividieren sich mit dem Ergebnis 10.

Ergeben täten sich diese Werte auf höchst vielfältige Weise (wie man in einem selbstverständlich kritischen Kommentar auch auf komplizierteste Art hergeleitet, mühsamst erkennen konnte). Es gäbe dementsprechend keine ganz schlichte Funktion, an der man erkennen könnte, dass man nun gerade gegen einen derartigen Gegner die Erwartung von 90.0909 hätte. Andererseits: wozu bräuchte man diese?

Die angegebene Formel ist so einfach, dass sie jeder Schachspieler ohne jeglichen Aufwand innerhalb von kürzester Zeit erlernt hätte und sie damit stets zur Hand hätte, um die Erwartung in seiner anstehenden Partie zu bestimmen. Und dies, so sei versichert, steht im sehr krassen Gegensatz zur Elo-Formel, bei der selbst die vereinfachte Form (welche durch die Vereinfachung noch dazu unrichtig ist) kaum je einer aus dem Ärmel schütteln könnte.

2) Die Notwendigkeit eines Prognosesystems

Eventuell darf man ja, zur Erlangung von Kompetenz, eine kleine Vorgeschichte aus dem eigenen Leben erzählen, diese in der Ich-Form, wenn es genehm ist? 

Im Jahre 1983 begegnete ich das erste Mal dem Wetten auf Sportereignisse. Es handelte sich um einen englischen Anbieter, SSP Overseas Betting. Da ich parallel an der Uni bereits ein erstes Fußballprogramm entwickelt hatte, welches sich mehr und mehr in Richtung Prognosenerstellung entwickelte, schien mir dies ein ideales Betätigungsfeld. Zeitgleich hatte ja nebenbei auch noch eine (recht erfolgreiche) Backgammon Karriere begonnen (unter anderem mit dem Gewinn des Superjackpots bei den Weltmeisterschaften in Monte Carlo im Jahre 1988), so dass das Denken in Wahrscheinlichkeiten mir ein mehr und mehr vertrautes wurde.

Dennoch habe ich zunächst eine Ausbildung (Software Entwickler) abgeschlossen (anstelle des Mathe-Studiums, denn in jener Zeit waren Entwickler gefragt), und mich ein paar Jahre als Angestellter verdingt. Jedoch ruhte ich nicht, meine Entwicklung daheim voranzutreiben.

Im Jahre 1990 war es so weit: pünktlich zur WM hatte ich ein lauffähiges Programm auf dem heimischen PC, welches sich mit Voraussagen (im Sinne von Wahrscheinlichkeiten) auf Fußballspiele verstand. Der Job wurde gekündigt und eine Karriere als professioneller Spieler eingeschlagen, selbst wenn eingangs noch nicht ganz bewusst (ich war überzeugt, dass man die Software oder die Ergebnisse derselben gut verkaufen konnte, was sich eigentlich auch bestätigte, nur spielte ich einfach „nebenbei“ auf diese Zahlen).

Das Ergebnis war, über die Jahre gesehen, in etwa ein (ziemlich genau aufgezeichneter) Gewinn von 3.5%.

Natürlich kommt man mit der Zeit mit diesem und jenem Menschen zusammen, aus der gleichen Branche, und begegnet auch dieser oder jener für den Wettmarkt interessanten Sportart. Ich hatte einen leidenschaftlichen „Tennismann“ kennen gelernt, der mich fragte, ob da nicht etwas ginge.

Ich setzte mich daran und entsann einen Algorithmus, mit welchem man möglichst gute Prognosen auf Tennis Matches erstellen konnte. Der Grundstein war rasch gelegt, die Formel zur Berechnung eines Matches (nach einem Einstiegsdenkfehler, welcher über die erbeuteten Einzelpunkte versuchte, sich anzunähern, bei welchem man jedoch alsbald feststellte, dass er die Realität nicht abbildete. Der Grund, eher ein Reporterbegriff, aber zufällig ein wirklich stimmiger: es gibt die „Bigpoints“, bei welchen sich die Spreu vom Weizen trennt; gerade Pete Sampras war dafür bekannt, sich auf ein Break oder auch den tiebreak zu konzentrieren, und er schenkte viele Punkte und damit Spiele einfach her als Rückschläger, sogar, letztendlich ökonomisch gesehen, aus Gründen der Zeitersparnis, wenn man es zu Ende denkt).

Die Formel ist jene, welche in dieser Serie hier präsentiert wird. Sie ist also entstanden im Zusammenhang mit dem Spiel Tennis. Die Idee, dieses System auf den Schachsport zu übertragen, kam erst viel später (selbst wenn mir bewusst war, dass die gefundene Möglichkeit auf jeden Einzelsport abbildbar wäre).

Dies alles ist nur erwähnt, um begreiflich zu machen, dass man auf ein System zur möglichst guten Prognose – im Sinne von Wahrscheinlichkeiten beziehungsweise von Punkterwartungen, wenn man so möchte – angewiesen war. Ich MUSSTE gute Prognosen erstellen können. Dafür muss einerseits der Algorithmus logisch, mathematisch korrekt, einwandfrei und nachvollziehbar sein, zugleich aber auch die beiden Probleme der Neueinsteiger (bis heute ein unleugbares, auch auf Schach bezogen) und jenes der Update Geschwindigkeit, also der Anpassungsparameter gelöst werden, welche – wie in einem Kommentar vorzufinden, damit zum Versäumnis erklärt – unabdingbar hinzugehören.

 3) Die Anpassungsparameter

Dieses Problem war ich grundsätzlich bereits angegangen im Jahre 1990. Selbst wenn damals vom Sport des Fußballs her, so ist doch die Überlegung, wie man es tut, analog, Schach, Fußball, Tennis, beliebig. Auch dieses Vorgehen erschien mir sehr einfach und logisch. Das System dazu, hier möglichst kurz, hoffentlich anschaulich, erörtert:

Sofort einsichtig scheint doch, dass man die Qualität einer Prognose daran erkennt, inwieweit sie von der Wirklichkeit abweicht. Bevor dies näher erläutert wird, zunächst noch die wichtige Vorüberlegung, dass man, sobald man zwei verschiedene Prognosen hätte, die bessere der beiden anhand der Höhe der Abweichung bestimmen könnte.

Nun, auf Schach bezogen (warum nicht, da es gleichgültig ist, dank der Analogie), heißt das doch dies: wenn man eine Prognose abgibt, auf eine einzelne Partie, von 0.62 Punkten für den Favoriten, dann wird man auf jeden Fall eine Abweichung erhalten. Wenn der Favorit gewinnt, wäre sie 0.38, wenn die Partie Remis ausgeht wären sie um 0.12 Punkte verfehlt, wenn der Außenseiter gewinnt, wären es gar 0.62 Punkte. Eine Abweichung ist unvermeidlich und es wäre fraglich (aber hier nicht näher erörtert), ob Gott es tatsächlich vorhersagen könnte, oder ob er es den kleinen, nichts ahnenden Menschenkindern überlässt, was sie ausbaldowern, er es also selbst nicht einmal weiß und auch nicht wissen möchte.

Falls die Partie denn nun Remis ausginge, so könnte der Favorit mit den Schultern zucken (natürlich jeder andere auch), und behaupten, dass er gerne ein Match über 100 Partien gegen den Gegner spielen würde, dann würde er sicher auf seine 62 Punkte kommen. Er könnte weiterhin behaupten, stets näher am Sieg gewesen zu sein, sich also von oben ans Remis angenähert zu haben, und damit seiner Favoritenrolle, selbst wenn nicht zählbar, so doch irgendwie „moralisch“ gerecht geworden ist.

Unstreitig dürfte aber dennoch sein, dass derjenige, der, mit einer alternativen Prognose, nur 0.61 Punkte prognostiziert hätte, im Falle des Remis eine geringere Abweichung und damit, für diese Partie, eine bessere Vorhersage getroffen hätte.

Wenn man dieses Verfahren nun fortsetzt, auf viele Partien anwendet, und jeder der beiden mit seinem eigenen Prognosesystem vorhersagt und anpasst, so würde man doch ziemlich gewiss einen Sieger küren können. Der hat eine geringere Abweichung insgesamt, dieses System wird demnach (erst einmal) als besser angesehen.

Nun verfügt man leider, im Sinne der Optimierung, nicht über zwei unabhängig voneinander eingehende Prognosen. Oder halt, vielleicht ja doch? Was, wenn man sie selbst und höchst eigenhändig einfach erzeugt? Man vergleicht zwei von einem selbst gefertigte Prognosen miteinander, wie wäre das denn?

Die Datenbasis ist da. Es muss nur die Chronologie eingehalten werden. Und eine gewisse Logik bei der Abarbeitung. Jede Partie wird, in chronologischer Reihenfolge, einzeln ausgewertet. Der Unterschied, den die zwei „Systeme“ haben, ist lediglich die Anpassungsgeschwindigkeit. Man tut dies selbstverständlich mit einem Programm, welches so instruiert wird (und dieses kennt zwar die Ergebnisse der zukünftigen Partien, jedoch berücksichtigt es diese nicht, um eine bessere, dann natürlich möglich: optimale Prognose, zu erstellen).

Also, sozusagen „heureka“, hier ist die Methode zur Ermittlung der optimalen Anpassungsgeschwindigkeit. Man arbeitet alle Daten systematisch ab, mit einer gewissen Anpassungsgeschwindigkeit. So erhält man pro Partie eine gewisse Abweichung zwischen prognostizierter Punkterwartung und eingetroffenem Ergebnis. Da, wo die Summe der Abweichungen am geringsten ist, hätte man den optimalen Wert.

Nun, so ganz ist man noch nicht am Ziel. Denn: was tut man mit den Neueinsteigern? Und dann noch diese Frage: sollte man davon ausgehen, dass es Spieler gibt, bei denen sich verlässlich weniger tut und solche, wo es sich garantiert mehr bewegt? (denn das ist, was tatsächlich im Elo-System vorausgesetzt, angenommen einfach so, getan wird). Dies betrifft einerseits die Neueinsteiger, die ja, selbst bei erfolgter Initialisierung, noch über ein höheres Entwicklungspotenzial (in der Regel nach oben) verfügen, andererseits aber womöglich auch die wirklich etablierten Spieler, bei welchen sich viel weniger bewegen sollte (dies zu überprüfen).

Einen Sinn ergäbe die Überlegung auf jeden Fall, nur stellen sich selbst da noch die folgenden, weiter gehenden Fragen: ist die Entwicklung der Neueinsteiger eine logische oder hängt sie doch viel mehr mit dem Alter zusammen? Neueinsteiger sind meist jung, aber vielleicht entwickelt sich ein älterer Neueinsteiger nicht sprunghaft sondern ähnlich gemächlich wie ein älterer, etablierter Spieler? Und diese noch: hängt die Entwicklungsgeschwindigkeit nicht doch vielleicht am meisten von der Höhe der Zahl ab? Kriterium dafür (dies jedoch ein speziell schachliches Problem): aufgrund der Komplexität des Spiels erscheinen die Ausgänge bei niedrigeren Spielstärkekategorien weitaus zufälliger. Es fehlt ein Turm – kein Problem, man bekommt ja gerade die Dame zurück, aufgrund eines Einstellers, oder hat eine Mattdrohung aufgestellt, die der Gegner übersieht. Mal ein Figürchen mehr, mal zwei Bauern weniger, mal einem eigentlich tödlichen Angriff ausgesetzt – für die Prognose der Partie unter Anfängern noch lange keine Anhaltspunkte.

Nun, sofern allseits akzeptiert (wie ja bei Elo wohl der Fall) könnte man diese Phänomene natürlich, nach ebenso festen Kriterien, mithilfe der Zahlenbasis und des beschriebenen Vorgehens überprüfen. Man versucht nach und nach, den insgesamt gemachten Fehler zu reduzieren mit den eigenen Prognosen. Sobald man das Minimum hat, hätte man die optimale Einstellung.

Zur Neueinsteiger Problematik noch dieser kurze Vorschlag: in Ermangelung anderer Kriterien (welche im Übrigen stets subjektiv und damit ungeeignet wären) habe ich beim Tennis alle Neueinsteiger stets mit dem Durchschnittsergebnis der Neueinsteiger belegt. Da sie insgesamt über die Jahre auf etwa 42% gewonnene Matches kamen, hatten sie auch diese Einstiegszahl (sie hatten natürlich eine Performance von 42%, was aber vermutlich in etwa 1:1 ist mit der Anzahl gewonnener Matches). Selbstverständlich könnte man zu jedem Zeitpunkt diesen Wert aktualisieren. Wenn es also in 20 Jahren im Schach so wäre, dass die Neueinsteiger auf 45% kämen, dann würde man sie vernünftigerweise auf diesen Wert initialisieren.

Dies ist nur eine Einstiegswertung, eine, die Grundannahme ist für die erste gespielte Partie (das erste gespielte Match). Das Ergebnis wird selbstverständlich ausgewertet, die Spielstärke angepasst und fortan mit diesem Wert weiter gerechnet. So weit man es beurteilen kann, dürfte es darüber keine besonderen Beschwerden geben. Zumal es natürlich klar ist, dass man in den ersten Partie stets (wie bei ICC und anderen Schachservern längst üblich) mit einem hohen – bei dem System jedoch derart optimierten – Anpassungswert startet. Die Anzahl der Partien, oder ob es mit jeder Partie abnehmend geschieht, sollte man zunächst abstimmen gut überlegen (nur wegen der Transparenz), und dann dem Optimierungsdurchlauf im Programm überlassen.

Da gäbe es natürlich noch ein paar weitere Verbesserungsmöglichkeiten, dies soll nur andeuten, dass man sich durchaus, und vor allem aus gegebenem Anlass, darüber Gedanken gemacht hat. 


Quicklinks zu den Teilen

Spielstärke Maßzahlen

Spielstärke Maßzahlen -- Teil 2

Spielstärke Maßzahlen -- Teil 3

Spielstärke Maßzahlen -- Teil 4

Kommentare   

#1 Gerhard 2012-02-24 13:17
Lieber Herr Paulsen,

in ihrer Einleitung nannten sie Neid auf die Brillianz einer Idee als häufiges und nun auch auf sie zugekommenes Phänomen. Ich halte generell Neid als Reaktion nicht unbedingt zwingend. Es könnten auch andere Motive sein, wieso man „eher ablehnend“ auf eine Idee reagiert.

Es geht dann auch um den Begriff Kompetenz. Sicher macht nicht jeder Kompetenz AUSSCHLIESSLICH an akademischen Graden fest. Es gibt durchaus noch andere Aspekte. Zudem ist es ein zulässiger Gedanke, daß jemand, der zeitlebens Mathematik beruflich betrieben hat, vermutlich einen Vorsprung gegenüber einem Gelegenheitsmathematiker hat, wenn auch nicht zwingend!. Wobei ich wohlgemerkt Sie jetzt nicht als Gelegenheitsmathermatiker sehe, dazu bin ich nicht berufen.

90,9090 + 9,0909 sollte 100 ergeben, tut es aber nicht. Folglich ist die Kinderansage (ich bin 10 x besser als Du“ irgendwie falsch, wenn man 100 als Basis nimmt. Nichtsdestotrotz werden solche Vergleiche ähnlich auch in Erwachsenenkreisen genutzt.
In diesem Zusammenhang, nicht völlig zum Thema passend, verblüfft mich, daß so mancher Schachheroe ganz genau weiß, meist am Lebensende auch noch, welchen „Score“ er gegen diesen oder jenen Meister hat. Wobei der in vielen Fällen rein zufällig sein dürfte. Zufällig in dem Sinne, weil man nicht weiß, z.B. in welcher Befindlichkeit je Partie sich die betreffenden Herren befanden, sodaß es schlußendlich gerade auf ein 8:7 hinauslief. Und ob ihre Schachviten gleichzeitig abliefen. Und ob es vielleicht 14 Weißpartien und ein Schwarzpartie auf Seiten des 8:7 Gewinners waren. Und dergleichen mehr.

Zur Neueinsteigerproblematik fällt mir ein (sehr alter) Fall ein, daß MAN zum 1.Mal in einer gewerteten Klasse auftrat und aufgrund seines Ergebnisses sofort in die ersten Ränge vorsties. Man konnte danach aber durch entspr. Spiel sicherstellen, daß man nicht sofort, sondern nur ganz allmählich Abschied von der horrrenden Zahl nahm.


Zum Abschluß ein Dank an den Autor.

Gruß
Gerhard
#2 rhorhorho 2012-02-26 15:26
Vor zwei Jahren gab's mal einen Wettbewerb für ein besseres Wertungssystem:
http://www.kaggle.com/c/chess/

Die Daten scheinen noch online zu sein, man könnte also sehr schnell testen, ob das vorgeschlagene System besser funktioniert (d.h. Spielausgänge genauer vorhersagen kann) als das Elosystem.
#3 Guido Montag 2012-02-27 12:45
Zunächst muss MAN dem Betreiber dieser Webseite danken, dass er dem Autor obiger Artikel die Gelegenheit nicht verwehrt hat, seine Ausführungen äußerst ausführlich darzulegen.
Trotzdem, oder vielleicht deswegen ist es mir nicht gelungen eine substantielle Verbesserung der bestehenden Wertungssysteme zu entdecken.
Die vehement beschworene Abbildung der Spielstärke auf den Bereich 0-1 oder auch 0% - 100% ist dafür völlig belanglos. Das einzige was ich mühevoll bisher extrahieren konnte, ist eine verbal verklausuliert dargelegte Vorschrift zur Berechnung des Erwartungswertes eines Partieausganges, die dankenswerter von Umumba in die einfache Formel
x(1-y)/( x(1-y)+y(1-x) ) transformiert wurde. Hiernach sieht man auch sofort dass das von DP vorgeschlagene System nichts mit dem von Zermelo gemein hat, da dessen Formel
x/(x+y) lautet. Im übrigen ist bei Zermelo ziemlich klar sein Ziel ersichtlich, nämlich aus einer Menge von vorliegenden Partieergebnissen Spielstärkezahlen von Beteiligten abzuleiten. Die Existenz- und Eindeutigkeitsbetrachtung en sind der Natur des Mathematikers Zermelo geschuldet. Der Kern eines Auswertesystems beinhaltet aber weitergehend die Berechnung von Folgezahlen, wozu sich bei DP bisher nichts finden lässt. Vieleicht folgen ja noch einige Teile.
"Ceterum censeo Carthaginem esse delendam". Die Wertungssysteme sollen die Spielstärke und nicht das Partieergebnis schätzen.
#4 rhorhorho 2012-02-27 20:28
@Guido Montag: Sollte sich die Spielstärke nicht in den Partieergebnissen widerspiegeln? Wie sollte man zwei konkurrierende Systeme für die Messung von Spielstärke vergleichen, wenn nicht daran, welches besser Partieausgänge vorhersagen kann?
#5 Guido Montag 2012-02-28 00:25
@rho
Wenn du auf die Spielergebnisse wetten willst, nimmst du die Partieergebnisse, das ist o.k.
Wenn du die Spielstärke bewerten , bzw. ein Rankingsystem haben willst, schaust du auf die mathematische Konsistenz.
#6 Dirk Paulsen 2012-02-28 13:17
@Gerhard: nein, ich erzählte eine Geschichte, Den Bezug zu mir habe ich vorsätzlich von mir gewiesen. Es ist nur ein Satz, der mit immer wieder einfällt. Jeder sollte sich seine Relevanz überlegen. Ich kann Kasparov nur Recht geben. Zuvor war mir das Problem nicht so bewusst. Ich hielt es für die "Suche nach der Wahrheit", wenn Menschen eine gelungene Kombination zu widerlegen suchten. Der Kasparowsche Aspekt überzeugt mich etwas mehr.

Ich war mein Leben lang der Praktiker. Ich habe Mathe studiert, mich aber später nur noch im Programmierraum aufgehalten. Es gab zu viele Dinge, die mich störten (an der Mathematik), einer davon übrigens der Charakter der Betreiber dieser WIssenschaft, der doch einem gewissen Muster folgt. Obwohl es, zugegebenermaßen, eher eine Art Hassliebe ist. Irgendetwas zieht mich daran auch an.

Wie meinen Sie das, dass 90.909 + 9.090 nicht 100 ergeben? Es ist ja schon rein optisch gesehen eine 100? Oder meinen Sie, dass 99.999 (Periode) nicht 100 sind? Ich verstehe nicht.

Zur Neueinsteigerproblematik: meinen Sie, dass Sie persönlich Betroffener dieser Ungerechtigkeit waren? Die FIDE hatte veränderliche Regelungen, welche allesamt nicht überzeugend sind (ein Vereinskamerad von mir hatte auch bei seinem ersten Turnier überragend gespielt und startete mit einer 2340 oder so, da ihm die Performance zugeschrieben wurde; er konnte diese Zahl nicht bestätigen; ich hingegen habe im ersten Turnier 2370 gespielt, erhielt aber, nach Verrechnung, nur eine 2240. Heute habe ich 2370).

Mein Vorschlag ist dazu unterbreitet: jeden Neueinsteiger mit dem Durchschnittswert der Neueinsteiger zu belegen (nur zur Berechnung im Grunde). Die Anpassung muss dann rasch erfolgen (sie könnte auch direkt abhängig von der gespielten Partieanzahl gemacht werden; also die erste zählt stärker als die zweite, und so weiter, bis man auf dem Standardwert landet, mit welchem das Gros der Spieler berechnet wird).
#7 Dirk Paulsen 2012-02-28 13:31
@Guido Montag: dem Sarkasmus -- falls es sich um welchen handeln -- fehlt die Pointe. Sie danken dem Betreiber, sind aber zugleich belästigt von der Banalität der Texte?

Die substantielle Verbesserung habe ich nicht einmal angekündigt. Es gibt eine Menge Parallelen zum gängigen Maßsystem. Ich mühte mich, ein paar Vorteile aufzudecken. Einer davon sollte sein, dass die Formel wesentlich leichter und eingängiger ist. Diese kann man aus dem Ärmel schütteln (dazu genügt wirklich das einmalige Verständnis). Aber selbst wenn man es nicht könnte, hätte man sie in Sekunden wieder parat, da sie zum Beispiel der Gegner oder der Begleiter kennt. Sie ist schlicht und hübsch, und: sie stimmt.

Ich lobe übrigens explizit das Elo-System, da es, im Vergleich zu allen anderen verwendeten Systemen einen sehr vernünftigen Hintergrund hat. Dies bedeutet aber nicht, dass es nicht doch noch etwas besser ginge. Ein Vorteil war übrigens noch jener, dass die Zahlen zwischen 0 und 1 viel mehr das angeben, was im Schach erzielt wird: Punkte oder auch Prozentpunkte. 1950 oder 2475 bedeuten im Verhältnis wenig. Eine 0,7 hieße immerhin direkt, dass man von diesem Spieler erwarten dürfte, dass er in einem Rundenturnier gegen alle rated players (alle gelisteten Spieler) in etwa 70% zu erwarten hätte. Dies könnte auch ein Alien sofort verstehen.

Zur Updateproblematik (und vielleicht noch folgenden Teilen): das von mir vorgschlagene System zur Optimierung wurde von mir in der Praxis verwendet. Es funktioniert. Man kann die Qualität von Wahrscheinlichkeitsvorher sagen gut überprüfen. Sogar ohne eine zweite Vorhersage dagegen zu halten (dafür habe ich eine Methode, die hier vorzustellen vielleicht etwas den Rahmen sprengen würde, jedoch wird sie in der Mathematik noch nicht verwendet, dies weiß ich ziemlich zuverlässig).
#8 Gerhard 2012-02-28 17:03
@Herr Paulsen,
99.999 (Periode) sind auch nicht 100, das ist offensichtlich. Das hatte ich bloß anzumerken versucht.

Zur Neueinsteigerproblematik: Es gab ja im Deutschen Schachraum eine sog. Ingozahl. Von der sprach ich.
Es war ähnlich wie mit dem Gewicht: Als ich mit dem Laufen aufhören musste, konnte ich die 75 kg nicht halten, aber lange die 78 kg. Es war also nicht ein dramatisches Zunehmen. Irgendwann, Jahre später, ging dann die Fahrt dennoch los.
#9 Martin Olschewski 2012-02-28 19:29
Hallo Gerhard,

ohne zu tief in die Mathematik einsteigen zu wollen, möchte ich Dirk doch beipflichten, 99.999... sind 100. Die mathematische Begründung ist, dass beide Darstellungen gegen den gleichen Grenzwert konvergieren, aber man kann es sich auch anschaulich klar machen:

100 * 1 / 3 = 33.333...
+ 100 * 2 / 3 = 66.666...
---------------------------------------
100 * 3 / 3 = 99.999...

Vielleicht hilft Dir das, es besser zu verstehen.

Viele Grüße, Martin
#10 rhorhorho 2012-02-28 20:26
@Gerhard&Martin
Soweit muss man nicht in die Mathematik einsteigen. Setzt man
x = 99.999...,
dann ist
10*x =999.999...

Zieht man die erste von der zweiten Gleichung ab, kriegt man
9*x=900
und somit x=100.
#11 Gerhard 2012-02-28 22:15
Martin + rhorhorho:
Danke! Das hat mich überzeugt!

Die Teilnahme an unserer Kommentarfunktion ist nur registrierten Mitgliedern möglich.
Login und Registrierung finden Sie in der rechten Spalte.