Spieletests in der Kritik: Sinn und Unsinn von Wertungszahlen Spezial
Geschrieben von Roman Dichter am 03.02.2015
Wagemut, Willensstärke, Kampfgeist, Neugier – die Zutaten für echte Helden! Doch nicht nur Videospiel-Figuren wie Link aus der Spiele-Reihe The Legend of Zelda müssen beweisen, dass sie das Zeug zu echten Helden haben. Auch Spieletester benötigen eine große Portion dieser Zutaten, um im Review-Dungeon nicht von ihren gefährlichsten Gegnern gefressen zu werden. Wer die sind? Die gnadenlosen Kritiker, die jede noch so liebevoll verteilte Wertung in der Luft zerreißen.
Im Fegefeuer der Kritik
Wenn man sich schimpfende Kommentare zu Reviews ansieht (nicht nur bei ntower, sondern eigentlich überall, wo Spiele bewertet werden), dann entsteht der Eindruck, dass der Redakteur es nur falsch machen kann. Gibt er eine niedrige Wertung, heißt es schnell, er sei mit dem Spiel nur nicht zurechtgekommen oder wäre zu blöd, dessen wahren Qualitäten zu erkennen. Ansonsten hasst er offensichtlich das Genre, den Hersteller oder den Stil des Spiels.
Bewertet er einen Titel dagegen mit einer guten 8 von 10 Punkten, dann finden sich schnell Stimmen, die enttäuscht sind, dass es nicht 9 oder 10 sind. Dieser Redakteur war dann offensichtlich übermäßig kritisch und hat unwichtige Details zu sehr auf die Goldwaage gelegt. Ganz gefährlich ist es allerdings erst, die Höchstpunktzahl von 10 Punkten zu vergeben, denn dann ist vielen Lesern klar, dass der gute Autor offensichtlich den Sinn für die Realität verloren hat. Dieses Spiel soll besser sein als Spiel XY? So ein Unsinn! Wie kann er nur Kritikpunkte in seinem Text erwähnen und trotzdem keinen Punkt abziehen? Klarer Fall: Das ist ein „Fanboy“ – oder gekauft! Wer weiß, wie viel Geld er bekommen hat, um das Spiel so hoch zu bewerten. Der Test liest sich ja sowieso nicht anders als Werbung vom Hersteller.
Äußerungen dieser Art sind immer wieder zu lesen. Zumeist handelt es sich nur um eine Minderheit von Lesern, die solche Meinungen vertreten. Zudem ist ja eine Sache klar: Man kann es nicht allen recht machen! Ärgerlich wird Kritik erst dann, wenn sie persönlich angreift und statt Argumenten nur Beleidigungen enthält. Allerdings muss der Redakteur solche Angriffe auch aushalten können. Ist er mit den oben erwähnten Heldenzutaten ausgerüstet, schafft er es auch. Aber einfach wegzulaufen zählt nicht! Schließlich ist er in der gleichen Lage wie das Spiel: er ist Gegenstand kritischer Betrachtung. Wer austeilt, muss also auch einstecken können. Nur, wie berechtigt ist eigentlich die ganze Kritik?
Die Wertung zu The Legend of Zelda: Skyward Sword für Wii war Anlass kritischer Kommentare. Sie wurde als zu niedrig angesehen.
Objektiv oder subjektiv – was denn nun?
Ein zentraler Kritikpunkt an testenden Spielern ist, dass sie nicht objektiv seien. Wenn wir uns aber überlegen, was Subjektivität und Objektivität eigentlich sind, dann wird es fast schon philosophisch. Tatsächlich ist eine absolute, reine Objektivität praktisch unmöglich. Wenn jemand ein Spiel testet, dann spielen seine Erfahrungen, Fähigkeiten und Vorlieben mit. Wer zum Beispiel eine Story als langweiligen Kitsch beurteilt, muss damit nicht unbedingt die Meinung von allen anderen teilen. Wir erkennen schon an den verschiedenen Wertungen verschiedener Magazine, dass es keine absolute Einigkeit geben kann. Und zuletzt muss man sagen: Die Entwickler eines Spiels haben die Story ja nicht so gewählt, weil sie sie schlecht fanden. Auch abgedrehte, kitschige, extrem kurze oder episch lange Geschichten finden ihre Fans.
Also ist doch alles subjektiv und nichts als Geschmackssache? Nein! Spieletester versuchen, Subjektivität so weit wie möglich zurückzudrängen, damit die Leser nicht nur einen persönlichen Meinungsbericht lesen, sondern auch ihre Kaufentscheidungen mit Hilfe eines Tests fällen können. Dass das wirklich funktioniert, sehen wir ebenfalls im Vergleich verschiedener Tests desselben Spiels. Zwar sind die Ergebnisse nicht alle gleich, aber meistens lassen sich klare Tendenzen erkennen: Bekommt ein Spiel von einem Magazin die Höchstwertung, schneidet es wahrscheinlich auch im anderen Tests gut bis sehr gut ab. Sehr selten wird man einen Ausreißer ins andere Extrem finden. Mario Kart 8 ist ein geniales Spiel, das durchgängig gut bewertet wurde. Tests, die dem Spiel nur 1, 2 oder 3 von 10 Punkten geben, wären mir nicht bekannt. Es gibt also doch eine Objektivität, die weit über den persönlichen Geschmack hinausgeht.
Tatsächlich kann man verschiedene Aspekte eines Spiels mit einem unterschiedlichen Grad von Objektivität bewerten. Die oben erwähnte Story ist ein sehr subjektiver Aspekt, denn sie kann einer Person gefallen, einer anderen nicht. Objektiv kritisieren kann man nur, wenn sie beispielsweise in sich unlogisch ist oder gar nicht zum Abschluss gebracht wird. Die Steuerung kann da schon weit objektiver betrachtet werden. Kann man das Geschehen auf dem Bildschirm mit Buttons, Sticks & Co. präzise beeinflussen, dann gibt es wenig zu meckern. Ist die Steuerung aber so ungenau, dass es mehr ein Glücks- anstelle eines Geschicklichkeits-Spiels ist, dann ist das ein berechtigter Kritikpunkt. Interessant ist auch der Aspekt Grafik: Während es früher klar war, dass eine gute Grafik die technischen Möglichkeiten der Zeit optimal ausnutzt, gibt es heute viele Spiele, die ganz bewusst und gezielt Grafik im Retro-Stil anbieten, was auch viele Fans findet. In diesem Punkt ist der persönliche Geschmack sozusagen neu hinzugekommen. Objektiv kritisieren kann man nur noch Fehler wie Einbrüche der Framerate oder fehlerhaft dargestellte Objekte.
Unterm Strich gibt es in jedem Spiel verschiedene Aspekte, die man mit einem unterschiedlichen Grad an Objektivität beurteilen kann. Kein Review ist zu 100% objektiv, aber eben auch nicht völlig subjektiv. Ein Text benötigt also auch einen intelligenten Leser, der unterscheiden kann zwischen allgemein gültiger Kritik und Aspekten, die er zunächst mit seinen persönlichen Vorlieben abgleichen muss. Wenn ein Kritikpunkt der sehr hohe Schwierigkeitsgrad ist, dann ist das für viele Spieler eine wichtige Warnung. Wer aber Herausforderungen liebt und die meisten Spiele zu leicht findet, für den ist es ganz subjektiv betrachtet ein großer Pluspunkt.
Mario Kart 8 konnte Tester weltweit überzeugen. Die Wertungen liegen nah beieinander, sodass es auch objektiv ein tolles Spiel ist.
Wer sollte testen?
Unterschiedliche Spieletester können zu unterschiedlichen Ergebnissen kommen, das ist jetzt völlig klar. Da stellt sich schon die Frage, wer in einer Redaktion von mehreren möglichen Kandidaten ein Spiel testen darf. Natürlich spielen dabei verschiedene Faktoren eine Rolle: Wer testet schon ein anderes Spiel? Wer kann gut mit dem Genre umgehen? Wer ist gerade nicht so stark ausgelastet und hat Zeit? Für einen möglichst objektiven Test darf man aber auch fragen, ob der Auserwählte ein Fan des Spiels sein darf oder sogar ein großer Kritiker.
Wer ein Spiel, vielleicht wegen eines tollen Vorgängers, wirklich liebt, begibt sich bei der Beurteilung natürlich auf dünnes Eis. Er muss sich praktisch zwingen, Kritikpunkte herauszuarbeiten, auch wenn sie ihn persönlich gar nicht stören. Er darf nicht einfach so eine Traumwertung vergeben, sondern muss es mit seinem Gewissen auch wirklich vereinbaren können. Und trotzdem muss er scharfe Kritik der Leser fürchten, die ihm vorwerfen könnten, alles nur durch die rosarote Fanboy-Brille zu sehen. Diese Besetzung ist also nicht ungefährlich, weil immer die Fragen aufkommen können, ob er das Spiel zu gut bewertet, vielleicht sogar absichtlich zu schlecht, weil er aktiv gegen seine Begeisterung ankämpft. Aber wir sollten auch nicht vergessen: Wer das Spiel liebt, wird es viel intensiver spielen und jedes Geheimnis lüften wollen. Er erforscht Details, die einem genervten Kritiker vielleicht entgehen könnten.
Oder sollte man das Spiel vielleicht doch lieber einem kritisch eingestellten Redakteur überlassen? Er steht jedenfalls nicht im Verdacht, ein Spiel über alle Maße zu loben. Trotzdem ist auch diese Konstellation nicht wirklich optimal. So muss sich der Arme praktisch durch ein Spiel quälen, auf das er gar keine Lust hat. Ihm wird es große Mühe bereiten, überhaupt dessen Qualitäten herauszuarbeiten und den Zauber, den ein Spiel vermitteln will, an die Leser weiterzugeben. Es macht schließlich wenig Sinn, ein Spiel um jeden Preis möglichst kritisch zu sehen. Gerade weil das Gefallen auch immer eine subjektive Sache ist, sollen Reviews den Lesern vermitteln, unter welchen Umständen sie das Spiel lieben werden. Da muss dann eine Wertung wie „5 von 10“ nicht unbedingt abschrecken. Bei ntower beschreiben wir diese Wertung mit „für Genre-Fans“ – und diese können durchaus Spaß am Spiel haben, wenn auch vielleicht die meisten anderen Spieler nicht. Halten wir also fest: Auch ein testender Redakteur darf ein Spiel lieben. Er sollte nur versuchen, sich auch in andere Spieler hineinzuversetzen und herauszufinden, was es an berechtigter Kritik zu sagen gibt.
Funky Barn wird beim ersten Anblick als schlechtes Spiel abgestempelt. Doch wer auf solche Spiele steht, wird Spaß damit haben.
Die Zwickmühle „Innovation“ - Darf man Spiele an Vorgängern messen?
Eine der größten Schwierigkeiten ist die Frage, ob man ein Spiel als Einzelprodukt bewerten oder es im Zusammenhang mit Vorgängern aus einer Spiele-Reihe bewerten sollte. Nehmen wir als Parade-Beispiel die Fifa-Reihe. So gibt es beim Spiel Fifa 14 die so genannte „Legacy Edition“, bei der sich bis auf wenige Kleinigkeiten (Team- und Spielerdaten) nichts gegenüber dem Vorgänger geändert hat. Das lädt natürlich zu geballter Kritik ein. „Das ist reine Profitgier!“ „Die paar Daten könnte man auch als Update des Vorgängers veröffentlichen, anstatt das ganze zum Vollpreis in die Läden zu stellen!“ So berechtigt die Wut darauf auch ist – hier wollen wir ein Spiel bewerten. Es ist ein Spiel, das sich ein interessierter Leser vielleicht kaufen möchte. Dieser Leser hat vielleicht den Vorgänger gar nicht. Er muss also nicht erneut den Vollpreis zahlen, sondern erstmals. Es juckt ihn auch wenig, wenn sich nichts im Vergleich zum Vorgänger geändert hat. Kritik an dieser Politik in die Wertung einzubauen, würde ihn auf eine völlig falsche Fährte führen, denn für sich genommen ist es kein schlechtes Spiel. Auf der anderen Seite gibt es eben auch die Spieler, die den Vorgänger besitzen, und die müssen halt gewarnt werden.
Auch wenn dies ein Extremfall ist, so besteht das grundsätzliche Problem bei jeder Reihe. New Super Mario Bros. wurde schon mehrfach mit Nachfolgern bedacht, die sich ehrlich gesagt auch nur sehr wenig voneinander unterscheiden. Man kann das natürlich kritisieren und stöhnen: „Nicht noch ein 2D-Jump’n’Run!“ Und damit würde der testende Redakteur auch bei vielen Lesern auf offene Ohren (bzw. Augen) treffen, denn wenn viele Spieler das so empfinden, ist die Kritik schlicht gerechtfertigt. Aber man muss eben auch die andere Seite sehen und ernst nehmen: Nicht jeder Spieler hat schon sämtliche Vorgänger gespielt. Tatsächlich sind die New Super Mario Bros.-Spiele sogar gut auf verschiedene Konsolen und Handhelds verteilt. Jammern da also nicht nur die Vielspieler, die sowieso alles kaufen, während es für die meisten Fans gar kein Problem ist? Wie geht ein Spieletester jetzt damit um? Sinnvoll ist es natürlich, die Situation im Text zu beschreiben. So kann jeder Leser entscheiden, ob es ihn stört oder nicht. Aber soll das mit in die Wertung einfließen? Darauf gibt es keine zufriedenstellende Antwort.
Erwartungen und Ergebnisse
Wie man ein Spiel beurteilt, hängt auch sehr davon ab, was man sich von ihm erwartet. So gibt es heute eine Vielzahl von Download-Titeln kleiner Indie-Entwickler, die zum kleinen Preis erhältlich sind. Natürlich wollen auch diese getestet werden. In vielen Punkten können diese Spiele nicht mit ihren „großen Brüdern“ mithalten. Das ist bei dem Budget und der Größe der Entwickler-Teams einfach nicht möglich. Wollen wir aber dem kleinen Titel etwas vorwerfen, von dem wir gar nicht erwarten können, dass er es besser macht? Bomben-Grafik, Orchester-Sound, zahlreiche, gesprochene Dialoge… All diese Dinge sind möglich, aber können nicht die Grundlage für unsere Erwartungen sein. Im Grunde gibt es damit zwei völlig verschiedene Bewertungs-Ansätze: Wir könnten das Spiel im Vergleich zu allen anderen Spielen der heutigen Zeit bewerten und müssten dann fairerweise sagen, dass die meisten Indie-Games deutlich schlechter abschneiden. Wir könnten aber auch alle Aspekte, die für ein Indie-Spiel sowieso nicht realistisch sind, ausblenden und uns bei der Bewertung ganz auf das realistisch Erwartbare beschränken.
Cloudberry Kingdom hat eine Grafik, die an Flash-Spiele erinnert. Aber das sollte man dem Indie-Titel nicht zum Vorwurf machen.
Letzteres ist für den Titel sicher fairer, aber wichtig ist dann, dass der Leser die Wertung auch so versteht. Das Spiel ist gut, ja – aber vor dem Hintergrund, dass es ein kleiner Download-Titel ist, der mit einfachster Grafik und geringem Umfang, aber dafür auch zum günstigen Preis angeboten wird. Versteht der Leser das nicht und macht einen schlichten Vergleich der Wertungszahlen, dann kommen natürlich Proteste auf wie: „Was? Das soll besser sein als …?“ Erneut drängt sich dabei der Gedanke auf, dass Wertungszahlen sehr vereinfachend sind und nur einen kleinen Teil dessen ausdrücken können, was es über ein Spiel zu sagen gibt.
Zudem muss man Wertungen auch immer als ein Produkt ihrer Zeit betrachten. Was heute ganz neu und innovativ ist, wird in fünf Jahren schon als veralteter Abklatsch wahrgenommen. Was heute durch beeindruckende Technik begeistert, ist früher oder später Standard-Kost. Ein Spiele-Magazin hatte einmal den Ansatz gewagt, Wertungen von älteren Spielen nachträglich herabzustufen, weil sie im Vergleich zu neueren Spielen jener Zeit nicht mehr in diesem Maße beeindrucken konnten. So wollte man in Vergleichslisten realistischere Übersichten schaffen. Da kann sich jetzt jeder selbst überlegen, ob das Sinn macht oder nicht. Es ist jedenfalls einfach unmöglich, ein Spiel ohne Kontext zu bewerten. Es steht nie ganz für sich allein.
Die perfekte Wertung
Der letzte Punkt, den ich an Benotungen von Spielen kritisieren muss, ist folgender: Bewertungen sind Definitionssache! Es ist also weder von der Natur, noch von göttlichen Wesen festgelegt, was eine „7 von 10“ eigentlich genau bedeutet. Es wird schlicht von jedem Magazin selbst bestimmt. Warum das notwendig ist wird klar, wenn wir uns Extremwertungen ansehen, die auch bei uns immer wieder Gegenstand von Diskussionen sind. Nehmen wir die „10 von 10“: Sobald diese Note vergeben wird, kommt es höchstwahrscheinlich zu Protesten. Schließlich würde das bedeuten, dass das Spiel „perfekt“ sei. Da im Text aber auch Kritik geäußert würde, dürfe die „10“ nicht vergeben werden. Der Fehler dieser Argumentation ist, dass ntower die 10 gar nicht als „perfekt“ definiert. Das würde auch wenig Sinn machen. Schließlich gibt es so etwas wie „Perfektion“ gar nicht, jedenfalls nicht bei Spielen. Es gibt immer Dinge, die man noch hätte besser machen oder hinzufügen können. Zudem gibt es, wie oben gesagt, immer subjektive Aspekte. Was für den einen perfekt ist, kann für den anderen Mist sein. Wenn wir also die Höchstwertung nur bei perfekten Spielen vergeben dürften, könnten wir sie schlicht nie vergeben. Dann müsste man aber die Frage stellen, wozu es eine theoretische 10 überhaupt gibt, wenn sie nicht verwendet werden darf.
Darum macht es nur Sinn, die einzelnen Wertungszahlen nicht ganz so extrem zu definieren, sondern die 10 für herausragende Spiele zu reservieren, die aber trotzdem ihre kleinen Macken haben dürfen und auch nicht zwangsläufig von allen Spielern geliebt werden müssen. Dass es dann aber trotzdem zu Protesten und Diskussionen kommt, lässt sich kaum vermeiden. Natürlich sei jemand, der die Höchstwertung vergibt, direkt ein „Fanboy“. Wer so etwas in den Raum wirft, sollte mal über diesen Satz nachdenken: Wie kann man denn einem Spiel 10 von 10 Punkten geben, ohne selbst ein Fan des Spiels zu sein? Anstatt über Sinn und Unsinn bestimmter Wertungszahlen zu diskutieren, würde es sich wohl eher lohnen, über den Sinn von Benotungen allgemein nachzudenken.
Der 3DS-Titel The Legend of Zelda: A Link between Worlds erhielt auf ntower eine 10. Das bedeutet nicht, dass das Spiel perfekt ist.
Fazit
Ich bin jetzt ausführlich auf verschiedene Aspekte und Schwierigkeiten eingegangen, die mit dem Verfassen von Reviews zusammenhängen: Gibt es Objektivität? Darf ein Spieletester das Spiel lieben? Darf man Spiele im Kontext einer Spiele-Reihe, der Zeit oder des Budgets bewerten? Was bedeuten eigentlich Wertungszahlen? Bei allen diesen Aspekten kommen wir immer wieder zu einer Erkenntnis: Während der Text eines Reviews die Möglichkeit bietet, alle Aspekte des Spiels gut, differenziert und ehrlich zu vermitteln, sind Wertungszahlen angreifbar, vage und eine Frage der Definition. Man kann durchaus mit Berechtigung die Frage stellen, ob solche Zahlen überhaupt Sinn machen oder ob man sie nicht einfach abschaffen sollte. Trotz aller Kritik gibt es heute überall solche Benotungen nach verschiedenen Systemen. Das liegt sicherlich daran, dass viele Spieler das wollen! Natürlich lesen wir auch gerne Tests zu Spielen, die uns interessieren. Aber in der großen Masse an Spielen ist es hilfreich, mit einem schnellen Blick auf die Wertungszahlen eine Art Vorauswahl zu treffen, womit wir uns näher beschäftigen wollen. Trotzdem können wir durch solche vereinfachten Blicke auf Zahlen auch auf die falsche Fährte geführt werden und Spiele verpassen, die uns vielleicht sehr gut gefallen hätten.
Autor: Roman Dichter