
Am Dienstagnachmittag startete Anthropic Claude Plays Pokémon auf Twitch, einen Livestream des neuesten KI-Modells von Anthropic, Claude 3.7 Sonnet, der das Spiel Pokémon Red spielt. Es ist eine Art faszinierendes Experiment, das die Fähigkeiten der heutigen KI-Technologie und die Reaktionen der Menschen darauf zeigt.
KI-Forscher haben alle möglichen Videospiele, von Street Fighter bis Pictionary, verwendet, um neue Modelle zu testen - oft mehr zur Unterhaltung als zur Nützlichkeit. Aber Anthropic sagte, dass Pokémon sich als nützlicher Maßstab für Claude 3.7 Sonnet erwiesen hat, der effektiv "denken" kann, um die Rätsel des Spiels zu lösen.
Wie auch OpenAI's o3-mini und DeepSeek's R1 kann Claude 3.7 Sonnet sich seinen Weg durch schwierige Herausforderungen bahnen, wie das Spielen eines für Kinder bestimmten Videospiels. Während das nicht zu denkende Vorgängermodell, Claude 3.5 Sonnet, am Anfang von Pokémon Red gescheitert ist - beim Verlassen des Hauses des Spielers in Alabastia - schaffte es Claude 3.7 Sonnet, drei Arenaleiterabzeichen zu gewinnen.

Der neueste Claude gerät jedoch immer noch in Schwierigkeiten. Stunden in den Twitch-Stream hinein wurde das Modell von einer Felswand abgehalten, durch die es trotz aller Anstrengungen nicht hindurchgehen konnte.
Ein Twitch-Benutzer fasste die Situation so zusammen: "Wer würde gewinnen, eine Computer-KI mit tausenden Stunden Programmieraufwand oder 1 Felswand?"
Schließlich erkannte Claude, dass es um die Wand herum navigieren konnte.
Auf der einen Seite ist es frustrierend, zuzusehen, wie Claude Pokémon Red mit der Geschwindigkeit eines Tragosso durchläuft und jeden Schritt mit quälender Überlegung durchdenkt. Aber es ist auch seltsam fesselnd. Auf der linken Seite des Streams zeigt Claudes "Denkprozess", während auf der rechten Seite das Echtzeit-Spielgeschehen zu sehen ist.
Zu einem Zeitpunkt versuchte Claude, Professor Eich in seinem Labor zu finden, wurde aber verwirrt, weil es andere NPCs in der Szene gab.
'Ich bemerke, dass unten unter mir ein neuer Charakter erschienen ist - ein Charakter mit schwarzen Haaren und was eine weiße Jacke sein könnte, an den Koordinaten (2, 10)', schrieb Claude. 'Das könnte Professor Eich sein! Lass mich runtergehen und mit ihm reden.'
Dann sprach Claude fälschlicherweise mit einem NPC, der nicht der Professor war - einem NPC, mit dem das Modell bereits mehrmals gesprochen hatte. Einige der tausend Leute im Twitch-Chat begannen unruhig zu werden. Andere hingegen, besonders diejenigen, die den Stream schon seit ein paar Minuten beobachtet hatten, waren weniger besorgt.
'Leute, entspannt euch', schrieb jemand im Chat. 'Bevor wir das Labor von Eich verlassen und betreten haben wie 10 Mal, bevor wir verstanden haben, wie es weitergeht.'

Für langjährige Twitch-Benutzer könnte das Format des Streams von Anthropic nostalgisch wirken. Vor über einem Jahrzehnt versuchten Millionen von Menschen gleichzeitig Pokémon Red in einem einmaligen Online-Sozialexperiment namens Twitch Plays Pokémon zu spielen. Jeder Benutzer konnte das Spielercharakter per Twitch-Chat steuern, was zu vorhersehbar chaotischem Gameplay führte.
Einige KI-Forscher haben Twitch Plays Pokémon als Inspiration für ihre Arbeit genannt. Im Oktober 2023 veröffentlichte der Software-Ingenieur Peter Whidden aus Seattle ein YouTube-Video, in dem er detailliert beschrieb, wie er einen Verstärkungslernalgorithmus trainiert hat, um Pokémon zu spielen. Seine KI verbrachte über 50.000 Stunden damit, das Spiel zu spielen, bevor sie lernte, es erfolgreich zu meistern. Eine Herausforderung bestand darin, dass die KI die pixelige Landschaft lieber bewunderte, anstatt tatsächlich das Spiel zu spielen.
KI-gesteuerte "Nachstellungen" von Twitch Plays Pokémon wie die von Whidden und Anthropic sind unterhaltsam, aber gleichzeitig auch ein wenig wehmütig. Der originale Stream war ein entscheidender Moment in der Twitch-Geschichte, weil er die Menschen auf unerwartete Weise zusammenbrachte. Alle waren im selben Team, arbeiteten darauf hin, dass der Spielercharakter aufhörte, in Kreisen zu laufen, und tatsächlich im Spiel voranzukommen.
Im Jahr 2025 scheinen wir nicht mehr Teamkollegen zu sein, sondern Zuschauer, die einem KI-Modell zuschauen, wie es versucht, ein Spiel zu spielen, das viele von uns im Alter von fünf Jahren beherrscht haben. Es ist ein KI-getriebener Mikrokosmos eines größeren Trends: Unsere Online-Erfahrungen verlagern sich von gemeinsamen, gemeinschaftlichen Aktivitäten zu mehr einsamen Aktivitäten.