
Elon Musks KI-Unternehmen xAI hat am Montag sein neuestes Top-KI-Modell, Grok 3, veröffentlicht und neue Funktionen für die Grok iOS- und Web-Apps vorgestellt.
Grok, xAIs Antwort auf Modelle wie OpenAIs GPT-4o und Googles Gemini, kann Bilder analysieren und Fragen beantworten und bietet eine Reihe von Funktionen auf Musks Social Network, X. Grok 3, das seit mehreren Monaten in Entwicklung ist, sollte optimistisch gesehen im Jahr 2024 veröffentlicht werden, hat diesen Termin jedoch verpasst.
Es handelt sich um einen ehrgeizigen Start am Montag.
xAI hat ein riesiges Rechenzentrum in Memphis mit rund 200.000 GPUs genutzt, um Grok 3 zu trainieren. In einem Beitrag auf X behauptete Musk, dass Grok 3 mit "10x" mehr Rechenleistung als sein Vorgänger, Grok 2, entwickelt wurde und ein erweitertes Trainingssatz verwendet wurde, der angeblich Informationen aus Gerichtsdokumenten enthält.

"Grok 3 ist um eine Größenordnung leistungsfähiger als Grok 2", sagte Musk während einer am Montag live übertragenen Präsentation. "Es handelt sich um eine maximal wahrheitssuchende KI, auch wenn diese Wahrheit manchmal im Widerspruch zu dem steht, was politisch korrekt ist."
Grok 3 ist genauer gesagt eine Modellfamilie. Eine kleinere Version von Grok 3, Grok 3 mini, beantwortet Fragen schneller auf Kosten einiger Genauigkeit. Noch nicht alle Modelle und zugehörigen Funktionen von Grok 3 sind verfügbar (einige befinden sich in der Beta-Phase), aber sie wurden bereits am Montag veröffentlicht.
xAI behauptet, dass Grok 3 in Benchmarks, darunter AIME (das die Leistung eines Modells anhand einer Auswahl von Mathematikfragen bewertet) und GPQA (das Modelle anhand von Physik-, Biologie- und Chemieproblemen auf PhD-Niveau bewertet), GPT-4o schlägt. Eine frühe Version von Grok 3 schnitt auch im Chatbot Arena, einem crowdsourced Test, bei dem verschiedene KI-Modelle gegeneinander antreten und die Nutzer über ihre bevorzugten Antworten abstimmen, wettbewerbsfähig ab, laut xAI.

Zwei Modelle in der neuen Grok 3-Familie, Grok 3 Reasoning und Grok 3 mini Reasoning, können Probleme sorgfältig "durchdenken", ähnlich wie "Reasoning"-Modelle wie OpenAIs o3-mini und das chinesische KI-Unternehmen DeepSeeks R1. Reasoning-Modelle versuchen, sich selbst zu überprüfen, bevor sie Ergebnisse liefern, um einige der normalerweise Modelle hemmenden Probleme zu vermeiden.
xAI behauptet, dass Grok 3 Reasoning die beste Version von o3-mini - o3-mini-high - bei mehreren bekannten Benchmarks, darunter ein neuer Mathematik-Benchmark namens AIME 2025, übertrifft.

Diese Reasoning-Modelle können über die Grok-App abgerufen werden. Benutzer können Grok 3 bitten zu "Denken" oder - für schwierigere Anfragen - den "Big Brain"-Modus für ein Denken mit zusätzlicher Rechenleistung nutzen. xAI beschreibt die Reasoning-Modelle als am besten geeignet für Mathematik-, Wissenschafts- und Programmierfragen.
Musk sagte, dass einige der Gedanken der Reasoning-Modelle in der Grok-App verdeckt sind, um die Extraktion, eine Methode, die von KI-Modellentwicklern verwendet wird, um Wissen aus anderen Modellen zu gewinnen, zu verhindern. Kürzlich wurde DeepSeek beschuldigt, OpenAIs Modelle zu extrahieren, um seine eigenen zu erstellen.
Die Reasoning-Modelle von Grok bilden die Grundlage für eine neue Funktion in der Grok-App namens DeepSearch, xAIs Antwort auf KI-gestützte Recherchetools wie OpenAIs Deep Research. DeepSearch durchsucht das Internet und X, um Informationen zu analysieren und eine Zusammenfassung als Antwort auf eine Frage zu liefern.
Abonnenten von Xs Premium+ -Tarif ($50 pro Monat) erhalten zuerst Zugriff auf Grok 3, und andere Funktionen werden hinter einem neuen Plan namens SuperGrok verriegelt sein. Mit einem Preis von $30 pro Monat oder $300 pro Jahr (wenn Lecks zu glauben sind) werden mit SuperGrok zusätzliche Reasoning- und DeepSearch-Anfragen freigeschaltet und unbegrenzte Bildgenerierung angeboten.

In der Zukunft - möglicherweise schon in ungefähr einer Woche - wird die Grok-App einen "Sprachmodus" erhalten, sagte Musk, der den Grok-Modellen eine synthetisierte Stimme geben wird. Ein paar Wochen später werden Grok 3-Modelle über die Enterprise-API von xAI verfügbar sein, zusammen mit der DeepSearch-Funktion.
xAI plant, Grok 2 in den kommenden Monaten als Open Source freizugeben, sagte Musk.
"Unser allgemeiner Ansatz besteht darin, dass wir die letzte Version [von Grok] Open Source machen, wenn die nächste Version vollständig verfügbar ist", fuhr er fort. "Wenn Grok 3 ausgereift und stabil ist, was wahrscheinlich innerhalb weniger Monate der Fall sein wird, werden wir Grok 2 als Open Source veröffentlichen."
Als Musk Grok vor etwa zwei Jahren ankündigte, positionierte er das KI-Modell als provokant, unverblümt und anti-"woke" - im Allgemeinen bereit, kontroverse Fragen zu beantworten, auf die andere KI-Systeme nicht eingehen würden. In einigen Punkten hat er dieses Versprechen gehalten. Wurde beispielsweise gebeten vulgär zu sein, würden Grok und Grok 2 gerne zustimmen und farbenfrohe Sprache ausspucken, die man wahrscheinlich nicht von ChatGPT hören würde.
Aber Grok-Modelle vor Grok 3 mieden politische Themen und überschritten bestimmte Grenzen nicht. Tatsächlich fand eine Studie heraus, dass Grok bei Themen wie Transgender-Rechten, Diversitätsprogrammen und Ungleichheit politisch links stand.
Musk hat dieses Verhalten auf Groks Trainingsdaten - öffentliche Webseiten - zurückgeführt und versprochen, "Grok näher an politisch neutral zu rücken". Es ist noch nicht klar, ob xAI dieses Ziel erreicht hat und welche Konsequenzen dies haben könnte.