Elon Musks xAI veröffentlicht sein neuestes Flaggschiff-Modell, Grok 3 - auf Deutsch

\n

Elon Musks KI-Unternehmen xAI hat am späten Montag sein neuestes Flaggschiff-KI-Modell, Grok 3, veröffentlicht und neue Funktionen für die Grok iOS- und Web-Apps vorgestellt.

\n\n

Grok, xAIs Antwort auf Modelle wie OpenAIs GPT-4o und Googles Gemini, kann Bilder analysieren und Fragen beantworten und treibt eine Vielzahl von Funktionen auf Musks sozialem Netzwerk X an. Grok 3, das seit mehreren Monaten in Entwicklung war, war optimistisch für die Veröffentlichung im Jahr 2024 geplant, hat jedoch diese Frist verpasst.

\n\n
\n\t
\n\t
\n
\n\n\n
\n\t
\n\t
\n
\n\n\n

Der Start am Montag ist ehrgeizig.

\n\n

xAI hat ein enormes Rechenzentrum in Memphis mit rund 200.000 GPUs genutzt, um Grok 3 zu trainieren. In einem Beitrag auf X behauptete Musk, dass Grok 3 mit "10-fach" mehr Rechenleistung als sein Vorgänger, Grok 2, entwickelt wurde, wobei ein erweiterter Schulungsdatensatz verwendet wurde, der angeblich Gerichtsakten umfasst.

\n\n
Mitglieder des xAI-Teams, einschließlich Musk (ganz rechts), während einer Live-Präsentation von Grok 3.Bildnachweis: xAI

\"Grok 3 ist um eine Größenordnung leistungsfähiger als Grok 2\", sagte Musk während einer Live-Präsentation am Montag. \"[Es ist eine] maximal wahrheitssuchende KI, auch wenn diese Wahrheit manchmal im Widerspruch zu dem steht, was politisch korrekt ist.\"

\n\n

Grok 3 ist genau genommen eine Reihe von Modellen. Eine kleinere Version von Grok 3, Grok 3 mini, antwortet schneller auf Fragen, verliert jedoch etwas an Genauigkeit. Noch nicht alle Modelle und damit verbundenen Funktionen von Grok 3 sind verfügbar (einige befinden sich in der Beta-Phase), aber sie wurden am Montag eingeführt.

\n\n

xAI behauptet, dass Grok 3 in Benchmarks wie AIME (der die Leistung eines Modells bei einer Stichprobe von Mathematikfragen bewertet) und GPQA (der Modelle anhand von Physik-, Biologie- und Chemieproblemen auf Doktorandenebene bewertet) OpenAI's GPT-4o schlägt. Eine frühe Version von Grok 3 erzielte auch wettbewerbsfähige Ergebnisse in der Chatbot Arena, einem von der Crowd getesteten Test, der verschiedene KI-Modelle gegeneinander antreten lässt und Benutzer über ihre bevorzugten Antworten abstimmen lässt, so xAI.

\n
Bildnachweis: xAI

Zwei Modelle in der neuen Grok 3-Familie, Grok 3 Reasoning und Grok 3 mini Reasoning, können Probleme sorgfältig \"durchdenken\", ähnlich wie \"reasoning\"-Modelle wie OpenAIs o3-mini und Chinesische KI-Unternehmen DeepSeeks R1. Reasoning-Modelle versuchen, sich selbst zu fact-checken, bevor sie Ergebnisse liefern, was dazu beiträgt, einige der üblichen Schwierigkeiten zu vermeiden, die Modelle normalerweise haben.

\n

xAI behauptet, dass Grok 3 Reasoning die beste Version von o3-mini - o3-mini-high - in mehreren beliebten Benchmarks übertroffen hat, darunter auch ein neuerer Mathematik-Benchmark namens AIME 2025.

\n
Bildnachweis: xAI

Diese Reasoning-Modelle können über die Grok-App abgerufen werden. Benutzer können Grok 3 bitten, zu \"denken\" oder - für schwierigere Anfragen - den \"Big Brain\"-Modus für ein überlegtes Vorgehen nutzen, das zusätzliche Rechenkapazitäten nutzt. xAI beschreibt die Reasoning-Modelle als am besten geeignet für Mathematik-, Naturwissenschaften- und Programmierfragen.

\n\n
\n\t
\n\t
\n
\n\n\n
\n\t
\n\t
\n
\n\n\n

Musk sagte, dass einige der Gedanken der Reasoning-Modelle in der Grok-App verdeckt sind, um die Verdichtung, eine Methode, die von KI-Modellentwicklern verwendet wird, um Wissen von anderen Modellen zu extrahieren, zu verhindern. Kürzlich wurde DeepSeek beschuldigt, OpenAIs Modelle zu destillieren, um seine eigenen zu erstellen.

\n\n

Die Reasoning-Modelle von Grok bilden die Grundlage für eine neue Funktion in der Grok-App namens DeepSearch, xAIs Antwort auf KI-gestützte Recherche-Tools wie OpenAIs Deep Research. DeepSearch durchsucht das Internet und X, um Informationen zu analysieren und eine Zusammenfassung als Antwort auf eine Frage zu liefern.

\n\n

Abonnenten von Xs Premium+-Stufe (50 USD pro Monat) erhalten als Erste Zugriff auf Grok 3, und andere Funktionen werden hinter einem neuen Plan versteckt, den xAI SuperGrok nennt. Zum Preis von 30 USD pro Monat oder 300 USD pro Jahr (falls Leaks zutreffend sind) schaltet SuperGrok zusätzliche Reasoning- und DeepSearch-Anfragen frei und bietet unbegrenzte Bildgenerierung.

\n\n
Bildnachweis: xAI

In Zukunft - möglicherweise schon in etwa einer Woche - wird die Grok-App einen \"Stimmenmodus\" erhalten, so Musk, der den Grok-Modellen eine synthetisierte Stimme gibt. Ein paar Wochen danach werden die Grok 3-Modelle über xAIs Enterprise-API verfügbar sein, zusammen mit der DeepSearch-Fähigkeit.

\n\n

xAI plant, Grok 2 in den nächsten Monaten als Open Source freizugeben, sagte Musk.

\n\n

\"Unser allgemeiner Ansatz ist es, die letzte Version [von Grok] als Open Source freizugeben, wenn die nächste Version vollständig verfügbar ist\", fuhr er fort. \"Wenn Grok 3 ausgereift und stabil ist, was wahrscheinlich in einigen Monaten der Fall sein wird, werden wir Grok 2 als Open Source freigeben.\"

\n\n

Als Musk vor ungefähr zwei Jahren Grok ankündigte, präsentierte er das KI-Modell als edgy, unverfälscht und anti-\"woke\" - im Allgemeinen bereit, kontroverse Fragen zu beantworten, auf die andere KI-Systeme nicht eingehen würden. Er hat einen Teil dieses Versprechens eingehalten. Aufgefordert, vulgär zu sein, würden Grok und Grok 2 beispielsweise gerne nachkommen und farbenfrohe Sprache ausspucken, die Sie wahrscheinlich nicht von ChatGPT hören würden.

\n\n

Aber Grok-Modelle vor Grok 3 haben sich bei politischen Themen zurückgehalten und nicht bestimmte Grenzen überschritten. Tatsächlich ergab eine Studie, dass Grok in Themen wie Transgender-Rechten, Vielfaltsprogrammen und Ungleichheit eher politisch links orientiert war.

\n\n
\n\t
\n\t
\n
\n\n\n
\n\t
\n\t
\n
\n\n\n

Musk hat das Verhalten auf Groks Trainingsdaten - öffentliche Webseiten - zurückgeführt und versprochen, \"Grok näher an politisch neutral zu rücken\". Es ist noch nicht klar, ob xAI dieses Ziel erreicht hat und welche Konsequenzen dies haben könnte.

\n\n