
Seit das chinesische KI-Unternehmen DeepSeek zu Beginn dieser Woche eine offene Version seines Reasoning-Modells R1 veröffentlicht hat, haben viele in der Tech-Branche großartige Erklärungen darüber abgegeben, was das Unternehmen erreicht hat und was es für den Stand der KI bedeutet.
\n\nDer Risikokapitalgeber Marc Andreessen postete zum Beispiel, dass DeepSeek "eine der erstaunlichsten und beeindruckendsten Durchbrüche ist, die ich je gesehen habe."
\n\nR1 scheint in bestimmten KI-Benchmarks mit dem o1-Modell von OpenAI übereinzustimmen oder dieses zu übertreffen. Und das Unternehmen behauptet, dass eines seiner Modelle nur 5,6 Millionen Dollar für das Training gekostet hat, im Vergleich zu den Hunderten von Millionen Dollar, die führende amerikanische Unternehmen für ihr Training ausgeben.
\n\nEs scheint auch, dass dies trotz der US-Sanktionen erreicht wurde, die den Verkauf von fortschrittlichen Chips an chinesische Unternehmen verbieten. Das MIT Technology Review schreibt, dass der Erfolg des Unternehmens zeigt, wie Sanktionen "Startups wie DeepSeek dazu bringen, auf effiziente Weise, Ressourcenpooling und Zusammenarbeit zu setzen." (Andererseits berichtet das Wall Street Journal, dass Liang Wenfeng von DeepSeek kürzlich dem chinesischen Premierminister mitgeteilt hat, dass amerikanische Exportbeschränkungen immer noch ein Engpass darstellen.)
\n\nDer CEO von Curai, Neal Khosla, gab eine einfachere Erklärung ab und behauptete, dass das Unternehmen ein "ccp state psyop" sei, das "den niedrigen Preis fälschte, um einen niedrigen Preis zu rechtfertigen und darauf hoffte, dass alle darauf umsteigen, um die Wettbewerbsfähigkeit der KI in den USA zu schädigen." (Ein Community-Hinweis wurde seinem Beitrag angehängt, in dem darauf hingewiesen wird, dass Khosla keine Beweise für diese Behauptung vorlegt und dass sein Vater Vinod Investor bei OpenAI ist.)
\n\nUnterdessen schlug der Journalist Holger Zschaepitz vor, dass DeepSeek "die größte Bedrohung für die US-Aktienmärkte darstellen könnte" - wenn ein chinesisches Unternehmen ein hochmodernes Modell zu niedrigen Kosten, ohne Zugang zu fortschrittlichen Chips, entwickeln könne, würde dies die "Nützlichkeit der Hunderte von Milliarden Dollar schweren Kapitalinvestitionen in diese Branche" in Frage stellen.
\n\nIn seiner Antwort argumentierte Y Combinator CEO Garry Tan, dass der Erfolg von DeepSeek tatsächlich gut für seine amerikanischen Mitbewerber wäre. "Wenn das Training von Modellen schneller und einfacher billiger wird", schrieb er auf X, "wird die Nachfrage nach Inferenz (der tatsächlichen Nutzung von KI) schneller und stärker wachsen, was sicherstellt, dass die zur Verfügung stehende Rechenleistung genutzt wird."
\nUnd Meta's Chief AI Scientist Yann LeCun argumentierte dagegen, DeepSeek's Ankündigung durch die Linse von China gegen die Vereinigten Staaten zu betrachten. Stattdessen schlug er vor, dass die eigentliche Lektion darin bestehe, dass "Open-Source-Modelle proprietäre überholen".
\n\n"DeepSeek hat von offener Forschung und Open-Source (z.B. PyTorch und Llama von Meta) profitiert", schrieb LeCun in dieser Woche auf LinkedIn. "Sie kamen auf neue Ideen und bauten sie auf der Arbeit anderer auf. Da ihre Arbeit veröffentlicht und Open-Source ist, kann jeder davon profitieren."
\n\nAll diese Debatten scheinen Verbraucher dazu zu bringen, das Produkt auszuprobieren. Bis Sonntagnachmittag ist der KI-Assistent von DeepSeek die beliebteste kostenlose App im Apple App Store, direkt vor ChatGPT.