Künstliche Intelligenz Coding-Assistent Supermaven erhält Mittel von OpenAI und Perplexity-Mitgründern

Jacob Jackson war früh in seiner Karriere voll auf KI fokussiert. Jackson gründete Tabnine, den KI-Coding-Assistenten, der während seines Informatikstudiums an der University of Waterloo fast 60 Millionen US-Dollar an Risikokapital einsammelte. Nach dem Verkauf von Tabnine an Codata im Jahr 2019 (während seiner Abschlussprüfungen) trat Jackson als Praktikant in das OpenAI ein, wo er bis 2022 arbeitete. Es war zu diesem Zeitpunkt, dass Jackson das Verlangen verspürte, erneut ein Unternehmen zu gründen, das sich auf die Unterstützung gängiger Entwickler-Workflows konzentriert. "In den Jahren seit ich Tabnine gebaut habe, haben Tools wie ChatGPT und Github Copilot die Art und Weise verändert, wie Entwickler arbeiten", sagte Jackson gegenüber TechCrunch. "Es ist eine wirklich aufregende Zeit, an Entwicklertools zu arbeiten, weil sich die zugrunde liegende Technologie seit dem Start von Tabnine so stark verbessert hat - was dazu geführt hat, dass sich viele mehr Entwickler für die Verwendung von KI-Tools interessieren, um ihren Workflow zu beschleunigen." Also startete Jackson Supermaven, eine KI-Codierungsplattform entlang der Linien von Tabnine, jedoch mit einigen Lebensqualitäts- und technischen Upgrades. Supermavens hauseigenes generatives KI-Modell, Babble, kann laut Jackson dank eines 1-Millionen-Token-Kontextfensters eine Menge Code auf einmal verstehen. (In der Datenwissenschaft werden Tokens in Unterbits von Rohdaten unterteilt - wie die Silben 'Fan', 'Tas' und 'Tic' im Wort 'Fantastisch'.) Das Kontextfenster eines Modells bezieht sich auf Eingabedaten (z.B. Code), die das Modell vor der Generierung von Ausgaben (z.B. zusätzlichem Code) berücksichtigt. Ein langer Kontext kann verhindern, dass Modelle den Inhalt von kürzlich verwendeten Dokumenten und Daten "vergessen" und vom Thema abkommen und falsch extrapolieren. "Unser großes Kontextfenster hilft dabei, die Häufigkeit von Halluzinationen zu reduzieren, da es dem Modell erlaubt, Antworten aus dem Kontext in Situationen zu ziehen, in denen es sonst raten müsste", sagte Jackson. Ein Millionen Token ist tatsächlich ein großes Kontextfenster. Aber es ist nicht größer als das von AI-Codierungs-Startup Magic, das 100 Millionen Token beträgt. In der Zwischenzeit entspricht Googles kürzlich eingeführtes Code Assist-Tool einem Kontext für Supermavens Kontext von 1 Million Token. Was sind also die Vorteile von Supermaven gegenüber seinen Konkurrenten? Nun, Jackson behauptet, dass Babble aufgrund einer "neuen neuronalen Architektur" niedrigere Latenzzeiten aufweist. Er wollte nicht näher darauf eingehen, sondern sagte nur, dass die Architektur "von Grund auf" entwickelt wurde. "Supermaven benötigt 10 bis 20 Sekunden, um das Code-Repository eines Entwicklers zu verarbeiten und sich mit seinen APIs und den einzigartigen Konventionen seiner Codebasis vertraut zu machen", sagte Jackson. "Dank unserer hauseigenen Modell-Dienstinfrastruktur bleibt unser Tool reaktionsschnell, während es mit den langen Anforderungen arbeitet, die mit großen Codebasen einhergehen." Der Markt für KI-Codierungstools ist groß und wächst, Polaris Research prognostiziert, dass er bis 2032 27,17 Milliarden US-Dollar wert sein wird. Die überwältigende Mehrheit der Befragten in der neuesten Entwicklerumfrage von GitHub gibt an, dass sie AI-Tools in irgendeiner Form übernommen haben, und über 1,8 Millionen Menschen - und ~50.000 Unternehmen - zahlen für GitHub Copilot. Supermaven - zusammen mit Startup-Konkurrenten wie Cognition, Anysphere, Poolside, Codeium und Augment - haben jedoch ethische und rechtliche Herausforderungen zu überwinden. Unternehmen sind oft vorsichtig, ihr proprietäres Code öffentlich preiszugeben; zum Beispiel hat Apple im letzten Jahr angeblich Mitarbeitern die Verwendung von Copilot verboten, mit Verweis auf Bedenken bezüglich des Verlusts vertraulicher Daten. Einige Code-generierende Tools, die unter restriktiv lizenziertem oder urheberrechtlich geschütztem Code trainiert wurden, haben gezeigt, dass sie diesen Code wiedergeben, wenn sie auf eine bestimmte Weise aufgefordert werden, was ein Haftungsrisiko darstellt (d.h. Entwickler, die den Code integrieren, könnten verklagt werden). Und weil KI Fehler macht, können assistierende Codierungswerkzeuge dazu führen, dass mehr fehlerhafter und unsicherer Code in Codebasen eingeführt wird. Jackson sagte, dass Supermaven keine Kundendaten zur Schulung seiner Modelle verwendet. Er gab jedoch zu, dass das Unternehmen Daten für eine Woche behält, um "das System schnell und reaktionsschnell zu machen", sagte er. In Bezug auf das Urheberrecht leugnete Jackson nicht explizit, dass Babble auf IP-geschütztem Code trainiert wurde - nur dass es "fast ausschließlich auf öffentlich verfügbarem Code anstelle eines Scrapes des öffentlichen Internets" trainiert wurde, um die Belastung durch toxischen Inhalt während des Trainings zu verringern. Kunden scheinen nicht abgeschreckt zu sein. Über 35.000 Entwickler nutzen Supermaven, sagt Jackson, und ein beträchtlicher Teil zahlt für die Premium Pro (10 US-Dollar pro Monat) und Team (10 US-Dollar pro Monat pro Benutzung) Pläne. Der jährlich wiederkehrende Umsatz von Supermaven erreichte in diesem Jahr 1 Million US-Dollar auf der Basis einer Benutzerbasis, die sich seit dem Start der Plattform im Februar verzehnfacht hat. Dieses Momentum hat die Aufmerksamkeit von Risikokapitalgebern auf sich gezogen. Supermaven gab in dieser Woche seine erste externe Finanzierung bekannt: eine Runde von 12 Millionen US-Dollar, angeführt von Bessemer Venture Partners und namhaften Angel-Investoren, darunter der OpenAI-Mitgründer John Schulman und der Perplexity-Mitbegründer Denis Yarats. Jackson sagt, dass der Plan ist, das Geld für die Einstellung von Entwicklern (Supermaven hat derzeit ein fünfköpfiges Team) und die Entwicklung des Texteditors von Supermaven, der derzeit in der Beta-Phase ist, auszugeben. "Wir planen, bis Ende des Jahres deutlich zu wachsen", fügte er hinzu. „Trotz Gegenwinds für die Technologie insgesamt ist der Markt für Codierungs-Copiloten schnell gewachsen. Unser Wachstum seit unserem Start im Februar - sowie unsere jüngste Finanzierungsrunde - positionieren uns gut für das kommende Jahr."