Chinas selbstbewusste KI-Industrie veröffentlicht Flut von Modellaktualisierungen.

Bleiben Sie informiert mit kostenlosen Updates

Chinesische Gruppen für künstliche Intelligenz haben vor dem chinesischen Neujahrsfest eilige Modellaktualisierungen herausgebracht, da die Welt die bedeutenden Fortschritte des Sektors unter der Führung von Start-up DeepSeek im Angesicht von US-Chipbeschränkungen erkennen.

Am Montag, dem Vorabend des wichtigsten jährlichen chinesischen Feiertags, veröffentlichte das in Hangzhou ansässige Unternehmen ein neues Open-Source-Modell für die Bildgenerierung und festigte seinen Ruf als disruptivster Akteur in einem Bereich, der zuvor von US-Riesen dominiert wurde. Es folgte kurz auf Modellveröffentlichungen des Technologieriesen Alibaba und der Start-ups Moonshot und Zhipu.

„Dies entspricht dem Veröffentlichen einer massiven Veröffentlichung am Heiligabend. Wir haben alle Überstunden gemacht, um vor den Feiertagen etwas herauszubringen“, sagte ein Produktmanager bei einem großen Start-up für Sprachmodelle.

Während der Erfolg von DeepSeek in den USA Panik über die Fortschritte chinesischer Labors auf bootstrapped Budgets ausgelöst hat, sagen Brancheninsider, dass er zu einem neuen „Vertrauen“ in China führt, das Investitionen anregen wird.

„DeepSeek hat schnellere Fortschritte gemacht als die anderen chinesischen Modellunternehmen. Aber das gibt ihnen das Vertrauen, dass sie aufholen können“, sagte ein KI-Investor in China.

DeepSeek hat mit einer Reihe von Modellveröffentlichungen weltweite Aufmerksamkeit erregt, die eine ähnliche Leistung wie die von US-Rivalen wie OpenAI und Meta zeigen, obwohl es behauptet, nur einen Bruchteil der Rechenressourcen zu haben und durch US-Exportbeschränkungen am Erwerb der neuesten Nvidia-Prozessoren gehindert wird. Letzte Woche veröffentlichte es sein R1-Argumentationsmodell, ein fortschrittliches Modell, das OpenAI’s o1 Konkurrenz macht und sich automatisch lernen und verbessern kann, ohne menschliche Aufsicht.

LESEN  Beileidsbekundungen von Kongressabgeordneten nach dem Tod von Jimmy Carter

„DeepSeek hat China’s KI-Akteure und, allgemeiner gesagt, die globale Open-Source-KI-Community mit Energie versorgt, die seine Erkenntnisse aus seinem R1-Papier nutzen wird, um Fortschritte bei Argumentationsmodellen zu erzielen“, sagte Wang Tiezhen, ein Ingenieur am KI-Forschungszentrum Hugging Face.

Diese Woche haben Investoren Aktien im Zusammenhang mit KI verkauft, wobei Nvidia am Montag fast 600 Mrd. USD an Marktwert verlor. Sie reagierten auf chinesische Durchbrüche, die zeigen, dass es möglich ist, leistungsstarke Modelle zu bauen, während sie eine andere Strategie als die US-amerikanische verfolgen, immer größere Rechencluster zu bauen, um im KI-Rennen voranzukommen.

Am Montag veröffentlichte Alibabas Qwen Qwen2.5-1M, eine Reihe neuer Modelle, die in der Lage sind, längere Eingaben zu verarbeiten, eine wichtige Entwicklung, die bedeuten würde, dass das Modell für KI-Agenten-Anwendungen mit höheren Speicheranforderungen eingesetzt werden könnte, so Wang.

Am selben Tag veröffentlichte DeepSeek Janus-Pro, ein Text-zu-Bild-Generierungsmodell, das laut eigenen Angaben einige Benchmarks von Konkurrenten wie OpenAI’s Dall-E 3 und Stability AI’s Stable Diffusion 3 übertreffen kann.

Zhipu, das bei seiner letzten Finanzierungsrunde im Dezember mit 3 Mrd. USD bewertet wurde, hat letzte Woche ein Update zu GLM-PC veröffentlicht. Das KI-Agentenmodell richtet sich an Unternehmenskunden und ermöglicht es Computern, automatisch Aufgaben wie das Ausfüllen von Formularen oder das Verdauen von Finanzberichten zu erledigen.

Obwohl Zhipu für seine LLM-Entwicklung nicht viel Aufmerksamkeit erregt hat, führt es unter lokalen KI-Start-ups bei der Kommerzialisierung seiner Technologie, mit Unterstützung von lokalen Regierungen und staatlichen Unternehmen, die mit dem in Peking ansässigen Unternehmen zusammenarbeiten, um seine Modelle bereitzustellen.

Letzte Woche hat ein weiteres in Peking ansässiges Start-up, Moonshot, das den beliebten KI-Chatbot Kimi besitzt, sein Argumentationsmodell auf Kimi k1.5 aktualisiert und starke Ergebnisse im Vergleich zu etablierten KI-Modellen für komplexe Argumentationsaufgaben gezeigt. Die neueste Version kann Texte und Bilder verarbeiten und dabei lange und komplexe Anfragen behandeln.

LESEN  Gehebelte Hedgefonds haben den Verkauf im August verstärkt, sagt die Fed

Es ist gängige Praxis für chinesische Technologieunternehmen, Produkte vor den langen Feiertagen zu veröffentlichen, wobei der zusätzliche Vorteil besteht, dass potenzielle Kunden mit viel freier Zeit während der Pause sie testen und erkunden können.

Sobald chinesische KI-Akteure von ihrer Pause zurückkehren, beginnt der Wettlauf, der führende Akteur bei der Entwicklung von KI-Anwendungen für den kommerziellen Einsatz zu werden. „Wenn KI-Agenten dramatischen kommerziellen Wert schaffen können, haben ein oder zwei der LLM-Spieler die Chance, sich in neue Generationen von Softwareunternehmen zu verwandeln“, sagte der KI-Investor.