Jack Ma-unterstütztes Ant preist KI-Durchbruch auf chinesischen Chips an.

Ant Group Co., unterstützt von Jack Ma, verwendete chinesische Halbleiter, um Techniken zur Schulung von KI-Modellen zu entwickeln, die die Kosten um 20% senken würden, so Personen, die mit der Angelegenheit vertraut sind.

Ant verwendete inländische Chips, darunter von verbundenen Unternehmen wie Alibaba Group Holding Ltd. und Huawei Technologies Co., um Modelle mit dem sogenannten Mixture of Experts-Maschinenlernansatz zu trainieren, sagten die Personen. Sie erzielten Ergebnisse, die denen von Nvidia Corp. Chips wie dem H800 ähneln, so die Personen, die darum baten, nicht namentlich genannt zu werden, da die Informationen nicht öffentlich sind.

Das in Hangzhou ansässige Ant nutzt Nvidia immer noch für die KI-Entwicklung, verlässt sich aber jetzt hauptsächlich auf Alternativen, einschließlich chinesischer Chips, für seine neuesten Modelle, sagte eine der Personen.

Die Modelle markieren Ants Einstieg in ein Rennen zwischen chinesischen und US-Unternehmen, das sich seit der Demonstration von DeepSeek beschleunigt hat, wie leistungsfähige Modelle für weit weniger als die Milliarden, die in OpenAI und Alphabet Inc.’s Google investiert wurden, trainiert werden können. Es verdeutlicht, wie chinesische Unternehmen versuchen, lokale Alternativen zu den fortschrittlichsten Nvidia-Halbleitern zu nutzen. Obwohl nicht die fortschrittlichsten, ist der H800 ein relativ leistungsstarker Prozessor und derzeit von den USA aus China verboten.

Das Unternehmen veröffentlichte in diesem Monat ein Forschungspapier, in dem behauptet wurde, dass seine Modelle in bestimmten Benchmarks zu bestimmten Zeiten Meta Platforms Inc. übertroffen haben, was von Bloomberg News nicht unabhängig bestätigt wurde. Aber wenn sie wie beworben funktionieren, könnten Ants Plattformen einen weiteren Schritt nach vorne für die chinesische künstliche Intelligenzentwicklung darstellen, indem sie die Kosten für das Inferencing oder die Unterstützung von KI-Diensten senken.

LESEN  Citigroup kürzt Beförderungen, während es versucht, die Bank umzustrukturieren.

Da Unternehmen erhebliche Geldmittel in KI investieren, haben sich MoE-Modelle als beliebte Option erwiesen und Anerkennung für ihren Einsatz durch Google und das Hangzhouer Startup DeepSeek erhalten, unter anderen. Diese Technik teilt Aufgaben in kleinere Datensätze auf, ähnlich wie bei einem Team von Spezialisten, die sich jeweils auf einen Teil einer Aufgabe konzentrieren, um den Prozess effizienter zu gestalten. Ant lehnte es ab, in einer per E-Mail versandten Erklärung Stellung zu nehmen.

Die Schulung von MoE-Modellen hängt in der Regel von leistungsstarken Chips wie den Grafikprozessoren ab, die von Nvidia verkauft werden. Die Kosten waren bisher für viele kleine Unternehmen prohibitiv und beschränkten die breitere Akzeptanz. Ant hat daran gearbeitet, LLMs effizienter zu trainieren und diese Einschränkung zu beseitigen. Der Titel seines Papiers macht das deutlich, da das Unternehmen das Ziel setzt, ein Modell „ohne Premium-GPUs“ zu skalieren.

Das geht gegen den Strich von Nvidia. CEO Jensen Huang argumentierte, dass die Rechennachfrage auch mit dem Aufkommen effizienterer Modelle wie DeepSeeks R1 steigen wird, und behauptete, dass Unternehmen bessere Chips benötigen werden, um mehr Einnahmen zu generieren, und nicht billigere, um Kosten zu senken. Er hielt an der Strategie fest, große GPUs mit mehr Prozessorkernen, Transistoren und erhöhter Speicherkapazität zu bauen.

Ant sagte, es koste etwa 6,35 Millionen Yuan (880.000 US-Dollar), um 1 Billion Tokens mit Hochleistungshardware zu trainieren, aber sein optimierter Ansatz würde das auf 5,1 Millionen Yuan mit weniger leistungsfähiger Hardware reduzieren. Tokens sind die Informationseinheiten, die ein Modell aufnimmt, um etwas über die Welt zu lernen und nützliche Antworten auf Benutzeranfragen zu liefern.

LESEN  Neue UK Non-Dom-Konzession "beschleunigt" Ausstiegspläne wohlhabender Personen

Das Unternehmen plant, den jüngsten Durchbruch bei den von ihm entwickelten großen Sprachmodellen, Ling-Plus und Ling-Lite, für industrielle KI-Lösungen einschließlich Gesundheitswesen und Finanzen zu nutzen, sagten die Personen.

Ant kaufte in diesem Jahr die chinesische Online-Plattform Haodf.com, um seine KI-Dienste im Gesundheitswesen zu stärken. Ant entwickelte den KI-Arztassistenten, um Haodfs 290.000 Ärzte bei Aufgaben wie der Verwaltung von Krankenakten zu unterstützen, teilte das Unternehmen in einer separaten Erklärung am Montag mit.

Das Unternehmen hat auch eine KI-„Lebensassistent“ -App namens Zhixiaobao und einen Finanzberatungs-KI-Service namens Maxiaocai.

In Bezug auf das Verständnis von Englisch sagte Ant in seinem Papier, dass das Ling-Lite-Modell in einem wichtigen Benchmark im Vergleich zu einem der Llama-Modelle von Meta besser abschnitt. Sowohl die Ling-Lite- als auch die Ling-Plus-Modelle übertrafen die Äquivalente von DeepSeek in chinesischen Benchmarks.

„Wenn Sie einen Angriffspunkt finden, um den weltbesten Kung-Fu-Meister zu schlagen, können Sie immer noch sagen, dass Sie ihn geschlagen haben, weshalb die Anwendung in der realen Welt wichtig ist“, sagte Robin Yu, Technischer Leiter des in Peking ansässigen KI-Lösungsanbieters Shengshang Tech Co.

Ant hat die Ling-Modelle Open Source gemacht. Ling-Lite enthält 16,8 Milliarden Parameter, die einstellbaren Einstellungen, die wie Knöpfe und Regler funktionieren, um die Leistung des Modells zu steuern. Ling-Plus hat 290 Milliarden Parameter, was im Bereich der Sprachmodelle als relativ groß betrachtet wird. Zum Vergleich schätzen Experten, dass ChatGPTs GPT-4.5 1,8 Billionen Parameter hat, laut dem MIT Technology Review. DeepSeek-R1 hat 671 Milliarden.

Das Unternehmen stand vor Herausforderungen in einigen Bereichen des Trainings, einschließlich der Stabilität. Selbst kleine Änderungen an der Hardware oder der Struktur des Modells führten zu Problemen, einschließlich Sprüngen in der Fehlerquote der Modelle, hieß es in dem Papier.

LESEN  CoreWeave’s Börsengang enttäuscht in den ersten Stunden - aber viele aufregende Technologie-IPOs bleiben in der Pipeline

Ant sagte am Montag, dass es Gesundheitsmodellmaschinen entwickelt habe, die von sieben Krankenhäusern und Gesundheitsdienstleistern in Städten wie Peking und Shanghai genutzt würden. Das große Modell nutzt DeepSeek R1, Alibabas Qwen und Ants eigenes LLM und kann medizinische Beratung durchführen, hieß es.

Das Unternehmen sagte auch, es habe zwei medizinische KI-Agenten eingeführt—Angel, der mehr als 1.000 medizinische Einrichtungen bedient hat, und Yibaoer, der medizinische Versicherungsdienste unterstützt. Im vergangenen September startete es den KI-Gesundheitsmanager-Service innerhalb von Alipay, seiner Zahlungs-App.

Diese Geschichte wurde ursprünglich auf Fortune.com vorgestellt