Huawei versucht, einen größeren Anteil am chinesischen Markt für künstliche Intelligenz-Chips zu gewinnen, der von Nvidia dominiert wird, indem sie lokalen Unternehmen helfen, ihren Konkurrenz-Silizium für sogenannte „Inferenzaufgaben“ anzunehmen.
Führende KI-Unternehmen in China verlassen sich auf Grafikprozessoren (GPUs) von Nvidia, um große Sprachmodelle zu „trainieren“, wobei die Produkte des 3,4 Billionen Dollar US-Chipherstellers als entscheidend für die Entwicklung der Technologie angesehen werden.
Anstatt Nvidia im Training herauszufordern, positioniert Huawei seine neuesten Ascend KI-Prozessoren als Hardware der Wahl für chinesische Gruppen, die „Inferenz“ durchführen, die Berechnung, die von LLMs durchgeführt wird, um auf eine Anforderung zu reagieren.
Der chinesische Technologieriese setzt darauf, dass die Inferenz in Zukunft eine größere Nachfragequelle sein wird, wenn das Tempo des Modelltrainings nachlässt und KI-Anwendungen wie Chatbots weit verbreiteter werden.
„Das Training ist wichtig, aber es findet nur einige Male statt“, sagte Georgios Zacharopoulos, ein leitender KI-Forscher, der an der Beschleunigung der Inferenz bei Huaweis Züricher Labor arbeitet. „Huawei konzentriert sich hauptsächlich auf die Inferenz, die letztendlich mehr Kunden bedienen wird.“
Führende KI-Unternehmen in China verlassen sich auf Grafikprozessoren von Nvidia, um große Sprachmodelle zu „trainieren“ © Costfoto/NurPhoto via Getty Images
Es konzentriert sich auf den technisch weniger anspruchsvollen, aber potenziell lukrativen Weg, KI-Modelle, die auf Nvidia-Produkten trainiert wurden, auf Ascend-Chips umzurüsten, so Unternehmensmitarbeiter und Ascend-Kunden. Da Nvidia-GPUs und Ascend auf unterschiedlicher Software laufen, hilft Huawei Unternehmen, ein anderes Software-Tool zu nutzen, um die beiden Systeme kompatibel zu machen.
Huaweis Vorstoß erfolgt mit staatlicher Unterstützung von oben. Chinesische Beamte haben lokale Tech-Giganten dazu aufgefordert, mehr von Huaweis KI-Chips zu kaufen und sich von Nvidia abzuwenden.
Eine Person, die mit Nvidias Betrieb in China vertraut ist, sagte, dass Huawei intern als ernsthaftester Konkurrent im Land angesehen werde und dass dessen Chip-Designkapazität „fortgeschritten“ sei.
Washington hat versucht, die Entwicklung von KI in Peking mit Exportkontrollen zu bremsen, die darauf abzielen, die Entwicklung sensibler Technologien in China zu behindern.
Im Gegensatz zu ihren US-Rivalen wie OpenAI und Google können Unternehmen in China nicht auf die fortschrittlichsten GPUs zugreifen. Aber obwohl chinesische Gruppen nur in der Lage sind, die weniger leistungsfähigen Nvidia H20-Chips zu erwerben, die auf die Einhaltung von Exportkontrollen zugeschnitten sind, bleiben die weniger leistungsstarken GPUs aufgrund ihrer Überlegenheit gegenüber lokalen Alternativen sehr gefragt.
Im Gegensatz zu ihren US-Rivalen wie OpenAI und Google können chinesische Unternehmen nicht auf die fortschrittlichsten GPUs zugreifen © Glenn Chapman/AFP via Getty Images
Analysten und Huawei-Forscher sagten, dass Ascend bisher nicht bereit sei, Nvidia beim Modelltraining zu ersetzen, aufgrund von technischen Problemen, wie einer Störung der Interaktion der Chips innerhalb eines breiteren „Clusters“ von KI-Chips bei der Schulung immer größerer Modelle.
„Während die Ascend-Chips auf Einzelchipbasis gut abschneiden, gibt es einen Engpass bei der Inter-Chip-Konnektivität“, sagte Lin Qingyuan, Chinas Halbleiteranalyst bei Bernstein. „Bei der Schulung eines großen Modells muss man es in kleinere Aufgaben aufteilen. Wenn ein Chip ausfällt, muss die Software einen Weg finden, wie die anderen Chips ohne Verzögerung übernehmen können.“
Die andere Herausforderung für Huawei besteht darin, Entwickler davon zu überzeugen, von Nvidias Cuda-Software abzuweichen, die als das „Geheimnis der Sauce“ des Unternehmens gilt, weil sie für Entwickler einfach zu verwenden ist und die Datenverarbeitung erheblich beschleunigen kann.
Aber Huaweis demnächst erscheinende und aktualisierte Version seines KI-Chips, der Ascend 910C, soll diese Bedenken ebenfalls ansprechen. „Wir erwarten, dass diese neue Hardwaregeneration mit verbesserter Software geliefert wird, die sie für Entwickler zugänglicher macht“, sagte ein Huawei-Mitarbeiter, der nicht genannt werden wollte.
Huawei und Nvidia sehen sich starker Konkurrenz gegenüber. Der chinesische Internetkonzern Baidu und der Chipdesigner Cambricon haben Fortschritte bei der Entwicklung von KI-Chips gemacht. In den USA wetten auch Amazon und Microsoft darauf, mehr Marktanteile bei Chips für Inferenz zu gewinnen, da KI-Anwendungen immer verbreiteter werden.
Empfohlen
Schätzungen von SemiAnalysis, einem Chip-Beratungsunternehmen, deuten darauf hin, dass Nvidia im letzten Jahr in China einen Umsatz von 12 Mrd. US-Dollar erzielt hat, indem es 1 Mio. seiner H20-Chips im Land ausgeliefert hat, doppelt so viele KI-Chips wie Huawei mit seinem Ascend 910B verkauft hat.
„Nvidias spezielle H20-GPUs für China machen den Großteil der in China verkauften KI-Chips aus. Aber der Vorsprung schrumpft schnell, da Huawei die Produktionskapazität erhöht“, sagte Dylan Patel, Chefanalyst bei SemiAnalysis.
Brancheninsider warnten davor, dass Huaweis Vorstoß bei KI-Chips auch durch unzureichende Lieferungen eingeschränkt wird, wobei zwei potenzielle Kunden dem „Financial Times“ mitteilten, dass sie die Chips nicht beschaffen konnten.
Huawei hat nicht auf eine Anfrage nach einem Kommentar geantwortet. Nvidia lehnte eine Stellungnahme ab.
Analysten haben gesagt, dass Huaweis Fertigung wahrscheinlich aufgrund der US-Exportkontrollen vor Herausforderungen steht, die chinesische Fabs von veralteter Chip-Fertigungsausrüstung abhängig gemacht haben.
Chinesische Beamte haben lokale Tech-Giganten dazu aufgefordert, mehr von Huaweis KI-Chips zu kaufen und sich von Nvidia abzuwenden © CFOTO/Sipa USA via Reuters
Der Fokus auf Inferenz weist auch auf eine sich entwickelnde Dynamik in der chinesischen KI hin, die sich von der in den USA unterscheidet. Die Exportkontrollen der USA bedeuten, dass chinesische KI-Akteure nicht am gleichen Wettlauf wie die Silicon Valley-Rivalen Meta, Elon Musks x.AI und OpenAI beteiligt sind, um große Mega-Cluster von Nvidias fortschrittlichsten GPUs zu bauen.
„Chinesische Unternehmen spielen ein anderes Spiel. Sie achten viel mehr auf Inferenz als die USA, weil es möglich ist, große Effizienzgewinne auch mit weniger leistungsstarken Chips zu erzielen, was es auch schneller ermöglicht, die Kommerzialisierung zu erreichen“, sagte der Bernstein-Analyst Lin.
Chinesische Unternehmen setzen darauf, dass sie auf dem Gebiet der KI wettbewerbsfähig bleiben können, indem sie die Kosten der Inferenz senken, was wiederum dazu führt, dass es günstiger wird, KI-Anwendungen auszuführen, sagte er.
Letzten Monat veröffentlichte das in Hangzhou und Peking ansässige Start-up DeepSeek sein V3-Modell, das aufgrund seiner niedrigen Schulungs- und Inferenzkosten im Vergleich zu ähnlichen Modellen in den USA Aufmerksamkeit erregte.
Das Unternehmen schlug eine neue Methode vor, mit der ein KI-Modell selektiv auf bestimmte Teile von Eingabedaten fokussieren kann, um die Kosten für die Ausführung des Modells zu reduzieren. Es verwendete auch die bei anderen chinesischen KI-Start-ups beliebte Technik des „Mixture of Experts“, die ebenfalls dazu beiträgt, die Inferenz zu beschleunigen, da nur ein Teil des Modells verwendet wird, um eine Antwort zu generieren.
DeepSeek erklärte, dass Huawei V3 erfolgreich an Ascend angepasst hat und Entwicklern detaillierte Anweisungen zur Verwendung des Chips bereitgestellt hat. Die FT hatte zuvor berichtet, dass Huawei Ingenieure entsandt hatte, um Kunden bei der Migration von Nvidia zu Ascend zu unterstützen.
Zusätzliche Berichterstattung von Zijing Wu in Hongkong