Ein neuer Ansatz namens DualPipe scheint der Schlüssel zum Erfolg von DeekSeek zu sein. Ein Experte beschreibt es als eine virtuelle DPU auf der GPU, die die Bandbreiteneffizienz maximiert. Während DeepSeek bisher nur Nvidia-GPUs verwendet hat, fragt man sich, wie sich AMDs Instinct schlagen würde.
Chinas DeepSeek KI-Chatbot hat die Technologiebranche verblüfft und stellt eine glaubwürdige Alternative zu OpenAIs ChatGPT zu einem Bruchteil der Kosten dar. Eine kürzlich veröffentlichte Studie enthüllte, dass DeepSeek V3 auf einem Cluster von 2.048 Nvidia H800-GPUs trainiert wurde – beschnittene Versionen des H100 (man kann nur erahnen, wie viel leistungsstärker es wäre, wenn es auf AMD Instinct-Beschleunigern laufen würde!). Es soll 2,79 Millionen GPU-Stunden für das Pretraining, das Feintuning auf 14,8 Billionen Tokens und laut Berechnungen von The Next Platform nur 5,58 Millionen Dollar gekostet haben.
Aber wie genau die Entwickler von DeepSeek dieses Kunststück geschafft haben, könnte auf einen cleveren Hack zurückzuführen sein.