DeepSeek nutzt Huawei-Chips für KI-Optimierung

Die AI-Frontlinien erhitzen sich mit DeepSeek, einem chinesischen KI-Modell, das behauptet, im Hinblick auf Kosten-Effizienz erheblich besser abzuschneiden als US-amerikanische Wettbewerber. Der offene Chatbot von DeepSeek hat die App in 51 Ländern an die Spitze der App Store-Charts katapultiert. Jetzt wurde bekannt, dass er auf einem KI-Chip von Huawei betrieben wird.
Das DeepSeek R1 LLM (Large Language Model) wurde auf der Nvidia H100 trainiert, verwendet jedoch den Ascend 910C-Chip für die Inferenz. Dies ist der Prozess, bei dem das trainierte Modell zur Generierung von Antworten genutzt wird.
Alexander Doria, ein Twitter-Nutzer, hebt hervor, dass dies eine viel größere Geschichte wert sein sollte: DeepSeek wurde auf der Nvidia H800 trainiert, läuft jedoch mit Inferenz auf den neuen chinesischen Chips von Huawei, dem 910C.
Die Informationen stammen von @Dorialexander, der darauf hinweist, dass die Ascend-Chips nicht für das Training zuständig sind, sodass die GPU-Stromanforderungen nicht so hoch sind. Allerdings limitiert die relativ geringere Leistung des Ascend 910C seine Eignung für das Training. Huawei plant, dieses Problem mit dem kommende 920C-Chip anzugehen, der darauf abzielt, mit dem führenden Nvidia-Chipset Blackwell B200 in der KI-Operation zu konkurrieren.