Huawei propulse l'IA de DeepSeek

La bataille de l'IA s'intensifie avec l'émergence de DeepSeek, un modèle d'intelligence artificielle chinois qui prétend surpasser ses concurrents américains en matière d'efficacité des coûts. Son chatbot open-source a propulsé l'application au sommet de l'App Store dans 51 pays, et il a été révélé qu'il fonctionne grâce à une puce AI de Huawei.
Le modèle LLM (large-language model) DeepSeek R1 a été formé sur les Nvidia H100, mais utilise une puce Ascend 910C pour l'inférence, c'est-à-dire pour générer des réponses à partir du modèle entraîné. Cette information a été partagée par @Dorialexander, qui souligne que les puces Ascend ne sont pas utilisées pour l’entraînement, ce qui réduit les exigences en matière de puissance GPU.
Cependant, la performance relativement inférieure de l'Ascend 910C limite sa capacité pour l'entraînement. Pour remédier à ce problème, Huawei prévoit de lancer la puce 920C, qui vise à rivaliser avec le Blackwell B200, le chipset Nvidia leader dans les opérations d'IA.