DeepSeek repousse le lancement de son nouveau modèle d'IA à cause des puces Huawei
La société chinoise d'intelligence artificielle DeepSeek a annoncé le report du lancement de son nouveau modèle en raison de difficultés rencontrées lors de l'entraînement de ce modèle sur les puces Ascend de Huawei, selon Reuters. Cette situation met en lumière les limites actuelles du secteur chinois des semi-conducteurs et questionne la capacité de Pékin à se défaire de sa dépendance à la technologie américaine, en particulier aux puces Nvidia.
DeepSeek a tenté de se conformer à la politique du gouvernement chinois visant à substituer les composants américains par des alternatives nationales en entraînant son modèle R2 sur les puces Ascend de Huawei. Malgré l'assistance directe d'une équipe d'ingénieurs envoyée par Huawei, DeepSeek a dû finalement se rabattre sur des puces Nvidia pour la phase cruciale d'entraînement, se contentant d'utiliser les puces Ascend pour l’inférence, c’est-à-dire l’utilisation du modèle déjà entraîné.
Les défis technologiques des semi-conducteurs chinois
Les difficultés rencontrées concernent principalement la stabilité, la vitesse de communication entre les puces et l’efficience logicielle des solutions nationales face aux cartes Nvidia, largement considérées comme la référence mondiale en IA.
Les puces Ascend éprouvent des difficultés dans les tâches d’entraînement massivement parallèles et intensives en données, entraînant des erreurs récurrentes et un rendement inférieur à celui des GPU américains.
La dépendance persistante à l'égard de Nvidia et la stratégie de Pékin
Malgré l'interdiction américaine sur certaines exportations de puces haut de gamme, Nvidia continue de dominer le marché chinois avec son modèle H20, adapté pour répondre aux exigences sanitaires américaines. Les autorités chinoises, soucieuses de renforcer la sécurité nationale, pressent pourtant les acteurs locaux d’adopter les solutions comme Ascend, tout en demandant des justifications pour chaque commande de puces Nvidia. La rivalité géopolitique se double donc d’un enjeu de compétitivité purement technologique.
Conséquences pour DeepSeek et l'écosystème IA chinois
Le retard du modèle R2 a eu un impact direct sur la compétitivité de DeepSeek, son taux d’utilisation étant tombé à 3%, alors qu’il était de 50% en début d’année. Le fondateur de l’entreprise, Liang Wenfeng, a exprimé son insatisfaction face aux performances actuelles, plaidant pour davantage de temps afin de développer un modèle meilleur tout en accélérant la maturation des alternatives chinoises.


