Présentation de DeepSeek
DeepSeek est une entreprise chinoise émergente dans le secteur de l’intelligence artificielle, fondée en 2023.
Elle représente potentiellement une réponse chinoise à ChatGPT et a récemment fait sensation en devenant l’application la plus téléchargée aux États-Unis.
Les modèles développés par DeepSeek, appelés LLM (Large Language Models), se caractérisent par leur efficacité et leurs coûts remarquablement faibles.
Cette perturbation du marché soulève des interrogations quant à l’impact de DeepSeek sur les géants américains de la tech.
Les modèles de DeepSeek
1. DeepSeek V3 :
– Modèle polyvalent, similaire à GPT-4 et à G chez Google.
– Capable de générer du texte, d’analyser des documents longs et de discuter efficacement.
– Évalué comme étant quasi équivalent à GPT-4 tout en coûtant significativement moins.
2. DeepSeek R1 :
– Modèle d’avant-garde, conçu pour aborder des problématiques complexes.
– Adopte une approche réflexive, posant plusieurs questions avant de fournir une réponse contextuelle.
– Considéré comme le meilleur modèle de réflexion du marché, à moindre coût par réponse.
Économie et approche technique
Le coût de développement de DeepSeek est remarquablement bas, s’élevant à seulement 5 millions de dollars, utilisant des GPU NVIDIA H800 vieillissants.
Cette entreprise utilise un système connu sous le nom de « mix d’expert », où un grand nombre de paramètres (671 milliards) est activé de manière ciblée pour réduire la consommation de mémoire et les coûts.
Pour 1 million de tokens générés, le coût avec DeepSeek est de 2,19 dollars, comparé à 60 dollars chez OpenAI.
Considérations liées à la censure
Il est important de noter que DeepSeek, comme d’autres technologies chinoises, est soumise à des règles de censure.
Lorsque des sujets sensibles, comme le Parti communiste chinois, sont évoqués, le modèle se refuse à répondre.
Cependant, le code de DeepSeek est Open Source, permettant à d’autres entreprises, notamment américaines, de le déployer sans censure sur leurs propres serveurs.
Impact et perspectives d’avenir
Il est plausible que DeepSeek continue de croître, perturbant ainsi le marché au point d’inciter des entreprises comme OpenAI et Google à réévaluer leurs approches et coûts.
Les innovations à venir de DeepSeek, notamment un potentiel modèle R2, pourraient également influencer la compétition dans le domaine de l’IA.
La dynamique actuelle montre que la Chine, loin d’être en retard, démontre une capacité à innover de manière efficace, soulignant la diversité des stratégies d’intelligence artificielle.
Cette situation marque le début d’une nouvelle ère dans le secteur de l’IA, où la rivalité entre les États-Unis et la Chine pourrait s’intensifier.
