D’où ils viennent
DeepSeek est une boîte chinoise fondée en 2023 par Liang Wenfeng, dans une configuration assez particulière : c’est un spin-off de High-Flyer, un fonds quantitatif (hedge fund) basé à Hangzhou qui avait accumulé une grosse quantité de GPU NVIDIA avant que les sanctions américaines ne durcissent l’export vers la Chine. Le pari de Liang : prendre cette infrastructure surdimensionnée et la consacrer à entraîner des LLM frontier, en visant une efficacité maximale par dollar de compute.
Le résultat a surpris l’industrie. En 2024 puis surtout en 2025 avec DeepSeek-R1, la boîte a sorti des modèles de raisonnement open-weight qui se sont retrouvés au coude-à-coude avec les o1 d’OpenAI sur plusieurs benchmarks publics — à une fraction du coût et avec les poids publiés librement. L’effet sur le marché a été immédiat : les analystes US ont commencé à questionner les valorisations des frontier labs, et les développeurs ont migré une partie de leurs workloads d’inférence vers DeepSeek pour le ratio prix/performance.
En 2026, DeepSeek est solidement installée comme acteur frontier-adjacent : pas toujours en tête sur les benchmarks absolus, mais imbattable sur le rapport qualité/coût et avec un écosystème open-source qui prolonge l’impact de chaque release.
Ce que c’est vraiment
DeepSeek propose deux choses :
1. Le chat web sur chat.deepseek.com — interface simple, en anglais principalement, accès gratuit aux modèles principaux avec quota raisonnable. C’est l’équivalent de ChatGPT mais avec une UI plus dépouillée et un focus utilitaire.
2. La plateforme API sur platform.deepseek.com — endpoints compatibles avec le format OpenAI dans leurs appels, facturation au token via crédits prépayés. C’est ici que se trouve le vrai argument DeepSeek : le prix.
Capacités principales :
- Modèles chat généralistes (famille V2, V3 et successeurs)
- Modèles de code (DeepSeek-Coder)
- Modèles de raisonnement (R1 et descendants) — l’équivalent open-weight des o1/o3
- Fonction calling standard
- Plusieurs versions en open-weight publiées sur Hugging Face sous licences permissives
- Contexte long sur les versions récentes (variable selon le modèle)
L’argument central : pour un modèle équivalent à un Claude Haiku ou un GPT-4o-mini, le prix API est souvent 5 à 10 fois plus bas. Pour un workflow où tu envoies 100 000 prompts par jour pour de la classification ou de l’extraction, l’économie devient massive.
Comment ça s’utilise
Pour un développeur qui veut tester DeepSeek en remplacement ou complément :
- Tu testes d’abord sur chat.deepseek.com sur tes vrais use cases (français, anglais, code) pour voir si la qualité te convient
- Si tu valides, tu crées un compte sur platform.deepseek.com, tu achètes des crédits prépayés (carte ou alternatives selon la juridiction)
- Tu génères une clé API et tu pointes ton code vers l’endpoint DeepSeek (compatible OpenAI dans la forme des appels)
- Tu choisis le modèle : chat généraliste pour la majorité des tâches, R1/raisonnement pour les chaînes de pensée complexes, coder pour la génération de code
- Si la souveraineté pose problème, tu utilises plutôt les modèles open-weight via Together AI, Fireworks, OpenRouter ou Groq — tu gardes le rapport qualité/prix sans envoyer tes données sur infra chinoise
Le sweet spot DeepSeek pour un opérateur québécois : les workflows internes non sensibles (idéation, brainstorming, classification de docs publics, traduction de contenu marketing) où le coût en bulk compte plus que la souveraineté.
Pour qui c’est fait
DeepSeek cible les développeurs et les boîtes qui veulent un LLM compétent sans payer le tarif premium des frontier labs US.
Public idéal :
- Indie hackers et solo opérateurs qui font de l’inférence en bulk sur petit budget
- Équipes ML qui veulent fine-tuner ou auto-héberger un open-weight performant
- Researchers qui benchmarkent et expérimentent sur des modèles ouverts
- Développeurs price-sensitive sur des tâches non frontier (classification, extraction, résumés)
- Power users curieux qui veulent voir comment l’écosystème chinois se compare aux frontier US
Public moins adapté : les boîtes qui traitent des données personnelles de clients (souveraineté chinoise = problème Loi 25), les workflows business-critical qui demandent SLA et support enterprise mature, les utilisateurs qui veulent un écosystème d’applications grand public (ChatGPT et Claude restent loin devant sur ce point), et les PME qui ont besoin d’un fournisseur qui parle français business naturellement (Mistral est mieux placé).
Le verdict de la Taverne
Soyons clairs : je n’utilise pas DeepSeek pour mes workflows client. Pour LeadLoup, pour le contenu Taverne, pour Complexe Kia, mes données passent par Claude (Anthropic) et accessoirement OpenAI — deux fournisseurs avec des engagements de non-rétention et non-réentraînement explicites, et des juridictions où je suis confortable.
Mais DeepSeek mérite sa place dans la fiche encyclopédique pour deux raisons.
Ce qui me garde curieux :
- Le prix API défie toute concurrence. Pour des workloads d’inférence en bulk sur des données non sensibles (idéation, classification publique, traduction marketing), l’écart de prix par rapport à GPT et Claude est suffisant pour justifier des projets entiers qui n’auraient pas été économiquement viables autrement.
- L’open-weight est sérieux. Plusieurs modèles DeepSeek tournent dignement sur du matériel raisonnable (via Ollama, vLLM, llama.cpp). Pour un développeur qui veut une vraie option auto-hébergée frontier-adjacent, c’est probablement le meilleur choix en 2026 avec les Mixtral et Llama récents.
- R1 a changé le débat industriel. L’arrivée d’un modèle de raisonnement open-weight compétitif a redéfini les attentes de prix sur tout le marché. Même si tu n’utilises pas DeepSeek, l’écosystème entier est devenu moins cher grâce à eux.
Ce qui m’agace :
- La souveraineté chinoise est le no-go par défaut pour mes workflows clients. Envoyer des données B2B québécoises sur une API chinoise sans engagement de non-rétention clair, c’est un risque réglementaire et réputationnel que je ne prends pas.
- Pas de programme affiliate ni de structure commerciale qui invite à recommander. La fiche existe purement pour la complétude éditoriale.
- L’UI et la doc en anglais/chinois rendent l’onboarding moins fluide pour un opérateur francophone que Mistral ou Claude.
Bottom line : si tu fais de l’inférence en bulk sur des données non sensibles, DeepSeek mérite un test sérieux — directement via leur API ou via un proxy comme OpenRouter pour éviter le risque souveraineté. Pour tout ce qui touche des données clients réelles, je reste sur Claude par défaut.
Au Québec
L’interface est principalement en anglais (et chinois sur certaines pages). Le français en sortie est correct mais clairement moins naturel que Mistral ou Claude — l’entraînement n’a pas mis le FR au centre. Facturation via la plateforme propriétaire en USD, par carte ou crédits prépayés selon la juridiction.
Pour la Loi 25, c’est le point critique. DeepSeek opère sur infrastructure chinoise et les engagements publics sur la non-rétention, la non-utilisation pour réentraînement et l’absence de transfert hors Chine sont moins explicites que chez Anthropic, OpenAI ou Mistral. Pour des données personnelles de clients québécois (emails individuels, dossiers santé, RH), c’est généralement un no-go au regard d’une analyse Loi 25 prudente.
La voie propre si tu veux profiter du rapport qualité/prix sans le risque souveraineté : utiliser les modèles open-weight DeepSeek via un fournisseur tiers nord-américain ou européen — Together AI, Fireworks, OpenRouter, Groq. Tu gardes les modèles, tu changes l’infrastructure. C’est l’arbitrage que la majorité des opérateurs sérieux font en 2026.
L’usage API ou les crédits restent déductibles comme dépense d’exploitation pour entreprises et travailleurs autonomes au Québec.