D’où ils viennent
Apify a été fondé en 2015 à Prague par Jan Čurn — un développeur tchèque qui avait construit son propre crawler basé sur PhantomJS pour des projets internes. L’idée s’est cristallisée : la majorité des entreprises avaient besoin de scraper des données du web (prix concurrents, leads B2B, surveillance médias, monitoring inventaires), mais peu avaient les compétences ou la patience de gérer l’infra anti-bot (proxies, rotation IP, headless browsers, retries, captchas).
Apify a démarré comme un crawler open-source, puis a évolué vers une plateforme managée en 2017. Le pari stratégique majeur de 2019 : ouvrir l’Apify Store où des développeurs tiers peuvent publier et monétiser leurs propres Actors (scrapers packagés). Aujourd’hui en 2026, plus de 3 000 Actors sont disponibles — gratuits ou payants — couvrant à peu près tout ce qui se scrape : Google Maps, LinkedIn, Facebook Marketplace, Instagram, TikTok, Amazon, Indeed, AutoTrader, Kijiji, etc.
La société est restée bootstrappée pendant longtemps avant une Series A modeste. Pas de hype excessif, pas de pivot constant — Apify est resté focalisé sur le scraping et est devenu l’un des leaders mondiaux du segment.
Ce que c’est vraiment
Apify est une plateforme cloud de scraping avec deux modes d’usage :
Mode 1 : Actors prêts à l’emploi
Tu vas sur Apify Store, tu cherches « Google Maps Scraper » ou « Facebook Ad Library Scraper », tu cliques « Try for free », tu rentres les paramètres dans un formulaire (URL ou keywords, ville, max results, langue, etc.), tu lances. Le scraper tourne sur l’infra Apify, et tu télécharges le dataset une fois fini.
Mode 2 : Scrapers custom avec Crawlee
Tu installes Crawlee (framework open-source maintenu par Apify, Node.js ou Python) localement, tu codes ton scraper avec Playwright/Puppeteer/Cheerio + helpers anti-bot, puis tu le déploies sur Apify Cloud avec une commande. Le scraper tourne avec proxies, retries, concurrence gérée automatiquement.
Capacités principales :
- 3 000+ Actors dans le Store (gratuits + payants)
- Proxies datacenter inclus sur tous les plans payants
- Proxies résidentiels inclus sur Scale et Business (pour sites lourdement protégés)
- Datasets — stockage temporaire de tes résultats (30-90 jours selon plan)
- Key-value stores — pour métadonnées et files
- Request queues — gestion de listes d’URLs à traiter
- Webhooks — notification quand un run termine
- API REST + SDKs Python/Node officiels
- Scheduling — exécuter un Actor automatiquement (cron)
Modèle de facturation : à l’usage, en compute units (CU) et stockage. Chaque Actor a un coût indicatif par mille résultats. Pour un solo opérateur sur Starter à 49 USD/mois, tu peux raisonnablement scrapper 5 000-15 000 résultats Google Maps + 1 000-3 000 LinkedIn par mois selon les Actors choisis.
Comment ça s’utilise
Pour un opérateur lead gen B2B qui scrape Google Maps au Québec :
- Tu vas sur Apify Store, tu cherches « Google Maps Extractor » (le populaire de compass/apify)
- Tu rentres les paramètres —
"plombier à Montréal",max_items: 100,max_total_charge_usd: 5(le hard cap, mandatoire) - Tu lances — Apify exécute, ~2-5 minutes pour 100 résultats
- Tu télécharges le JSON/CSV avec nom, adresse, téléphone, site web, rating, reviews, etc.
- Tu push dans HubSpot ou ton CRM via Make, ou tu enrichis avec un autre script
Pour Taverne AI, Apify n’est pas utilisé directement (le site éditorial n’a pas besoin de scraping). Pour LeadLoup, c’est central : Google Maps scraping pour acquérir des prospects ciblés (par niche × ville), Meta Ad Library scraping pour analyser les ads concurrents avant chaque PDF démo client, AutoTrader/Kijiji scraping pour le projet Complexe Kia (sourcing véhicules).
Le truc qui change vraiment : Apify abstrait l’enfer anti-bot moderne. Pour scraper Google Maps en 2026, il faut gérer JS-rendered DOM, rotating user agents, residential proxies, captcha solving, rate limiting. Apify s’en occupe — tu rentres tes paramètres et tu attends le résultat.
Pour qui c’est fait
Apify est conçu pour les opérateurs qui ont besoin de données du web sans devenir développeurs scrapers. Si tu sais coder en Python et tu veux tout faire toi-même avec Playwright + proxies achetés séparément, tu peux. Mais c’est rarement plus efficient en temps et en argent que de payer Apify.
Public idéal :
- Solo opérateurs lead gen qui scrapent par niche × région (le cas LeadLoup)
- Agences B2B qui livrent des listes de prospects qualifiés
- Marketers qui surveillent prix, inventaires, ads concurrents
- Researchers qui collectent du data pour analyse (jurisprudence permettant)
- Développeurs qui veulent prototyper rapidement un scraper sans monter d’infra
Public moins adapté : les workflows où le scraping est ultra-occasionnel (Beautiful Soup + un proxy gratuit suffit), les très très gros volumes où négocier directement avec des data providers (Bright Data, Smartproxy) revient moins cher, et les workflows où la conformité Loi 25/RGPD demande de ne pas scrapper du tout (rester sur de l’enrichissement légal type Clearbit).
Le verdict de la Taverne
Apify est dans mon stack daily depuis 2 ans. Pour LeadLoup, c’est l’outil qui acquiert les prospects (Google Maps scraping par niche × région) et qui audite les concurrents (Meta Ad Library avant chaque PDF démo). Pour le projet Complexe Kia, c’est l’outil qui sourcing les véhicules sur Kijiji et AutoTrader.
Ce qui me garde dessus :
- Le catalogue d’Actors est imbattable. 3 000+ scrapers prêts à l’emploi, dont beaucoup gratuits. Tu peux scraper Google Maps, LinkedIn (avec compte/limites), Facebook Marketplace, Meta Ad Library, Apple Maps, en 5 minutes sans coder.
- Crawlee est solide pour les scrapers custom. Pour LeadLoup, plusieurs Actors maison sont sur Crawlee + Playwright, déployés sur Apify Cloud.
- L’infra anti-bot est gérée. Tu ne penses pas aux proxies, rotation, captchas. Tu rentres les paramètres et tu attends.
- Le programme affiliate à 20-30 % lifetime jusqu’à 2 500 USD par client est honnête. Pour un créateur lead gen qui parle scraping toute la journée, c’est l’un des deals affiliate les plus naturels.
Ce qui m’agace :
- Les coûts qui explosent sans hard cap. Mémoire feedback Apify hard cap :
max_total_charge_usdau niveau.call()est mandatoire dans mon code Python. Sans ça, une boucle infinie peut coûter 100 USD en une nuit (incident 9.27 USD FB MP déjà vécu). - TPS/TVQ ajoutée depuis 2026 — Apify a activé Stripe Tax, donc plus de tax-free advantage pour les comptes canadiens. ~14.975 % de plus sur la facture.
- Documentation fragmentée. Tu trouves des infos sur 5 endroits différents (docs officielles, Apify Academy, communauté Discord, GitHub Crawlee, Reddit r/apify). Pour les use cases avancés, faut chercher.
- Cookie affiliate court (30 jours) — pas génial pour la conversion à long terme.
Bottom line : si tu fais du scraping B2B sérieusement en 2026, Apify est probablement le bon défaut. Plan Free pour tester, Starter à 49 USD/mois pour usage régulier, Scale à 499 USD/mois pour les volumes agence.
Disclosure affiliate : si tu signes via mon lien Apify, je touche 20 % les 3 premiers mois puis 30 % à vie (jusqu’à 2 500 USD par client). Apify est dans mon stack daily depuis 2 ans — donc la recommandation est aussi authentique que possible. Pour un opérateur lead gen B2B francophone, c’est probablement l’un des 3 outils les plus rentables à recommander honnêtement.
Au Québec
L’interface est en anglais seulement (pas de localisation FR). Facturation USD via Stripe (~38 % de change en CAD). TPS/TVQ ajoutée automatiquement depuis 2026 — Apify a activé Stripe Tax pour les comptes canadiens. Pas anodin : ~14.975 % de plus sur ta facture mensuelle versus 2024-2025.
Conformité Loi 25 : si tu scrapes des données personnelles (emails individuels, téléphones, profils LinkedIn nominatifs), tu deviens responsable du traitement au sens de la Loi 25. Tu dois pouvoir :
- Justifier une finalité commerciale légitime (prospection B2B avec relation d’affaires raisonnable)
- Supporter le droit à l’oubli (supprimer un contact sur demande)
- Stocker de manière sécurisée
- Documenter ton processus
Pour le B2B-to-B2B (entreprises vers entreprises), c’est plus souple — les emails pros publiés publiquement (site web, LinkedIn) sont considérés comme acceptés pour usage commercial implicite. Pour le B2C (consommateur), c’est beaucoup plus strict — éviter le scraping de données personnelles consommateurs sans consentement explicite.
Apify lui-même fournit un DPA sur demande pour les usages B2B sérieux. Pour les workflows juridiquement sensibles (santé, finance, scraping de données protégées), consulter un avocat québécois spécialisé en droit numérique.
L’abonnement Apify et l’usage sont déductibles comme dépense d’exploitation pour entreprises et travailleurs autonomes au Québec.