Scraping LinkedIn : la méthode 2026 (légale et sans ban)
Comment scraper LinkedIn en 2026 sans se faire ban : méthodes légales, outils comparés (Emelia, Phantombuster, Waalaxy), règles RGPD et alternatives propres.
Le scraping LinkedIn consiste à extraire automatiquement des données publiques de profils ou de pages entreprise typiquement à partir d'une recherche Sales Navigator pour construire une liste de prospects exportable. La pratique est techniquement interdite par les CGU LinkedIn, mais autorisée sous conditions par la jurisprudence européenne (données publiques, finalité légitime B2B, conformité RGPD). Le vrai risque, c'est le ban du compte LinkedIn temporaire pour les premiers excès, permanent en cas de récidive. Les outils principaux en 2026 sont Emelia (scraper Sales Navigator natif intégré), Phantombuster (la boîte à outils du growth), Waalaxy (no-code simple) et La Growth Machine (multichannel). Pour éviter le risque de ban tout en restant productif, l'alternative la plus propre reste d'utiliser une base de données B2B externe (Basile, Pharow) qui fournit la même donnée en exports CSV illimités, sans toucher à LinkedIn
C'est quoi le scraping LinkedIn ?
Le scraping LinkedIn est une technique d'extraction automatisée qui récupère des données publiques depuis l'interface LinkedIn profils utilisateurs, pages entreprise, résultats de recherche Sales Navigator pour les transformer en CSV ou les pousser dans un CRM. Concrètement, un scraper simule la navigation d'un utilisateur (en local via une extension Chrome ou en cloud via un navigateur headless), parcourt les pages, extrait les champs visibles (nom, poste, entreprise, secteur, lien profil) et les compile en base.
C'est la seule façon d'exporter à grande échelle depuis LinkedIn, puisque la plateforme ne propose aucun export CSV natif, même sur Sales Navigator. Les recherches y sont plafonnées à 2 500 résultats, et copier-coller manuellement au-delà de quelques dizaines de profils est ingérable. Le scraping résout ce problème au prix d'une zone grise juridique et d'un risque réel de ban.
Les cas d'usage typiques : construire une liste de prospects à partir d'une recherche Sales Navigator filtrée (ex. CTO de SaaS B2B français de 50-200 personnes), enrichir un fichier d'entreprises avec les profils décideurs LinkedIn associés, surveiller des changements de poste sur un panel de comptes ABM, extraire les listes de membres d'un groupe LinkedIn ou les engagements sur un post viral.
Le scraping LinkedIn est-il légal en 2026 ?
C'est la question qui revient le plus souvent et la réponse est nuancée. Il faut distinguer trois niveaux : les CGU LinkedIn, le RGPD et la jurisprudence.
Côté CGU LinkedIn
LinkedIn interdit explicitement le scraping dans ses Conditions Générales d'Utilisation (article 8.2). Si LinkedIn détecte une activité de scraping sur un compte, la plateforme peut bannir le compte temporairement ou définitivement, sans préavis et sans recours. Le risque est réel : un compte LinkedIn de 5 ans de réseau perdu en 24h, c'est un coût caché du scraping qu'il faut anticiper.
LinkedIn a également poursuivi en justice plusieurs entreprises de scraping ces dernières années, le plus souvent en visant les revendeurs de données scrapées. Les utilisateurs finaux sont rarement attaqués directement, mais le risque existe pour les usages massifs et industrialisés.
Côté RGPD et droit européen
Le RGPD ne mentionne pas le scraping nominalement. Ce qui compte, c'est la finalité du traitement et la base légale. Pour la prospection B2B, la base légale est généralement l'intérêt légitime (article 6.1.f), sous condition que les données soient collectées sur des sources légitimes, que la finalité soit liée à la fonction professionnelle du prospect, et qu'un mécanisme d'opt-out simple soit fourni à chaque message.
La CNIL a publié plusieurs guides sur la prospection B2B qui confirment cette logique : le scraping de données publiques pour de la prospection commerciale B2B est toléré tant que les conditions ci-dessus sont respectées. La grande zone grise concerne les données dites « hybrides » (email perso, numéro de portable) que LinkedIn affiche parfois sur les profils leur scraping est plus risqué juridiquement.
Côté jurisprudence
L'arrêt clé est hiQ Labs vs LinkedIn (Cour d'appel des États-Unis, confirmé en 2022) : le scraping de données publiquement accessibles sur LinkedIn ne constitue pas une violation du Computer Fraud and Abuse Act. Au niveau européen, plusieurs décisions de tribunaux nationaux (France, Allemagne) ont également penché vers la légalité du scraping de données publiques pour des finalités B2B légitimes.
En résumé : le scraping LinkedIn est autorisé sous conditions par le droit européen, mais interdit par les CGU LinkedIn. Tu n'iras probablement pas en prison, mais ton compte LinkedIn peut être banni du jour au lendemain. C'est un calcul risque/bénéfice à faire en amont.
Les 4 méthodes de scraping LinkedIn
Il existe quatre approches techniques, qui se distinguent par le niveau de risque, le coût et le volume gérable.
1. L'extension Chrome (browser-based)
Tu installes une extension comme Emelia, Bardeen, Wiza sur ton navigateur. L'extension utilise ta session LinkedIn locale pour naviguer et extraire les données. Avantages : simple, pas d'IP suspecte (c'est ton vrai ordi qui scrape), risque de ban modéré tant que tu respectes les rate limits. Inconvénients : tu dois laisser ton navigateur ouvert pendant l'extraction, le volume est limité (quelques centaines de profils par session sauf si l'outil gère la segmentation automatique), et tu prends le risque sur ton compte personnel.
2. Le scraping cloud (browser headless)
https://youtu.be/GsfNDrusCBc?si=pdnlhZeP9CaneaOj
Tu confies tes credentials LinkedIn à une plateforme cloud (Emelia, Phantombuster, Captain Data, La Growth Machine) qui lance un navigateur headless dans ses serveurs et exécute le scraping pour toi.
Avantages : tu n'as rien à faire (le scraping tourne 24/7), volume élevé (plusieurs milliers de profils par jour), gestion des proxies inclus.
Inconvénients : tu donnes tes credentials à un tiers (risque de sécurité), l'IP cloud est plus facilement détectée par LinkedIn comme suspecte (risque de ban accru), et le coût grimpe vite avec le volume.
3. L'API LinkedIn officielle (limited)
LinkedIn propose une API officielle, mais elle est très restrictive : limitée à des partenaires officiels (Salesforce, HubSpot, Salesloft pour les CRM), et réservée à des cas d'usage précis (sync CRM, posts, ads). Pour du scraping de prospects, l'API officielle ne donne pas accès aux résultats Sales Navigator c'est pourquoi 99 % des outils de scraping sur le marché passent en réalité par les méthodes 1 ou 2.
4. La base de données externe (zéro scraping)
Au lieu de scraper LinkedIn, tu utilises une base de données B2B externe (comme Basile), qui agrège des sources légales (INSEE, BODACC, DGFIP, données ouvertes, profils LinkedIn entreprise publics) et propose des exports CSV en natif.
Avantages : aucun risque de ban, conformité RGPD claire, données souvent plus complètes (SIREN, CA, effectif déclaré absents de LinkedIn).
Inconvénients : couverture France principalement (les bases internationales comme Apollo ou Cognism sont moins précises sur les TPE/PME FR), et pour des décideurs très précis.
Comparatif des outils de scraping LinkedIn en 2026
Cinq outils dominent le marché 2026, avec des positionnements très différents.
Outil | Type | Tarif d'entrée | Pour qui |
|---|---|---|---|
Emelia | Cloud (intégré dans plateforme outbound) | 37 €/mois | TPE/PME FR, agences |
Phantombuster | Cloud (scrapers paramétrables) | 69 $/mois | Growth marketers, devs |
Waalaxy | Cloud (no-code simple) | 19 €/mois | Solo, freelances |
La Growth Machine | Cloud (multichannel) | 60 €/mois (par identité) | Équipes outbound |
Bardeen | Extension Chrome (no-code) | Free / 15-99 $/mois | Solo, expérimentation |
Captain Data, qui était la référence enterprise, a arrêté son produit no-code fin 2025 pour pivoter vers une plateforme API-first à 399 $/mois minimum, dédiée aux développeurs. Elle n'est donc plus dans la liste pour les utilisateurs finaux sales.
Les outils détaillés
Emelia: le scraper Sales Nav intégré dans une plateforme outbound
Emelia est l'un des seuls outils à proposer une extension Chrome dédiée à Sales Navigator couplée à une plateforme outbound complète.
Le workflow concret est décrit étape par étape : install depuis Chrome Web Store → bouton « Export with Emelia » qui apparaît sur Sales Nav → clic → popup avec URL pré-remplie → naming de l'export → scraping.
La segmentation automatique qui contourne la limite des 2 500 résultats LinkedIn est mise en avant comme le différenciateur clé : « Emelia embarque une segmentation automatique qui contourne la limite des 2 500 résultats par recherche que LinkedIn impose nativement. Le scraper découpe ta requête en sous-segments et reconstitue la liste complète, sans intervention de ta part. »
Le scraping illimité dès le plan Start est explicité comme avantage compétitif : « scraping de profils LinkedIn illimité dès le plan d'entrée un point de différenciation majeur vs les concurrents qui plafonnent au profil ou facturent au crédit. »
Argument anti-ban : « Le scraping passe par ta session LinkedIn locale via l'extension, ce qui réduit la détection vs un scraping cloud pur. » c'est un vrai avantage qu'a Emelia vs Phantombuster ou La Growth Machine qui passent par des IPs cloud.
Phantombuster: la boîte à outils du growth marketer
Phantombuster propose une centaine de « phantoms » des scrapers paramétrables pour LinkedIn, Sales Navigator, Twitter, Instagram, Google Maps. C'est l'outil le plus flexible du marché, mais aussi le plus technique. Tarifs : Starter 69 $/mois (20h d'exécution, 5 phantoms, 10 000 crédits IA), Pro 159 $/mois (80h, 15 phantoms, 30 000 crédits), Team 439 $/mois (300h, 50 phantoms). Annual billing économise environ 20 %.
Forces : la flexibilité (chaque phantom est paramétrable), la qualité du scraping LinkedIn (parmi les plus stables du marché), une grosse communauté avec des templates partagés.
Limites : courbe d'apprentissage non triviale (il faut configurer chaque phantom), risque de ban LinkedIn si on pousse les rate limits, prix qui grimpe vite avec le volume. Phantombuster utilise des proxies cloud, ton IP n'est pas la même qu'en navigation normale, ce qui augmente la détectabilité côté LinkedIn.
Quand le choisir. Si tu as un growth marketer ou un dev qui peut configurer la stack, et que tu veux des automatisations sur mesure (pas seulement LinkedIn). Pas pour un commercial qui cherche un outil clé en main.
Waalaxy: le scraping LinkedIn no-code
Waalaxy se positionne sur le no-code grand public : tu cliques, tu configures un scénario, ça tourne. Tarifs publics 2026 : Freemium gratuit (80 invitations/mois), Pro à 19 €/mois (300 invitations + scraping + sync CRM via Zapier/Make), Advanced à 49 €/mois (800 invitations), Business à 69-99 €/mois (LinkedIn + email).
Forces : interface ultra-simple, parfaite pour un commercial non technique. Scraping LinkedIn intégré, exports CSV faciles. Plan freemium pour tester.
Limites : volume limité par les quotas (300-800 invitations/mois selon le plan), moins flexible que Phantombuster sur les scénarios avancés. Waalaxy utilise une infrastructure cloud, ce qui donne un risque de détection LinkedIn équivalent à Phantombuster.
Quand le choisir. Si tu es solo ou en très petite équipe, que tu veux un scraping LinkedIn simple sans configurer de script.
La Growth Machine: le multichannel automatisé
La Growth Machine (LGM) est le concurrent direct de Phantombuster sur le segment scraping + multichannel. Tarifs : Basic 60 €/mois (par identité), Pro 120 €/mois (avec LinkedIn Intents), Ultimate 180 €/mois (avec Twitter/X et sync HubSpot/Pipedrive native). Réduction agence de 20 %. Facturation par identité (= compte LinkedIn ou email d'envoi), pas par utilisateur.
Forces : scraping LinkedIn solide, scénarios multicanaux puissants (LinkedIn + email + Twitter), enrichissement intégré, intégrations CRM natives sur le plan Ultimate. Adapté aux agences.
Limites : prix élevé pour les fonctions de base (le Basic à 60 € est limité, il faut souvent monter sur Pro à 120 €). La facturation par identité peut surprendre quand on multiplie les comptes.
Quand le choisir. Si tu veux un outil multicanal complet (pas juste scraping) et que ton équipe gère plusieurs comptes LinkedIn / domaines email.
Bardeen: l'automatisation no-code dans le navigateur
Bardeen est une extension Chrome qui automatise des tâches dans ton navigateur, dont le scraping LinkedIn. Tarifs : Free (limité), Pro 15 $/mois, Business 99 $/mois. L'extension utilise ta session LinkedIn locale, donc pas de proxies cloud suspects.
Forces : scraping qui passe par ton vrai compte (risque de détection plus faible que les outils cloud), ratio prix/efficacité excellent en plan Free pour expérimenter, IA générative intégrée pour les workflows.
Limites : tu dois laisser ton navigateur ouvert pendant que ça tourne. Volume limité par les capacités de ton ordinateur. Risque de ban toujours présent si tu pousses trop fort, mais réduit par rapport au cloud.
Quand le choisir. Pour expérimenter le scraping LinkedIn sans investir, ou pour un usage solo low-volume (quelques centaines de profils par mois).
Comment ne pas se faire ban : 10 règles à respecter
Le ban LinkedIn est le vrai risque du scraping. Voici les règles qui réduisent significativement la probabilité de finir bloqué.
1. Limite à 100-150 actions par jour par compte. C'est le seuil que LinkedIn tolère. Au-delà, l'algorithme de détection s'active. Cumule les actions : 30 invitations + 50 visites de profils + 30 messages = ~110 actions, soit le bon ordre de grandeur.
2. Ne lance pas tout d'un coup. Si tu es sur un nouveau compte ou que tu n'as jamais scrapé, monte progressivement : 30 actions/jour la première semaine, 60 la deuxième, 100 ensuite. Le ramp-up évite les déclencheurs de détection.
3. Varie les patterns d'usage. Ne fais pas exactement 100 actions à 9h tous les jours. Espace tes actions sur la journée, fais des pauses, intègre du temps de lecture entre deux actions. L'algo LinkedIn cherche les patterns trop réguliers.
4. Utilise un compte LinkedIn « réchauffé ». Un compte de 3 mois avec 500 connexions et des posts réguliers est beaucoup moins suspect qu'un compte créé hier. Si tu démarres, prends le temps de bâtir ton réseau avant de scraper.
5. Évite les outils cloud agressifs en parallèle. Si tu as 3 outils cloud qui tournent en même temps sur ton compte (Phantombuster + Waalaxy + Lemlist), LinkedIn voit du trafic depuis 3 IPs différentes simultanément drapeau rouge instantané. Choisis-en un.
6. Connecte une IP résidentielle (pas un VPN). Les IPs cloud (AWS, Azure, GCP) sont sur les blacklists LinkedIn. Les VPN commerciaux aussi. Une IP résidentielle française dédiée coûte 20-50 €/mois et réduit drastiquement la détection.
7. Désactive les automatisations le weekend et la nuit. Personne ne fait 100 actions LinkedIn à 3h du matin. Si tu programmes en 24/7, c'est un signal clair. Limite-toi aux heures de bureau de ton fuseau.
8. Personnalise tes messages. L'envoi en masse de messages strictement identiques est repéré. Au minimum, varie les premières phrases et utilise des variables (prénom, entreprise, contexte).
9. Ne scrape pas les emails affichés sur les profils. LinkedIn les considère comme des données privées même quand ils sont visibles. Récupère plutôt les emails via un email finder externe (Emelia, Dropcontact, Hunter) qui les déduit du nom + domaine entreprise. Côté Emelia, le finder fonctionne par crédits : 500 inclus dans le plan Start, add-on optionnel à 19 €/mois pour 1 000 emails + 4 000 vérifications au-delà.
10. Surveille les warnings LinkedIn. Si tu reçois un message du genre « Nous avons détecté une activité inhabituelle », arrête tout pendant 7-14 jours. Ne tente pas de pousser, ne change pas d'IP, ne te reconnecte pas frénétiquement. Laisse l'algo refroidir avant de reprendre.
Les données que tu peux scraper (et celles à éviter)
Toutes les données affichées sur LinkedIn ne sont pas équivalentes côté risque RGPD ou côté ban.
Sans risque (données publiques entreprise)
Nom et prénom
Poste actuel et intitulé exact
Entreprise actuelle et historique
Localisation (ville, pays)
Secteur et taille d'entreprise
URL du profil LinkedIn
Compétences déclarées
Formation et établissements
Ces données sont publiquement consultables et leur usage en B2B est largement toléré.
Risque modéré (données « hybrides »)
Numéro de téléphone affiché sur le profil (rare mais arrive)
Email perso affiché sur le profil
Date de naissance
Statut familial
Ces données sont en zone grise, elles peuvent être considérées comme privées même si LinkedIn les affiche. Pour de la prospection B2B, mieux vaut s'en abstenir et passer par un email finder qui déduit l'email pro à partir du domaine entreprise.
Très risqué (données comportementales)
Activité récente (posts likés, commentés)
Connexions et réseau
Messages reçus
Recommandations privées
Ces données ne devraient jamais être scrapées: elles relèvent clairement de la vie privée et leur exploitation peut entraîner une plainte CNIL. Aucun outil sérieux du marché ne les propose.
L'alternative au scraping : utiliser une base de données B2B externe
Pour un commercial qui prospecte en France, le scraping LinkedIn n'est souvent pas la bonne réponse. La même data entreprise + dirigeants identifiés + contacts est disponible via des bases de données B2B externes qui agrègent des sources légales (INSEE, BODACC, DGFIP, données ouvertes) et exportent en CSV illimité, sans toucher à LinkedIn.
Basile
Basile est la base de données B2B française la plus accessible du marché. Elle agrège INSEE, BODACC, Infogreffe, DGFIP (comptes annuels publiés), Google Maps (horaires, avis, photos, téléphones publics) et les profils LinkedIn d'entreprise publics. Couverture : 100 % du registre SIREN français (3,4 M+ entreprises actives), 10 M+ contacts B2B normalisés. Filtres firmographiques riches (effectif, CA, NAF, géographie, signaux Google Maps).
Périmètre couvert sans scraping : tu trouves les fiches entreprises complètes (SIREN, NAF, comptes annuels, dirigeants déclarés, effectifs corrigés LinkedIn), les emails professionnels génériques (contact@, info@, sales@), les numéros professionnels publics (standard, fixes, numéros listés sur Google Maps) et des données de scoring et signaux d'achat enrichis par IA. Pour les emails pro nominatifs (prenom.nom@entreprise.com) et les mobiles personnels, Basile propose une intégration native avec Emelia : tu colles ta clé API Emelia, et l'enrichissement se lance à la volée sur les contacts ciblés.
Les prix de Basile:
Pharow
Pharow est la plateforme de génération de leads B2B française la plus mature. Elle agrège les sources publiques FR (INSEE, BODACC, Infogreffe), enrichit avec des signaux d'affaires riches (filtres magiques : recrutements actifs par département, levées de fonds récentes, technologies détectées sur le site web, signaux de croissance, visites de ton site web), reconstruit des organigrammes d'entreprises, et inclut nativement l'enrichissement email via Dropcontact, FullEnrich et Zerobounce. Côté téléphone, il faut connecter sa propre clé API Kaspr, FullEnrich ou BetterContact.
Les prix de Pharow:
Plan Essentiel à partir d'environ 100 €/mois (1 000 crédits, 500 recherches/mois, 1 utilisateur), Plan Avancé autour de 200 €/mois (1 000 recherches, CSM dédié). Engagement annuel possible avec réduction d'environ 25 %. Packs crédits supplémentaires séparés (500 = 90 € HT, 1 000 = 120 € HT, 5 000 = 360 € HT).
Pour qui : équipes sales et marketing qui veulent une stack outbound structurée avec intent data, signaux d'affaires et organigrammes intégrés, sans dépendre d'un scraping LinkedIn risqué. Limite : le ticket d'entrée à environ 100 €/mois reste largement au-dessus de Basile (19 €/mois) sur la donnée brute FR équivalente, à choisir si les filtres magiques et organigrammes valent leur prix dans le process.
Le scraping LinkedIn reste pertinent dans deux cas spécifiques : cibles internationales (US, UK, DACH) où les bases FR n'ont pas de couverture, et profils décideurs très précis (ex. CTO de scale-ups B2B venant de lever) qu'aucune base publique n'identifie aussi finement que les recherches LinkedIn. En dehors de ces cas, une base externe fait le job pour 5-10× moins cher et zéro risque de ban.