- ▸ Comment fonctionne le réseau de Bright Data
- ▸ Les Smart TV, nœud idéal du scraping d'IA
- ▸ Ce que ça change pour l'écosystème IA
Bright Data revendique le plus grand réseau de proxification résidentielle au monde. 400 millions d’adresses IP domestiques relaient le trafic de scraping de ses clients. Smart TV et téléphones consentants deviennent des nœuds anonymes au service des éditeurs d’IA.
Points clés – 400 millions d’IP résidentielles revendiquées par Bright Data, dont 150 millions issues d’un SDK de consentement intégré à des applications partenaires, selon Include Security. – Un budget WiFi par défaut de 200 Go mensuels et 500 Mo de trafic tiers autorisés, d’après l’analyse de configuration publiée le 5 juin 2026. – En Ouzbékistan et à Oman, les plafonds quotidiens atteignent 20 fois le défaut et les plafonds mensuels 60 fois, selon les paramètres exfiltrés.
Comment fonctionne le réseau de Bright Data
Bright Data, société israélienne de collecte de données, commercialise un accès à ce que son marketing décrit comme le plus grand réseau de proxification résidentielle au monde. Les clients de l’entreprise — éditeurs de modèles d’IA, agences marketing, sociétés de veille — routent leur trafic de scraping web à travers ces adresses IP domestiques.
Selon le rapport publié ce vendredi 5 juin 2026 par Include Security, le catalogue affiche 400 millions d’adresses IP. Le marketing actuel de Bright Data revendique « 150M+ IPs » obtenues via un SDK de consentement embarqué dans des applications partenaires. Téléviseurs connectés, smartphones et applications gratuites peuvent ainsi servir de relais une fois la case cochée par l’utilisateur final.
Les Smart TV, nœud idéal du scraping d’IA
L’analyse d’Include Security détaille la configuration par défaut du SDK. Chaque appareil consentant relaie jusqu’à 200 Go de trafic tiers par mois via la connexion WiFi du foyer. La permission par défaut, dite « default-worldwide », autorise encore 500 Mo de trafic d’autrui par mois sur l’internet domestique de l’utilisateur. Le rapport, sourcé sur des extraits de configuration, isole également deux paramètres explicites : « true, // relay even with the screen on » et « true, // relay while the user is on a phone call ».
Le téléviseur connecté apparaît comme le maillon idéal. Comme le note Include Security, « un téléviseur ne tombe jamais à 1 % de batterie, ne saute pas entre les réseaux WiFi et ne se verrouille pas pendant que l’utilisateur dort ». L’appareil reste en veille branchée 18 à 22 heures par jour, garantissant une bande passante stable. Les téléphones, eux, sont plus volatils.
D’après la même analyse, les configurations régionales divergent fortement. En Ouzbékistan et à Oman, les appareils sont autorisés à relayer jusqu’à 1 % de batterie résiduelle. Les plafonds quotidiens y atteignent 20 fois le défaut, et les plafonds mensuels 60 fois. Le rapport mentionne aussi un champ de traçabilité interne : « <correlation-id> ».
Ce que ça change pour l’écosystème IA
Le constat d’Include Security s’inscrit dans une tendance documentée. Selon le chercheur en sécurité cité dans le rapport, « a glut of proxies from Aisuru and other sources is fueling large-scale data harvesting efforts tied to various AI projects ». Traduction : l’abondance de proxies résidentiels alimente directement la collecte de données pour les projets d’IA.
L’enjeu opérationnel est concret. Les sites web bloquent massivement les plages d’adresses IP appartenant aux centres de données — AWS, GCP, Azure — pour limiter le scraping. Une adresse IP domestique, elle, contourne ces filtres puisqu’elle ressemble à un internaute ordinaire. Les éditeurs de modèles d’IA, sous pression pour ingurgiter toujours plus de données d’entraînement, y voient une voie d’accès aux contenus protégés derrière des pare-feux anti-bots. La pression sur la donnée d’entraînement post-2025 explique cette tendance.
FAQ
Puis-je refuser que mon téléviseur soit utilisé pour le scraping d’IA ?
Oui, selon les conditions d’utilisation des applications intégrant le SDK de Bright Data. Le consentement est en théorie requis avant l’enrôlement de l’appareil. Reste que les écrans de consentement sont souvent groupés avec les conditions générales, comme le souligne Include Security. Lire les CGU des applications gratuites installées sur la TV reste la meilleure parade à ce jour.
Quelles conséquences sur ma facture internet ?
Sur une box illimitée, l’impact financier est nul. Le rapport indique 200 Go de relais mensuel par défaut, soit l’équivalent d’environ 50 heures de streaming HD additionnelles. Sur un forfait plafonné ou une 4G fixe, la consommation peut basculer en hors-forfait. Aucune indemnisation n’est documentée à ce stade dans les configurations analysées.
À suivre
Include Security promet une suite à son enquête, axée sur l’identification des applications embarquant le SDK. Côté régulateur, ni la CNIL ni le Federal Trade Commission n’ont communiqué publiquement au 5 juin 2026. Lecture associée : Anthropic et la course aux 1M de tokens.



