Останнім часом компанії, що спеціалізуються на зборі загальнодоступного веб-контенту для навчання моделей штучного інтелекту, стають все більш поширеними. Однією з мішеней для такого збору є застосунки для Smart TV та аналогічні платформи. Як стало відомо, деякі компанії непомітно використовують інтернет-з’єднання користувачів для цієї мети, обіцяючи натомість низьковартісні бонуси, такі як зменшення реклами або безкоштовний доступ до стрімінгового контенту.
Ключовим гравцем у цій схемі є Bright Data, яка керує глобальною проксі-мережею для збору веб-даних. Їхній інструмент, Bright SDK, вбудовується в застосунки для Smart TV, і користувачів зазвичай просять надати згоду перед приєднанням до мережі. Після активації, з’єднання користувача може використовуватись для маршрутизації веб-трафіку, який потім надсилається на сервери Bright Data та продається компаніям для навчання їхніх моделей штучного інтелекту, зокрема великих мовних моделей. Bright Data стверджує, що має близько 150 мільйонів “клієнтів-краулерів”, які охоплюють не лише Smart TV, а й ПК та мобільні пристрої.
Представники Bright Data запевняють, що участь у мережі є добровільною, а код SDK працює анонімно у фоновому режимі, не відстежуючи користувачів напряму. Проте користувачі мають обмежене уявлення про обсяги трафіку, що передається у фоновому режимі під час використання Smart TV. Ця бізнес-модель викликає занепокоєння, адже розподілені проксі-мережі можуть бути використані для зловмисних цілей. У відповідь на зростаючу проблему, платформи, такі як Google та Amazon, вже почали посилювати обмеження на фонову активність SDK та блокувати застосунки, що покладаються на сторонні проксі-механізми. Однак Bright Data продовжує співпрацювати з екосистемами Smart TV на базі Tizen OS та webOS, де сотні застосунків можуть містити функціональність збору веб-даних через проксі-мережу.
