Smart TV: Дані користувачів непомітно навчають ШІ

Останнім часом компанії, що спеціалізуються на зборі загальнодоступного веб-контенту для навчання моделей штучного інтелекту, стають все більш поширеними. Однією з мішеней для такого збору є застосунки для Smart TV та аналогічні платформи. Як стало відомо, деякі компанії непомітно використовують інтернет-з’єднання користувачів для цієї мети, обіцяючи натомість низьковартісні бонуси, такі як зменшення реклами або безкоштовний доступ до стрімінгового контенту.

Ключовим гравцем у цій схемі є Bright Data, яка керує глобальною проксі-мережею для збору веб-даних. Їхній інструмент, Bright SDK, вбудовується в застосунки для Smart TV, і користувачів зазвичай просять надати згоду перед приєднанням до мережі. Після активації, з’єднання користувача може використовуватись для маршрутизації веб-трафіку, який потім надсилається на сервери Bright Data та продається компаніям для навчання їхніх моделей штучного інтелекту, зокрема великих мовних моделей. Bright Data стверджує, що має близько 150 мільйонів “клієнтів-краулерів”, які охоплюють не лише Smart TV, а й ПК та мобільні пристрої.

Представники Bright Data запевняють, що участь у мережі є добровільною, а код SDK працює анонімно у фоновому режимі, не відстежуючи користувачів напряму. Проте користувачі мають обмежене уявлення про обсяги трафіку, що передається у фоновому режимі під час використання Smart TV. Ця бізнес-модель викликає занепокоєння, адже розподілені проксі-мережі можуть бути використані для зловмисних цілей. У відповідь на зростаючу проблему, платформи, такі як Google та Amazon, вже почали посилювати обмеження на фонову активність SDK та блокувати застосунки, що покладаються на сторонні проксі-механізми. Однак Bright Data продовжує співпрацювати з екосистемами Smart TV на базі Tizen OS та webOS, де сотні застосунків можуть містити функціональність збору веб-даних через проксі-мережу.

Пн	Вт	Ср	Чт	Пт	Сб	Нд
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Пов’язані записи