Продав лицо для обучения ИИ, но стать жертвой глубоких подделок: темная правда о серой индустрии ИИ в мире.

AI灰色產業

Глубокое расследование британского《Гардиан》 выявило быстро растущую глобальную серую индустрию: тысячи обычных людей из Южной Африки, Индии и США обменивают свои голоса, лица, видео с ходьбой и записи частных разговоров на деньги за обучение ИИ. Поскольку спрос компаний ИИ на качественные человеческие данные превышает доступные в открытой сети, появились платные платформы для сбора данных, такие как Kled AI, Silencio, Neon Mobile.

Два реальных случая: кто продает себя и почему

Этот глобальный бум данных для ИИ особенно наглядно проявляется в развивающихся странах.

27-летний юноша из Кейптауна Якобус Лоу завершил задание «Городская навигация» на Kled AI, за видео с прогулкой он получил 14 долларов, что в 10 раз больше местного минимального заработка. Он признает, что осознает цену своей конфиденциальности, но из-за многолетнего заболевания нервной системы не может устроиться на работу. Продав повседневные видео, он накопил 500 долларов и записался на курсы массажиста. «Как южноафриканец, получать доллары гораздо ценнее, чем кто-либо может себе представить», — сказал Лоу.

22-летний студент Саил Тигга из Ранчии, Индия, ежемесячно зарабатывает более 100 долларов, продавая записи окружающего шума через Silencio; 18-летний ученик-сварщик Рамелио Хилл из Чикаго, США, продает записи частных разговоров Neon Mobile за 0,50 доллара за минуту, заработав около 200 долларов за примерно 11 часов. Его логика проста и пряма: технологические компании уже владеют множеством его личных данных, так почему бы не получить свою долю.

Как нехватка данных для ИИ порождает эту серую индустрию

Улучшения генеративного ИИ, такие как ChatGPT и Gemini, зависят от огромного объема качественных человеческих данных, но основные открытые наборы данных, такие как C4, RefinedWeb и Dolma, начали ограничивать коммерческое использование. Исследователи предполагают, что компании ИИ могут исчерпать свежие качественные тексты уже в 2026 году. Использование синтетических данных, созданных ИИ, для обучения уже доказало, что это приводит к моделям, которые выдают множество ошибок и «мусора», что еще больше увеличивает дефицит реальных человеческих данных.

Таким образом, возникшие платные платформы для сбора данных образуют новую экосистему цифровых работ, охватывающую весь мир:

Kled AI: покупка повседневных фотографий и видео по заданиям.

Silencio: краудсорсинг для сбора аудио окружающей среды с расчетом в криптовалюте.

Neon Mobile: покупка разговоров и записей звонков по 0,50 доллара за минуту.

Luel AI (поддержка Y Combinator): сбор многоязычных разговоров по примерно 0,15 доллара за минуту.

ElevenLabs: позволяет пользователям цифрово клонировать свой голос с базовой ставкой 0,02 доллара за минуту.

Профессор экономики Кингс-колледжа в Лондоне Боуке Клейн Тизелинк указывает, что работа в сфере обучения ИИ — это новая категория профессий, которая будет расти, поскольку компании ИИ активно платят за сбор данных, чтобы избежать полного зависания от сбора данных с веб-сайтов, что может вызвать правовые споры.

Глубокая подделка и необратимые лицензии: реальные затраты серой индустрии

Юридические риски этих платформ почти неизвестны пользователям. Профессор права в Университете Сент-Джордж в Лондоне Энрико Бонадио указывает, что лицензионные соглашения обычно предоставляют платформам «глобальные, исключительные, необратимые, передаваемые и безвозмездные» права, позволяя им продавать, демонстрировать, хранить и создавать производные работы на их основе, и поставщики данных почти не имеют реальных возможностей отозвать согласие или пересмотреть условия.

Случай актера из Нью-Йорка Адама Коя является наиболее показательным. Он продал свои права на портрет за 1000 долларов AI-программному обеспечению для редактирования видео Captions, в соглашении четко указано, что он не может использоваться для политической пропаганды или порнографического контента, срок лицензии — год. Но вскоре его друг обнаружил в Instagram видео с миллионами просмотров, в котором «он» называет себя «гинекологом», рекламируя несертифицированные медицинские добавки для женщин в период беременности. «Комментарии были странными, потому что они оценивали мою внешность, но это ведь не я», — сказал Кой. С тех пор он больше не принимал никаких заданий по сбору данных для ИИ.

Профессор Оксфордского университета Марк Грэм подводит итог: эта работа структурно «нестабильна, не имеет возможности для роста и на самом деле является тупиком», единственные долгосрочные выигравшие — «платформы Северного полушария, которые получают всю устойчивую ценность».

Часто задаваемые вопросы

Что такое серая индустрия обучения ИИ и почему она называется «серой»?

Серая индустрия обучения ИИ относится к ряду платных платформ для сбора данных, которые выплачивают обычным пользователям за голоса, лица, видео и записи разговоров для обучения моделей ИИ. Она называется «серой», потому что сделки выглядят законными, но окончательное использование данных не является прозрачным, условия лицензирования крайне асимметричны, и существует риск потенциального злоупотребления, такого как глубокая подделка, что ставит ее на грани соблюдения норм и эксплуатации.

С какими конкретными юридическими рисками сталкиваются те, кто продает личные данные для обучения ИИ?

Поставщики обычно предоставляют платформам необратимые права на использование биометрических данных, не полностью понимая условия. Исследователь Стэнфордского университета Дженнифер Кинг указывает, что потребители сталкиваются с риском, что их данные будут использованы «способами, которые им не нравятся, которые они не понимают или которые они не предвидели, и в это время почти не будет средств для исправления». Инцидент с уязвимостью данных Neon Mobile подтвердил, что после утечки данных платформа даже может не уведомить затронутых пользователей.

Как эта серая индустрия связана с экосистемой криптовалют?

Некоторые платформы для обучения ИИ (например, Silencio) выплачивают вознаграждения в виде криптовалют, используя децентрализованные платежи для снижения порога для получения трансакций из-за границы, что позволяет пользователям из развивающихся стран получать доход непосредственно в виде стабильных монет или родных токенов. Это делает рынок данных для ИИ важной ветвью реального применения криптовалют, одновременно возникая многими соображениями по оценке токенов, ликвидности и этики данных.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Рынок аппаратных кошельков, по прогнозам, достигнет 2,58 млрд долларов к 2031 году, при среднегодовом темпе роста (CAGR) 29,05%

По данным Mordor Intelligence, рынок аппаратных кошельков оценивался примерно в 0,72 миллиарда долларов в 2026 году и, как ожидается, достигнет 2,58 миллиарда долларов к 2031 году, при среднегодовом темпе роста 29,05%. Институциональные покупатели всё чаще требуют кошельки с расширенными сертификатами безопасности a

GateNews6ч назад

CryptoRank: В 2026 году завершено только 6 ICO, финансирование замедляется

По данным CryptoRank, к настоящему времени в 2026 году завершились только шесть первичных размещений токенов (ICO), и половина из них торгуется ниже цены размещения. Криптофинансирование претерпевает структурный сдвиг: раунды венчурного капитала также замедлились в апреле по сравнению с более ранним периодом года. Шесть ICO

CryptoFrontier10ч назад

CEXs обрабатывают $19,17T спотовую торговлю криптовалютами в 2025 году, а TradFi расширяется за счёт активности в сфере $37B M&A

Сообщение Gate News: криптовалютные биржи обработали $19,17 трлн спотовой торговли в 2025 году, тогда как рынок акций достиг $155 трлн, а валютные рынки провели $9,6 трлн дневных сделок. Рынок также увидел $37 млрд, направленных в TradFi M&A крупнейшими игроками наряду с th

GateNews15ч назад

Данные HyperScale отчитываются о доходах в криптодобыче за 1 квартал 2026 года $5M

Hyperscale Data (NYSE American: GPUS) сообщила о предварительных финансовых показателях выручки за первый квартал 2026 года: ее бизнес по майнингу криптовалют сгенерировал приблизительно $5 миллионов, что внесло вклад в общую выручку компании на уровне около $44 миллионов, что на 76% больше в годовом выражении. Компания планирует продать свой диверсифицированный

GateNews15ч назад

SoFi сообщает о выручке за 1 квартал в размере $1,1 млрд, рост на 41%, и запускает стейблкоин SoFiUSD

По данным Businesswire, SoFi Technologies сообщила о рекордной чистой выручке за 1-й квартал в размере $1,1 миллиарда, что на 41% больше по сравнению с прошлым годом; чистая прибыль составила $167 миллионов, что стало десятым подряд кварталом GAAP-прибыльности. Финтех-компания официально запустила обеспеченный в полном объёме U.S. dollar стейблкоин SoFiUSD

GateNews15ч назад

Рынок токенизированных RWA достиг $193,2 млрд к концу 1-го квартала 2026 года, рост на 256% за 15 месяцев

По данным CoinGecko, рынок токенизированных реальных активов (RWA) достиг 193,2 миллиарда долларов к концу I квартала 2026 года, что на 256% больше, чем 54,2 миллиарда долларов в начале 2025 года. Токенизированные казначейские активы стали лидером роста: на них приходилось 67,2% рынка — примерно 130 миллиардов долларов, а токенизированные сырьевые активы выросли до $

GateNews17ч назад
комментарий
0/400
Нет комментариев