Меню Меню

Reddit передает свои пользовательские данные для обучения неназванной модели ИИ

Поскольку пользовательские данные становятся все более популярным товаром, неназванная компания, занимающаяся искусственным интеллектом, как сообщается, планирует потратить 60 миллионов долларов на сбор Reddit в целях обучения искусственному интеллекту. Стоит ли нам беспокоиться?

Десятилетия болтовни на Reddit могут стать топливом для следующего поколения моделей искусственного интеллекта.

Сообщается, что самопровозглашенная «первая страница Интернета» договорилась о соглашение о лицензировании контента с неназванной ИИ-компанией. За крутую цену в 60 миллионов долларов этот бизнес теоретически теперь имеет право обучать свою модель искусственного интеллекта, используя все, что опубликовано на Reddit.

Миллионы непрерывных постов из самых популярных субреддитов, скрытых источников и отбросов сомнительных тем станут постоянным ежегодным товаром для этого нераскрытого «крупного игрока» Кремниевой долины.

Эта удивительная сделка заключена через несколько месяцев после Reddit угрожает отключить поисковые роботы Google и Bing, если не удастся заключить официальную сделку по торговле их данными. Один источник сообщил Washington Post в то время, когда платформа «может выжить» без поиска. Возможно, нынешняя сделка по искусственному интеллекту уже была в ближайшем будущем?

Хотя годовой доход Reddit в 20 году вырос на 2023%, он составил примерно 200 миллионов долларов застенчивы целевого показателя в 1 миллиард долларов, установленного двумя годами ранее. Грядущий пакт по искусственному интеллекту в сочетании с открытием для государственные инвестиции Однако в следующем месяце количество готовых Reddit, скорее всего, будет намного севернее этой цифры.

После несколько бурных лет, этот компромисс в отношении данных имеет смысл для Reddit с финансовой точки зрения. Однако, что именно это означает для потребителей, и вечно неясная этика ИИ остается предметом дискуссий.

Это один из самых плохо охраняемых секретов: наши пользовательские данные в современном мире не являются конфиденциальными. Помните, что недавнее сторожевое исследование в Meta, который показал, что 48,000 XNUMX компаний отправили данные платформы об одном пользователе без согласия?

До недавнего времени большинство компаний, занимающихся искусственным интеллектом, использовали открытую сеть для обучения своих моделей без какого-либо подтвержденного зеленого света, но ряд громких случаев в 2023 году, похоже, изменил ситуацию.

Придирки OpenAI к New York Times и переговоры Apple Для крупных новостных партнеров предположили, что компании, занимающиеся искусственным интеллектом, начинают создавать прочную правовую основу для сбора данных в соответствии с законами об авторском праве в других секторах.

Аналогично, сделка Reddit показывает, что хостинговые компании начинают требовать компенсацию за данные, но ключевое отличие здесь в том, что 812 миллионов пользователей в месяц не дали явного согласия стать частью машины ИИ.

Независимо от того, будут ли условия обслуживания Reddit обновлены в будущем для прозрачности того, куда отправляются наши данные, мы знаем, что вся цифровая информация до этой сделки также является честной игрой. С точки зрения непрофессионала, вы не можете спрашивать разрешения постфактум, не так ли?

Возможно, это ключевое различие между сбором новостных изданий и платформами социальных сетей для обучения ИИ. Последний почти полностью заполнен пользовательским контентом; использование которых, кажется, полностью зависит от усмотрения их соответствующего руководства.

Вместо создания платформ AGI (искусственного общего интеллекта) с более отчетливо человеческими качествами, этот тип сделок, вероятно, станет более распространенным в ближайшие годы.

Хотя это может показаться позитивным, просто подумайте о бесконечных потоках дезинформации и чепухи, которым подвергнется эта неопознанная обучающаяся машина, если все пойдет по плану.

Ради Пита это Reddit. Эти меры защиты ИИ наверняка потребуют усиления.

Универсальный доступ