Menu Menu

Reddit assina seus dados de usuário para treinar modelo de IA sem nome

À medida que os dados do usuário se tornam uma mercadoria cada vez mais popular, uma empresa de IA não identificada está planejando uma investida de US$ 60 milhões para roubar o Reddit para fins de treinamento em IA. Deveríamos nos preocupar?

Décadas de divagações no Reddit podem se tornar combustível para a próxima geração de modelos de IA.

A autoproclamada “primeira página da Internet” teria negociado um acordo acordo de licenciamento de conteúdo com uma empresa de IA não identificada. Pelo preço de US$ 60 milhões, essa empresa, em teoria, agora tem o direito de treinar seu modelo de IA usando tudo e qualquer coisa postada no Reddit.

Milhões de postagens incessantes dos subreddits mais populares, dos espreitadores e da escória de tópicos questionáveis ​​se tornarão uma mercadoria anual contínua para este “grande player” não divulgado do Vale do Silício.

Este acordo surpreendente chega meses depois do Reddit ameaçado cortar os rastreadores de busca do Google e do Bing se um acordo oficial não pudesse ser fechado para o comércio de seus dados. Uma fonte disse ao Washington Post no momento em que a plataforma ‘pode sobreviver’ sem pesquisa. Talvez esse acordo atual de IA estivesse prestes a acontecer naquela época?

Embora a receita anual do Reddit tenha aumentado 20% em 2023, foi aproximadamente US$ 200 milhões tímidos de sua meta de US$ 1 bilhão estabelecida dois anos antes. O iminente pacto de IA, aliado a uma abertura para investimento público no próximo mês, no entanto, provavelmente enviará as informações do Reddit bem acima desse número.

Após um alguns anos tumultuados, essa troca de dados faz todo o sentido para o Reddit financeiramente falando. Exatamente o que isso significa para os consumidores, porém, e a ética sempre obscura da IA ​​permanecem em debate.

É um dos segredos mais mal guardados que os dados dos nossos usuários são tudo menos privados no mundo moderno. Lembre-se que recente estudo de vigilância no Meta que mostrou que 48,000 empresas enviaram dados da plataforma para um único usuário sem consentimento?

Até recentemente, a maioria das empresas de IA utilizava a web aberta para treinar os seus modelos sem qualquer tipo de luz verde verificada, mas uma combinação de casos de destaque em 2023 parecia estar a mudar o cenário.

O problema da OpenAI com o New York Times e Negociações da Apple para os principais parceiros de notícias sugeriram que as empresas de IA estavam começando a estabelecer uma estrutura legal sólida para a coleta de dados, em linha com as leis de direitos autorais em outros setores.

Da mesma forma, o acordo do Reddit mostra que as empresas anfitriãs estão começando a exigir compensação pelos dados, mas a principal diferença aqui é que seu 812 milhões de usuários mensais não deram explicitamente o seu consentimento para se tornarem parte da máquina de IA.

Quer os termos de serviço do Reddit sejam atualizados ou não no futuro para maior transparência sobre para onde vão nossos dados, sabemos que todas as informações digitais anteriores a este acordo também são um jogo justo. Em termos leigos, você não pode pedir permissão após o fato, pode?

Talvez esta seja a principal diferença entre os meios de comunicação e as plataformas de mídia social para o aprendizado de IA. Este último é quase inteiramente preenchido por conteúdo gerado pelo usuário; cujo uso parece depender inteiramente do critério da respectiva administração.

Em vez de criar plataformas AGI (Inteligência Artificial Geral) com uma qualidade mais distintamente humana, este tipo de negócio provavelmente se tornará mais comum nos próximos anos.

Embora isto possa parecer positivo, basta pensar nas intermináveis ​​multidões de desinformação e disparates a que esta máquina de aprendizagem não identificada estará sujeita se tudo correr como planeado.

É Reddit, pelo amor de Pete. Essas salvaguardas de IA certamente precisarão ser reforçadas.

Acessibilidade