OpenAI pagará pelo uso de notícias da AP no treinamento de IA

A OpenAI, desenvolvedora do ChatGPT, concordou em pagar pelos direitos de uso de histórias da Associated Press (AP) para treinar seus algoritmos de inteligência artificial.

Leia mais:

ChatGPT: como usar no celular?WebChatGPT: o que é e como funciona a extensão que permite pesquisas web5 linguagens de programação que você pode aprender e gerar com o ChatGPT

Esse é o primeiro acordo importante do tipo, em meio a um crescente debate sobre se as empresas de tecnologia devem remunerar os criadores de conteúdo cujas informações são coletadas da web para construir ferramentas de IA.

De acordo com um comunicado da AP, a OpenAI terá acesso ao arquivo de histórias em texto da AP, datadas desde 1985.Além das taxas de licenciamento, a AP também terá acesso à tecnologia da OpenAI para realizar experimentos e melhorar sua própria prática jornalística.A organização de notícias já utiliza automação para produzir relatos esportivos locais e relatórios de ganhos financeiros há anos.Segundo a AP, ela não utiliza tecnologia “generativa” — como os chatbots, por exemplo — para escrever suas matérias.

Empresas como OpenAI, Google e outras do ramo de IA têm utilizado bilhões de frases retiradas da internet para alimentar seus “modelos de linguagem ampla” que impulsionam seus chatbots.

Notícias, artigos da Wikipédia, comentários em redes sociais e posts de blogs são todos incorporados nesses modelos sem a devida permissão de seus proprietários. As empresas de tecnologia geralmente argumentam que estão livres para utilizar dados públicos.

Uma análise do Washington Post de um banco de dados de sites usado para treinar um dos modelos antigos de IA da OpenAI revelou que o site de notícias principal da AP foi o 68º mais citado no banco de dados.

Revolta contra a prática

Um grupo crescente de autores, músicos, organizações de notícias e empresas de mídia social tem se manifestado contra essa prática. O argumento usado por eles é que o uso de seu conteúdo para treinar IA representa uma mudança massiva na forma como a internet funciona, especialmente considerando que algumas das ferramentas de IA treinadas com conteúdo humano já estão substituindo trabalhadores humanos.

Nas últimas duas semanas, uma série de processos judiciais foram movidos contra a indústria, alegando uso indevido de dados, incluindo ações coletivas contra a OpenAI e o Google, além de processos contra a OpenAI movidos pela comediante Sarah Silverman e dois autores de ficção proeminentes.

Na última quinta-feira, o Washington Post informou que a Federal Trade Commission abriu uma investigação sobre como a OpenAI utilizou os dados dos consumidores para treinar seus modelos.

(Imagem: Daniel Chetroni / Shutterstock)

Chatbots como o ChatGPT são treinados com base em um conjunto de informações e não podem ser atualizados continuamente sem serem reconfigurados do zero. Isso significa que eles são menos úteis para fornecer notícias recentes e informações atualizadas.

As empresas de tecnologia têm tentado resolver esse problema permitindo que os chatbots pesquisem a web ou façam perguntas a um banco de dados separado e em constante atualização. O acordo com a AP dá à OpenAI acesso apenas ao seu arquivo de notícias, mas esse arquivo é atualizado regularmente com histórias recentes.

Empresas de tecnologia já pagaram diretamente por conteúdo noticioso no passado, para outros fins. O Google e o Facebook pagam às empresas de notícias pelo acesso direto a seu conteúdo, exibindo-o em suas plataformas em alguns países. Na Austrália, o governo aprovou uma lei que exige essa prática, e uma lei semelhante está prestes a entrar em vigor no Canadá.

Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!

O post OpenAI pagará pelo uso de notícias da AP no treinamento de IA apareceu primeiro em Olhar Digital.

 

Você pode gostar...

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *