OpenAI e Google avrebbero usato video di YouTube per addestrare i modelli di IA

OpenAI e Google avrebbero usato video di YouTube per addestrare i modelli di IA

Secondo il New York Times, le società potrebbero aver violato i diritti d’autore dei creatori di YouTube

Secondo il New York Times, OpenAI e Google hanno addestrato i loro modelli di intelligenza artificiale sul testo trascritto dai video di YouTube, violando potenzialmente i diritti d’autore dei creatori. Il rapporto, che descrive gli sforzi compiuti da OpenAI, Google e Meta per massimizzare la quantità di dati che possono fornire alle loro IA, cita numerose persone con conoscenza delle pratiche delle aziende. Ciò avviene pochi giorni dopo che il CEO di YouTube, Neal Mohan, ha dichiarato in un’intervista a Bloomberg Originals che il presunto utilizzo di video di YouTube da parte di OpenAI per addestrare il suo nuovo generatore di testo in video, Sora, andrebbe contro le politiche della piattaforma. Secondo il NYT, OpenAI ha utilizzato il suo strumento di riconoscimento vocale Whisper per trascrivere più di un milione di ore di video di YouTube, che sono stati poi utilizzati per addestrare GPT-4. 

Le informazioni precedenti riportavano che OpenAI aveva utilizzato video e podcast di YouTube per addestrare i due sistemi di intelligenza artificiale. Secondo quanto riferito, il presidente di OpenAI, Greg Brockman, era tra le persone a conoscenza dell’iniziativa. Stando alle regole di Google “lo scraping o il download non autorizzato di contenuti YouTube” non è consentito. Il rapporto, tuttavia, afferma che c’erano persone in Google che sapevano ma non hanno preso provvedimenti contro OpenAI perché la stessa Big G usa video di YouTube per addestrare i propri modelli di intelligenza artificiale. Google ha riferito al NYT che segue la procedura solo con i filmati dei creatori che accettano tale operazione. Il report, infine, sottolinea che Google ha chiesto a un team di modificare la propria politica sulla privacy nel giugno 2023 per coprire in modo più ampio l’uso di contenuti disponibili al pubblico, inclusi Google Docs e Google Sheets, per addestrare i suoi modelli e prodotti di intelligenza artificiale.

TI PIACE QUESTO ARTICOLO?

Iscriviti alla nostra newsletter per essere sempre aggiornato.

Leggi anche:  La Russia vieta l’utilizzo di iPhone ai politici