OpenAI: Dati protetti da copyright “impossibili” da evitare per l’addestramento dell’IA

OpenAI ha suscitato notevole attenzione questa settimana con la sua audace dichiarazione a una commissione parlamentare britannica, sostenendo che sarebbe “estremamente difficile” sviluppare gli attuali sistemi di intelligenza artificiale leader senza utilizzare ingenti quantità di dati protetti da copyright.

La società ha argomentato che strumenti avanzati di intelligenza artificiale, come ChatGPT, richiedono un addestramento così ampio che rispettare le leggi sul copyright sarebbe estremamente complicato.

In una testimonianza scritta, OpenAI ha affermato che a causa delle estese leggi sul copyright e della diffusione di contenuti online protetti, “praticamente ogni forma di espressione umana” sarebbe fuori dai limiti per quanto riguarda i dati di addestramento. Dalle notizie ai commenti sui forum fino alle immagini digitali, pochissimi contenuti online possono essere utilizzati liberamente e legalmente.

OpenAI ha sottolineato che cercare di sviluppare intelligenza artificiale competente evitando violazioni del copyright sarebbe un fallimento: “Restringere i dati di addestramento a libri e disegni nel pubblico dominio creati più di un secolo fa… non consentirebbe la creazione di sistemi AI adeguati alle esigenze dei cittadini di oggi”.

Nonostante la difesa delle sue pratiche come conformi, OpenAI ha riconosciuto che potrebbero essere necessari partenariati e schemi di compensazione con gli editori per “sostenere ed emporiare i creatori”. Tuttavia, l’azienda non ha fornito alcuna indicazione di un’intenzione di limitare significativamente la raccolta di dati online, inclusi contenuti giornalistici e letterari a pagamento.

Questa posizione ha esposto OpenAI a diverse cause legali, tra cui azioni legali da parte di organizzazioni media come il New York Times, che affermano violazioni del copyright.

Nonostante ciò, sembra che OpenAI non sia incline a modificare fondamentalmente i suoi processi di raccolta dati e addestramento, dato che l’applicazione rigorosa delle restrizioni autoimposte dal copyright sarebbe “estremamente complicato”. L’azienda spera, invece, di basarsi su interpretazioni ampie delle deroghe per l’uso lecito al fine di sfruttare legalmente ampie porzioni di dati protetti da copyright.

Con l’intelligenza artificiale avanzata che continua a dimostrare abilità straordinarie nell’imitare l’espressione umana, esperti legali prevedono battaglie giudiziarie intense riguardo alle violazioni da parte di sistemi progettati intrinsecamente per assorbire grandi volumi di testo, media e altri contenuti creativi protetti.

Per ora, OpenAI sta facendo una scommessa contro gli sostenitori del massimale del copyright, favorendo una copiatura quasi illimitata per guidare lo sviluppo continuo dell’intelligenza artificiale.

5 thoughts on “OpenAI: Dati protetti da copyright “impossibili” da evitare per l’addestramento dell’IA”

  1. It was great seeing how much work you put into it. Even though the design is nice and the writing is stylish, you seem to be having trouble with it. I think you should really try sending the next article. I’ll definitely be back for more of the same if you protect this hike.

  2. I have been browsing online more than three hours today yet I never found any interesting article like yours It is pretty worth enough for me In my view if all website owners and bloggers made good content as you did the internet will be a lot more useful than ever before

  3. Just wish to say your article is as surprising The clearness in your post is just cool and i could assume youre an expert on this subject Fine with your permission allow me to grab your RSS feed to keep updated with forthcoming post Thanks a million and please keep up the enjoyable work

  4. I do agree with all the ideas you have introduced on your post They are very convincing and will definitely work Still the posts are very short for newbies May just you please prolong them a little from subsequent time Thank you for the post

Leave a Comment

Your email address will not be published. Required fields are marked *