Fără permisiune - Marile companii de AI și-au antrenat modelele lingvistice cu transcrierile filmărilor de pe YouTube

Fără permisiune - Marile companii de AI și-au antrenat modelele lingvistice cu transcrierile filmărilor de pe YouTube
Liviu Mihai
Liviu Mihai
scris 17 iul 2024

Apple, Nvidia și alții au folosi transcrierile clipurilor de YouTube, fără permisiune, pentru a-și antrena sistemele de inteligență artificială, arată o investigație.

Conform investigației realizate de Proof News, mai multe mari companii care dezvoltă tehnologii de inteligență artificială, printre care Apple, Nvidia și Anthropic și-au antrenat modelele lingvistice cu transcrierile filmărilor de pe YouTube.

Urmărește-ne și pe Google News

Acestea au ajuns în posesia datelor prin intermediul unui nonprofit, numit EleutherAI, care a preluat transcrierile a peste 48.000 de canale de YouTube..

Evenimente

11 septembrie - Maratonul Impactul fiscalitații în economie. Parteneri: ARB, CEC Bank, CITR
24 septembrie - Eveniment News.ro – ROINVEST - Ediția a V-a. Parteneri: ARB, CEC Bank, ROCA, TeraPlast
30 septembrie - Eveniment Profit.ro e-commerce – Provocările creșterii pe o piață cu concurență tot mai dură - Ediția a V-a. Parteneri: CEC Bank, ContentSpeed
7 octombrie - Eveniment Profit Energy.forum - Ediția a VIII-al Parteneri: Raiffeisen Bank
5 noiembrie - Gala Profit – Povești cu Profit... Made in Romania. Parteneri: ARB, Garanti BBVA, Raiffeisen Bank, Philip Morris Romania
Google va folosi AI-ul pentru a căuta textul din imaginile de pe smartphone-urile Pixel CITEȘTE ȘI Google va folosi AI-ul pentru a căuta textul din imaginile de pe smartphone-urile Pixel

Și asta fără a avea vreun fel de permisiune din partea creatorilor de conținut și fără a-i compensa pe aceștia în vreun fel.

Setul de date folosit de aceste companii nu conține imagini sau filmările propriu-zise, dar include transcrierile și subtitrările clipurilor postate de unii dintre cei mai importanți creatori, precum Marques Brownlee și MrBeast.

Companiile de AI evită să fie transparente în privința datelor pe care le folosesc pentru a-și antrena modelele lingvistice. Unele dintre acestea, însă, recunosc tacit că preiau toate textele pe care le găsesc gratuit pe internet.

În același timp, cu excepția câtorva înțelegeri făcute cu unele dintre marile publicații americane, proprietarii textelor nu sunt compensați în niciun fel.

viewscnt
Afla mai multe despre
inteligență artificială
youtube
apple
nvidia