Nvidia a prezentat un nou model de inteligență artificială (AI) pentru generarea de muzică și conținuturi audio, capabil să modifice voci și să creeze sunete noi, o tehnologie destinată producătorilor de muzică, filme și jocuri video, transmite agenția Reuters.
Nvidia, principalul furnizor mondial de cipuri și software pentru crearea de sisteme AI, a declarat că nu are planuri imediate de a lansa public această tehnologie, numită Fugatto, prescurtarea de la Foundational Generative Audio Transformer Opus 1. Aceasta se alătură altor tehnologii prezentate de startup-uri ca Runway și de jucători mai mari, precum Meta Platforms, care pot genera conținut audio sau video pornind de la o comandă sub formă de text („prompt”), scrie Agerpres.
Versiunea creată de Nvidia, cu sediul în Santa Clara, California, generează efecte sonore și muzică pornind de la o descriere text, inclusiv sunete inedite, cum ar fi o trompetă care „latră” ca un câine.
Ceea ce o diferențiază de alte tehnologii AI este capacitatea de a prelua și modifica sunetul existent, de exemplu prin preluarea unui vers cântat la pian și transformarea acestuia într-un vers cântat de o voce umană sau prin preluarea unei înregistrări de cuvinte vorbite și schimbarea accentului folosit și a dispoziției exprimate.
„Dacă ne gândim la sunetul sintetic din ultimii 50 de ani, muzica sună diferit acum datorită computerelor, datorită sintetizatoarelor”, a declarat Bryan Catanzaro, vicepreședintele diviziei de cercetare aplicată în domeniul învățării profunde din cadrul Nvidia. „Cred că AI generativă va oferi noi capabilități muzicii, jocurilor video și oamenilor obișnuiți care doresc să creeze”, a precizat el.
În timp ce companii precum OpenAI negociază cu studiourile de la Hollywood dacă și cum ar putea fi utilizată AI în industria divertismentului, relația dintre tehnologie și Hollywood a devenit tensionată, în special după ce vedeta Scarlett Johansson a acuzat OpenAI că i-a imitat vocea, notează Reuters.
Noul model al Nvidia a fost antrenat pe date de tip open-source, iar compania a declarat că încă dezbate dacă și cum îl va face public.
CITEȘTE ȘI GRAFICE Prețul gazelor pe BRM a atins cel mai înalt nivel al ultimelor 20 de luni, de peste 2 ori mai ridicat decât cel reglementat„Orice tehnologie generativă comportă întotdeauna anumite riscuri, deoarece oamenii ar putea să o folosească pentru a genera lucruri pe care am prefera să nu le facă”, a declarat Catanzaro. „Trebuie să fim atenți la acest lucru, motiv pentru care nu avem planuri imediate de a face publică această tehnologie”, a precizat el.
Creatorii de modele generative pe bază de AI nu au stabilit încă modalitatea prin care se poate preveni abuzul de tehnologie, cum ar fi generarea de informații eronate de către un utilizator sau încălcarea drepturilor de autor prin generarea de personaje protejate prin drepturi de autor.
În mod similar, OpenAI și Meta nu au indicat când intenționează să facă publice modelele lor care generează conținut audio sau video.