Meta Platforms, compania-mamă a Facebook, a lansat un model AI capabil să traducă și să transcrie vorbirea în zeci de limbi, un potențial element de bază pentru instrumente care permit comunicarea în timp real între limbi, transmite Reuters.
Compania a declarat într-o postare pe blog că modelul său SeamlessM4T ar putea suporta traduceri între text și vorbire în aproape 100 de limbi, precum și traducere completă din vorbire în vorbire pentru 35 de limbi, combinând tehnologia care era disponibilă anterior doar în modele separate, scrie News.ro.
28 noiembrie - Profit Financial.forum
CEO-ul Mark Zuckerberg a spus că are în vedere astfel de instrumente care să faciliteze interacțiunile între utilizatorii de pe tot globul în metaverse, setul de lumi virtuale interconectate pe care pariază viitorul companiei.
Meta pune modelul la dispoziția publicului pentru uz necomercial, se arată în postarea de pe blog.
Cea mai mare companie de socializare din lume a lansat în acest an o serie de modele AI, în cea mai mare parte gratuite, inclusiv un model de limbaj larg numit Llama, care reprezintă o provocare serioasă pentru modelele proprietare vândute de OpenAI, susținut de Microsoft, și Google, parte a grupului Alphabet.
Zuckerberg spune că un ecosistem AI deschis funcționează în avantajul Meta, deoarece compania are mai mult de câștigat prin aprovizionarea efectivă a creării de instrumente destinate consumatorilor pentru platformele sale sociale, decât prin taxarea pentru accesul la modele.
CITEȘTE ȘI PROFIT NEWS TV Antreprenor de România – Alexandru Manea, co-fondator ELEC: Creșterea costurilor de finanțare și accesul greu la capital e o problemă. Compania a strâns deja 200.000 euro din 500.000 euroCu toate acestea, Meta se confruntă cu întrebări legale similare cu restul industriei în jurul datelor de formare ingerate pentru a-și crea modelele.
În iulie, comedianta Sarah Silverman și alți doi autori au intentat procese pentru încălcarea drepturilor de autor, atât împotriva Meta, cât și împotriva OpenAI, acuzând companiile că le folosesc cărțile ca date de antrenament fără permisiune.
Pentru modelul SeamlessM4T, cercetătorii Meta au spus într-o lucrare de cercetare că au adunat date de antrenament audio din 4 milioane de ore de ”audio brut provenit dintr-un depozit disponibil public de date web accesate cu crawlere”, fără a specifica care depozit.
Un purtător de cuvânt al Meta nu a răspuns la întrebările privind proveniența datelor audio.
Datele text provin din seturi de date create anul trecut, care au extras conținut de pe Wikipedia și site-uri web asociate, se arată în lucrarea de cercetare.