Mai mulți cercetători români au lansat un model dedicat limbii române pentru inteligența artificială de tip ChatGPT

14 mai 2024, 15:52

O echipă de cercetători români a creat un model de limbaj (LLM – „large language model”) dedicat limbii române, ce poate fi folosit pentru dezvoltarea unor unelte și platforme A.I. Modelul este „open source”, deci va putea fi accesat și folosit de oricine dorește să construiască instrumente bazate pe inteligența artificială

Mai mulți cercetători români au lansat un model dedicat limbii române pentru inteligența artificială de tip ChatGPT

Odată cu publicarea acestui LLM, inițiatorii proiectului lansează și comunitatea OpenLLM-Ro, care dorește să-i aducă împreună pe toți cei care vor să contribuie în diverse forme la dezvoltarea tehnologiilor A.I. pentru limba română. Ambele proiecte sunt inițiate și derulate de către POLITEHNICA București, Universitatea din București și Institutul de Logica și Știința Datelor, cu sprijinul BRD Groupe Société Générale.

CITEȘTE ȘI FOTO Acțiunile GameStop explodează brusc după o postare online

Deși este o tehnologie la care avem acces la scară largă de doar câțiva ani, mulți dintre noi am interacționat deja de foarte multe ori cu roboți conversaționali, precum ChatGPT (produs de OpenAI), Copilot (dezvoltat de Microsoft), Gemini (dezvoltat de Google) etc. Însă, pentru limba română rezultatele sunt uneori imprecise, pentru că modelele pe care sunt instruite nu au fost expuse multor surse românești de date. Totodată, aceste genuri de unelte nu pot fi folosite în companii, deoarece accesul direct poate fi restricționat din rațiuni de securitate și confidențialitate.

Dezvoltatorii modelului open source consideră că o soluție în aceste situații este implementarea unui model local aflat în infrastructura companiei. Aceste modele publice care pot fi folosite local sunt în general, însă, antrenate pe limba engleză sau folosind un număr redus de documente în limbile cu circulație mai scăzută.

Modelul românesc lansat este adaptarea unui LLM public dezvoltat în principal pentru limba engleză. Însă acesta a fost expus la câteva milioane de documente în limba română, pentru a înțelege mai bine semnificația cuvintelor. Acest lucru e esențial pentru perfomanța unor astfel de modele în situații unde exprimarea cerinței sau a întrebării introduse de utilizator, cât și a răspunsului trebuie să fie în limba română.

Începând din a doua parte a anului 2023, la dezvoltarea și instruirea acestui LLM a lucrat o echipă de cercetători de la POLITEHNICA București, Universitatea din București și Institutul de Logica și Știința Datelor. Partenerii academici au contribuit cu cercetători care au lucrat pro-bono și, în plus, POLITEHNICA București a pus la dispoziție și puterea de calcul necesară antrenării modelului. Partenerul principal al proiectului este BRD Groupe Société Générale.

„Câteva dintre exemplele de utilizare ale modelului românesc sunt: căutarea de informații în baza de cunoștințe a unei organizații, cu ghiduri și proceduri de lucru, sau roboți conversaționali pentru clienții companiilor sau ai instituțiilor care să îi ghideze în parcurgerea pașilor necesari pentru utilizarea unui produs sau serviciu. În ambele cazuri, angajații și/sau clienții economisesc timp în accesarea informației, beneficiind în multe situații și de îmbunătățirea calității acesteia”, a spus Alin Ștefănescu, directorul Departamentului de Informatică din cadrul Universității din București și vicepreședintele Institutului de Logică și Știința Datelor.