Meta Platforms, proprietara Facebook, a lansat un set de noi modele AI dezvoltate de divizia sa de cercetare, inclusiv un "Evaluator Autodidact" care ar putea reduce implicarea umană în procesul de dezvoltare a inteligenței artificiale (AI), transmite Reuters.
Această lansare vine după introducerea acestui instrument în luna august, într-o lucrare care a detaliat modul în care se bazează pe tehnica ”lanțului de gândire”, similară cu cea folosită de modelele o1 recent lansate de OpenAI, pentru a face evaluări mai fiabile ale răspunsurilor oferite de modele, scrie News.ro.
Tehnica implică descompunerea problemelor complexe în pași logici mai mici, îmbunătățind acuratețea răspunsurilor în domenii precum știința, programarea și matematica.
Cercetătorii Meta au utilizat date generate exclusiv de AI pentru a antrena modelul evaluator, eliminând complet intervenția umană în această etapă.
Această abilitate de a folosi AI pentru a evalua alte AI oferă o perspectivă asupra unui potențial drum către dezvoltarea agenților AI autonomi capabili să învețe din propriile greșeli, au declarat pentru Reuters doi dintre cercetătorii din spatele proiectului.
Mulți specialiști din domeniul AI își imaginează acești agenți ca fiind asistenți digitali suficient de inteligenți pentru a executa o gamă largă de sarcini fără intervenție umană.
Modelele care se auto-îmbunătățesc ar putea elimina necesitatea procesului costisitor și ineficient numit Învățare prin Întărire din Feedback Uman (RLHF), care presupune contribuția unor adnotatori umani cu expertiză specializată pentru a eticheta corect datele și a verifica răspunsurile la întrebări complexe din matematică și scriere.
”Sperăm că, pe măsură ce AI devine din ce în ce mai supraomenească, va deveni tot mai bună la verificarea propriului lucru, astfel încât să fie mai precisă decât un om mediu. Ideea de a fi autodidact și capabil să te autoevaluezi este esențială pentru a ajunge la acest nivel supraomenesc de AI”, a spus Jason Weston, unul dintre cercetători.
Alte companii, precum Google și Anthropic, au publicat, de asemenea, cercetări despre conceptul RLAIF (Învățare prin Întărire din Feedback AI), dar, spre deosebire de Meta, aceste companii tind să nu își lanseze modelele pentru uz public.
Alte instrumente AI lansate vineri de Meta includ o actualizare a modelului de identificare a imaginilor ”Segment Anything”, un instrument care accelerează timpul de generare a răspunsurilor LLM și seturi de date care pot fi folosite pentru descoperirea de noi materiale anorganice.