În colaborare cu Nvidia și reunind cercetători de la Universitatea Stanford, UC Berkeley și UC San Francisco, Arc Institute a creat cel mai mare model AI pentru biologie, numit Evo 2.
Noul AI a fost antrenat pe ADN-ul a peste 100.000 de specii din întregul arbore al vieții. Datorită înțelegerii profunde a vieții pe care o posedă, acesta poate identifica modele în secvențele genetice pentru care cercetătorii ar avea nevoie de ani de zile pentru a le descoperi.
Modelul poate identifica cu precizie mutațiile cauzatoare de boli în genele umane și este capabil să proiecteze noi genomuri similare genomului bacteriilor simple.

AI-ul poate, de asemenea, procesa secvențe genetice de până la 1 milion de nucleotide simultan, permițându-i să înțeleagă relațiile dintre părți îndepărtate ale aceluiași genom.
Bazându-se pe predecesorul său Evo 1, care a fost antrenat în întregime pe genomuri unicelulare, Evo 2 este cel mai mare model de AI din biologie, antrenat cu peste 9,3 trilioane de nucleotide, 128.000 de genomuri întregi, precum și date metagenomice.
Evo 2 a fost antrenat vreme de mai multe luni pe platforma NVIDIA DGX Cloud AI prin Amazon Web Services, folosind peste 2.000 de plăci video NVIDIA H100.
Codul Evo 2 a fost publicat pe contul de GitHub al institutului, în speranța că poate fi folosit și în alte domenii pentru a accelera cercetarea științifică.