Microsoft a lansat două noi modele lingvistice Phi, optimizate pentru procesarea multimodală și eficiență hardware.
Primul dintre acestea este Phi-4-mini, un model care folosește 3,8 miliarde de parametrii și lucrează doar cu text.
Phi-4-mini este suficient de mic pentru a rula local pe un telefon mobil. Acesta folosește o arhitectură în care se analizează doar textul ce precede un cuvânt atunci când i se determină semnificația, ceea ce reduce cerințele hardware.

Phi-4-mini folosește și o a doua tehnică de optimizare a performanței, numită atenția interogării grupate, care îl ajută să determine ce puncte de date sunt cele mai relevante pentru o anumită sarcină de procesare.
Al doilea model lingvistic este Phi-4-multimodal, care reprezintă o versiune superioară lui Phi-4-mini, bazată pe 5,6 miliarde de parametrii.
Phi-4-multimodal poate să lucreze cu text, imagini și video.
Conform Microsoft, noile modele lingvistice ale companiei s-au dovedit superioare concurenței în cadrul mai multor teste sintetice.