Cele trei modele dezvoltate intern de Microsoft se numesc MAI-Transcribe-1, MAI-Voice-1 și MAI-Image-2. Așa cum sugerează și numele, acestea pot fi folosite pentru a transcrie vorbirea în text, a genera voci realiste și a produce imagini.
MAI-Transcribe-1 bate rivalul Whisper-large-v3 de la OpenAI când vine vorba de acuratețe. Conform testelor făcute de Microsoft, acesta are o rată de erori de numai 3,8% la 25 de limbi.
Acesta poate lucra cu fișiere WAV, FLAC și MP3 de până la 200MB, iar transcrierea se face de 2,5 ori mai rapid decât este capabil Azure Fast.
MAI-Voice-1 este capabil să producă un minut de voce umană într-o singură secundă, iar prețul este de 22 de dolari la milionul de caractere generate.
În fine, MAI-Image-2 va putea fi folosit în Bing și PowerPoint pentru a genera imagini. Acesta costa 5 dolari milionul de token-uri pentru text introdus și 33 de dolari milionul de token-uri pentru imagini generate.
Modelele de inteligența artificială anunțate acum de Microsoft reprezintă primele produse ale echipei de „superinteligență” creată în urmă cu șase luni de Mustafa Suleyman, cu scopul de atinge ceea ce acesta numește „autosuficiență în domeniul inteligenței artificiale”.
Lansarea vine într-un moment sensibil pentru Microsoft, ale cărei acțiuni au încheiat cel mai slab trimestru de la criza din 2008 până în prezent.
















