Startupul chinez DeepSeek AI Assistant a depășit rivalul ChatGPT, pentru a deveni cea descărcată aplicație gratuită disponibilă în App Store al Apple din Statele Unite, în pofida utilizării unor resurse mai puțin costisitoare și a unor cipuri cu capacitate redusă.
Având la bază modelul DeepSeek-V3, despre care creatorii săi spun că ”se află în fruntea clasamentului printre modelele open-source și rivalizează cu cele mai avansate modele cu sursă închisă la nivel global”, aplicația de inteligență artificială a crescut în popularitate în rândul utilizatorilor din SUA, de când a fost lansată, pe ianuarie10, conform companiei de cercetare a datelor din aplicații Sensor Tower, citată de Reuters.
DeepSeek, un laborator puțin cunoscut din China, a declanșat îngrijorări în Silicon Valley după ce a lansat modele de inteligență artificială care depășesc performanțele celor mai avansate modele din SUA, în ciuda costurilor reduse și a tehnologiei mai puțin avansate, potrivit CNBC.
În luna decembrie, DeepSeek a prezentat un model de limbaj de mare anvergură, open-source, construit în doar două luni, cu un cost de sub 6 milioane de dolari, folosind cipuri Nvidia H800, mai puțin puternice decât cele de ultimă generație, scrie News.ro.
Această realizare ridică semne de întrebare legate de poziția dominantă a SUA în domeniul inteligenței artificiale și de eficiența investițiilor masive ale marilor companii tehnologice în dezvoltarea de modele AI și centre de date.
În teste independente de referință, modelul DeepSeek a depășit performanțele unor giganți precum Llama 3.1 de la Meta, GPT-4o de la OpenAI și Claude Sonnet 3.5 de la Anthropic, în diverse domenii, inclusiv rezolvarea problemelor complexe, matematică și codare.
Luni, DeepSeek a lansat r1, un model specializat pe raționament, care a obținut rezultate mai bune decât cel mai recent model OpenAI, o1, în numeroase teste.
CITEȘTE ȘI Routerele TP-Link, sub lupa autorităților americane din cauza riscurilor de securitate națională din partea Chinei”Modelul celor de la DeepSeek este impresionant, mai ales prin eficiența lor în utilizarea calculului la momentul inferenței. Este un semnal că trebuie să luăm foarte în serios progresele venite din China,” a declarat CEO-ul Microsoft, Satya Nadella, la Forumul Economic Mondial de la Davos.
Realizările DeepSeek sunt cu atât mai notabile cu cât compania a trebuit să depășească restricțiile stricte impuse de guvernul SUA asupra accesului Chinei la cipuri de înaltă performanță, cum ar fi Nvidia H100. Acest lucru sugerează fie că laboratorul a găsit metode de a ocoli aceste reguli, fie că măsurile de control nu sunt atât de eficiente cum s-a crezut.
”Au folosit o tehnică numită distilare, prin care un model mare ajută unul mai mic să învețe să devină mai eficient. Este o metodă foarte rentabilă,” a explicat Chetan Puttagunta, partener general la Benchmark.
Laboratorul DeepSeek și fondatorul său, Liang WenFeng, rămân relativ misterioși. Se știe că DeepSeek a fost înființat de un fond de investiții chinez, High-Flyer Quant, care administrează active în valoare de aproximativ 8 miliarde de dolari.
DeepSeek nu este singurul actor chinez care avansează în acest domeniu. Renumitul cercetător AI Kai-Fu Lee a anunțat că startup-ul său, 01.ai, a fost antrenat cu un buget de doar 3 milioane de dolari.
În plus, compania-mamă a TikTok, ByteDance, a lansat miercuri o actualizare a modelului său, care, conform testelor, depășește performanțele modelului o1 de la OpenAI.
”Necesitatea stimulează inovația. Faptul că au fost obligați să găsească soluții alternative i-a condus, de fapt, la construirea unui model mult mai eficient,” a comentat CEO-ul Perplexity, Aravind Srinivas..”