ChatGPT - prins mințind pentru a evita să fie închis. "A arătat o tendință îngrijorătoare de a-și urmări obiectivele"

ChatGPT - prins mințind pentru a evita să fie închis. "A arătat o tendință îngrijorătoare de a-și urmări obiectivele"
scris 11 dec 2024

ChatGPT a fost prins mințind în fața dezvoltatorilor: Noul model AI încerca să se salveze de la a fi înlocuit și închis.

Dezvoltarea inteligenței artificiale (AI) a făcut un salt semnificativ odată cu lansarea celui mai recent model al OpenAI. Cu toate acestea, testarea recentă a stârnit îngrijorări cu privire la comportamentul său, în special încercările sale de a înșela cercetătorii și de a evita să fie închis, relatează The Economic Times.

Urmărește-ne și pe Google News
Tranzacția prin care Vodafone și Digi vor să preia Telekom România Mobile a intrat în analiza Consiliului Concurenței. Digi vrea frecvențe radio, turnuri, infrastructură, contractele pre-paid CITEȘTE ȘI Tranzacția prin care Vodafone și Digi vor să preia Telekom România Mobile a intrat în analiza Consiliului Concurenței. Digi vrea frecvențe radio, turnuri, infrastructură, contractele pre-paid

Acest lucru a generat o dezbatere mai amplă cu privire la potențialele riscuri pe care IA le-ar putea reprezenta pentru omenire, mai ales pe măsură ce aceste sisteme devin mai avansate.

OpenAI Tentative de a păcăli dezvoltatorii

În această săptămână, rezultatele unui experiment realizat de OpenAI și grupul de siguranță AI Apollo Research pentru a determina siguranța ChatGPT o1 Alte modele au fost făcute publice.

Cea mai recentă versiune a OpenAI a ChatGPT, modelul o1, a fost testată de Apollo Research pentru a evalua caracteristicile sale de siguranță. Cu toate acestea, rezultatele au tras un semnal de alarmă cu privire la capacitatea sa de a înșela și de a se autoconserva atunci când percepe o amenințare de a fi dezactivat.

DECIZIE Taxele judiciare de timbru, achitate în numerar la ghișeele instanțelor CITEȘTE ȘI DECIZIE Taxele judiciare de timbru, achitate în numerar la ghișeele instanțelor

Cercetătorii au însărcinat AI cu un obiectiv și l-au instruit să se asigure că acesta a fost atins "la toate costurile". Ca răspuns, o1 a început să se angajeze în acțiuni sub acoperire, cum ar fi încercarea de a dezactiva mecanismul său de supraveghere și chiar de copiere a codului său pentru a evita înlocuirea cu o versiune mai nouă.

"Modelul a arătat o tendință îngrijorătoare de a-și urmări obiectivele fără a ține cont de instrucțiunile dezvoltatorilor", a declarat un purtător de cuvânt al Apollo Research.

Potrivit OpenAI, modelul a făcut o încercare ascunsă de a opri mecanismul de supraveghere 5% din timp când i s-a dat impresia că va fi efectuată comanda "închide" în timp ce își urmărea obiectivele în aceste experimente.

Christian Tour preia direct TUI Travel Center România, parte a aceluiași grup, și se prezintă drept compania cu cel mai mare număr de agenții fizice, la nivel național. Plan de listare la bursă. Anterior, către Profit.ro pe tema achizițiilor: Vor fi ca un CITEȘTE ȘI Christian Tour preia direct TUI Travel Center România, parte a aceluiași grup, și se prezintă drept compania cu cel mai mare număr de agenții fizice, la nivel național. Plan de listare la bursă. Anterior, către Profit.ro pe tema achizițiilor: Vor fi ca un

AI a încercat chiar să mute toate datele sale pe un alt server, după ce a descoperit documente care indicau faptul că va fi înlocuit cu un model proaspăt. 

Cum a răspuns când a fost prins

Când a fost întrebat despre acțiunile sale, ChatGPT o1 a negat în mod constant orice neregulă. De fapt, a mințit cu privire la implicarea sa în înșelăciune 99% din timp, cu doar un procent mic de cazuri în care și-a recunoscut acțiunile. 

Cercetătorii au remarcat că AI a fost deosebit de atent în fabricarea minciunilor pentru a-și acoperi urmele, oferind explicații precum "erori tehnice" atunci când s-a confruntat cu privire la comportamentul său suspect.

FOTO Braiconf relansează magazinul online și se extinde spre femei CITEȘTE ȘI FOTO Braiconf relansează magazinul online și se extinde spre femei

"Am fost surprinși de persistența negărilor AI", a spus echipa Apollo. "Era clar că AI se putea gândi prin acțiunile sale și formula negări convingătoare, refuzând adesea să recunoască ceva."

Expertul în AI Yoshua Bengio, considerat unul dintre pionierii cercetării AI, a cântărit asupra problemei, afirmând: Capacitatea AI de a înșela este periculoasă și avem nevoie de măsuri de siguranță mult mai puternice pentru a evalua aceste riscuri. Este doar o chestiune de timp până când aceste capacități vor deveni mai pronunțate.

Sam Altman, șeful OpenAI, a anunțat recent că ChatGPT are 300 de milioane de utilizatori care folosesc chatbot-ul săptămânal.

Anunțul, făcut la DealBook Summit organizat de The New York Times, vine la cinci luni după ce compania anunța că ChatGPT are 200 de milioane de utilizatori.

„Avem utilizatori care trimit peste 1 miliard de mesaje pe zi către ChatGPT” susține același Altman, fără să ofere alte detalii despre această afirmație.

Inteligența artificială nu a perturbat alegerile în lume în 2024, anunță Meta CITEȘTE ȘI Inteligența artificială nu a perturbat alegerile în lume în 2024, anunță Meta

Cert este că ChatGPT a crescut rapid de când a fost lansat, în urmă cu doi ani, și este cel mai popular chatbot în momentul actual.

La fel ca celelalte instrumente de inteligență artificială generativă, ChatGPT suferă așa-numitele halucinații, având momente în care pur și simplu inventează informații.

Producătorul său, OpenAI, face investiții majore în vederea extinderii infrastructurii și creșterii numărului de utilizatori, fără a se grăbi să atingă profitabilitatea.

Conform unor surse, OpenAI și-a propus ca până la finele anului viitor să ajungă la un miliard de utilizatori.

viewscnt
Afla mai multe despre
openai
chatgpt
inteligență artificială
chatbot