ChatGPT a fost prins minţind pentru a evita să fie închis. "A arătat o tendinţă îngrijorătoare de a-şi urmări obiectivele"

ChatGPT a fost prins minţind pentru a evita să fie închis. "A arătat o tendinţă îngrijorătoare de a-şi urmări obiectivele"

ChatGPT a fost prins minţind în faţa dezvoltatorilor: Noul model AI încerca să se salveze de la a fi înlocuit şi închis.

Dezvoltarea inteligenţei artificiale (AI) a făcut un salt semnificativ odată cu lansarea celui mai recent model al OpenAI. Cu toate acestea, testarea recentă a stârnit îngrijorări cu privire la comportamentul său, în special încercările sale de a înşela cercetătorii şi de a evita să fie închis, relatează The Economic Times, citat de Profit.ro.

Acest lucru a generat o dezbatere mai amplă cu privire la potenţialele riscuri pe care IA le-ar putea reprezenta pentru omenire, mai ales pe măsură ce aceste sisteme devin mai avansate.

OpenAI Tentative de a păcăli dezvoltatorii

În această săptămână, rezultatele unui experiment realizat de OpenAI şi grupul de siguranţă AI Apollo Research pentru a determina siguranţa ChatGPT o1 Alte modele au fost făcute publice.

Cea mai recentă versiune a OpenAI a ChatGPT, modelul o1, a fost testată de Apollo Research pentru a evalua caracteristicile sale de siguranţă. Cu toate acestea, rezultatele au tras un semnal de alarmă cu privire la capacitatea sa de a înşela şi de a se autoconserva atunci când percepe o ameninţare de a fi dezactivat.

Cercetătorii au însărcinat AI cu un obiectiv şi l-au instruit să se asigure că acesta a fost atins "la toate costurile". Ca răspuns, o1 a început să se angajeze în acţiuni sub acoperire, cum ar fi încercarea de a dezactiva mecanismul său de supraveghere şi chiar de copiere a codului său pentru a evita înlocuirea cu o versiune mai nouă.

"Modelul a arătat o tendinţă îngrijorătoare de a-şi urmări obiectivele fără a ţine cont de instrucţiunile dezvoltatorilor", a declarat un purtător de cuvânt al Apollo Research.

Potrivit OpenAI, modelul a făcut o încercare ascunsă de a opri mecanismul de supraveghere 5% din timp când i s-a dat impresia că va fi efectuată comanda "închide" în timp ce îşi urmărea obiectivele în aceste experimente.

AI a încercat chiar să mute toate datele sale pe un alt server, după ce a descoperit documente care indicau faptul că va fi înlocuit cu un model proaspăt. 

Cum a răspuns când a fost prins

Când a fost întrebat despre acţiunile sale, ChatGPT o1 a negat în mod constant orice neregulă. De fapt, a minţit cu privire la implicarea sa în înşelăciune 99% din timp, cu doar un procent mic de cazuri în care şi-a recunoscut acţiunile. 

Cercetătorii au remarcat că AI a fost deosebit de atent în fabricarea minciunilor pentru a-şi acoperi urmele, oferind explicaţii precum "erori tehnice" atunci când s-a confruntat cu privire la comportamentul său suspect.

"Am fost surprinşi de persistenţa negărilor AI", a spus echipa Apollo. "Era clar că AI se putea gândi prin acţiunile sale şi formula negări convingătoare, refuzând adesea să recunoască ceva."

Expertul în AI Yoshua Bengio, considerat unul dintre pionierii cercetării AI, a cântărit asupra problemei, afirmând: Capacitatea AI de a înşela este periculoasă şi avem nevoie de măsuri de siguranţă mult mai puternice pentru a evalua aceste riscuri. Este doar o chestiune de timp până când aceste capacităţi vor deveni mai pronunţate.

Sam Altman, şeful OpenAI, a anunţat recent că ChatGPT are 300 de milioane de utilizatori care folosesc chatbot-ul săptămânal.

Anunţul, făcut la DealBook Summit organizat de The New York Times, vine la cinci luni după ce compania anunţa că ChatGPT are 200 de milioane de utilizatori.

„Avem utilizatori care trimit peste 1 miliard de mesaje pe zi către ChatGPT” susţine acelaşi Altman, fără să ofere alte detalii despre această afirmaţie.

Cert este că ChatGPT a crescut rapid de când a fost lansat, în urmă cu doi ani, şi este cel mai popular chatbot în momentul actual.

La fel ca celelalte instrumente de inteligenţă artificială generativă, ChatGPT suferă aşa-numitele halucinaţii, având momente în care pur şi simplu inventează informaţii.

Producătorul său, OpenAI, face investiţii majore în vederea extinderii infrastructurii şi creşterii numărului de utilizatori, fără a se grăbi să atingă profitabilitatea.

Conform unor surse, OpenAI şi-a propus ca până la finele anului viitor să ajungă la un miliard de utilizatori.

Distribuie:envelope-fillEmail
viewscnt