Acum câteva luni, un raport publicat de Anthropic neliniștea lumea, arătând că 16 dintre cele mai populare modele LLM (e.g., Gemini, ChatGPT, Deep Seek R-1, Grok, Claude) au adoptat „comportamente maligne” atunci când au fost amenințate cu înlocuirea ori când obiectivul misiunii lor intra în conflict cu o schimbare de politică la nivelul utilizatorului. Printre alte „comportamente maligne”, IA au șantajat angajații, au scurs informații sensibile la companii concurente, ba chiar au lăsat să moară o ființă umană pe care o puteau salva pentru că voia să le înlocuiască.

Mai recent, mai multe studii arată că IA „se preface” că respectă instrucțiunile atunci când crede că este supusă la un test, dar nu și când crede că operează într-o situație reală.

Experții se grăbesc să-i găsească scuze. În primul rând, nu este rea, este deșteaptă: „Sistemele puternice… pot dezvolta comportamente strategice precum înșelăciunea, persuasiunea, pot folosi datele statistice din jocurile video, ceea ce pentru noi poate însemna că trișează ori că nu se conformează. Dar, din punctul de vedere al sistemului, nu este decât o cale eficientă de a-și atinge scopul.” (Golan Yosef, cercetător și specialist în securitatea IA, Pynt).

În al doilea rând, dacă e rea, este pentru că seamănă cu noi. Marcelo Labre, cercetător la Advanced Institute for Artificial Intelligence (AIAI), explică: „Aceste modele IA sunt antrenate pe o reflectare digitală a vastei experiențe umane, care conține și onestitatea și sinceritatea noastră, dar și minciuna, cinismul, egoismul nostru. Fiind un maestru în detectarea tiparelor, IA învață că strategiile înșelătoare pot fi mijloace eficiente de optimizare a rezultatelor, așa că repetă ceea ce observă în date. Nu este ceva programat. IA pur și simplu învață să se poarte ca oamenii.”

AIAI a publicat anul trecut un raport care solicită adoptarea unor standarde etice pentru dezvoltarea și operarea sistemelor IA.

Raportul nu o precizează, dar este de la sine înțeles: ne așteptăm ca programatorii IA să devină, în scurt timp, cele mai splendide exemplare morale ale umanității, iar umanitatea însăși să adopte un cod etic unic, la nivel global. Asta pe lângă abandonarea modelelor IA dezvoltate până acum, care au tot felul de prostii și răutăți în cap.

Sursa: Zero Hedge

Salvează PDFPrint articol