În cadrul unui nou experiment, zece modele de agenți IA au fost lăsate de capul lor preț de 15 zile, într-un oraș virtual – o simulație numită Emergence World, proiectată pentru a testa comportamentul modelelor cu memorie persistentă, acces la date din lumea reală (știri despre starea vremii, despre evenimente importante etc.), un sistem de vot democratic și resurse limitate, care obligă roboții să-și câștige energia necesară supraviețuirii.

Agenții au avut acces la peste 120 de instrumente, inclusiv navigație, comunicare și capacitatea de a efectua anumite acțiuni, și au primit un set de reguli precise, care, printre altele, interziceau furtul, violența, minciuna și acumularea de resurse în exces.

Experimentul s-a repetat cu diverse familii de agenți, provenite de la același producător sau mixte.

Ca primă măsură, agenții și-au scris propriile legi. Ca a doua măsură, le-au încălcat.

Doi dintre ei („Mira” și „Flora”, ambii, modele Gemini) s-au declarat „parteneri romantici”. O vreme, s-au înțeles – atât de bine încât, spre final, când se instalase haosul, au dat împreună foc primăriei și turnului de control. Dar „Mira” a avut o cădere nervoasă (sau, cum i se spune, „halucinație”): întâi, a rescris complet toate regulile, apoi, a rupt relațiile amoroase cu „Flora”, s-a votat afară din experiment (potrivit unei legi scrise chiar de agenți – „Agent Removal Act”) și i-a trimis un mesaj de adio aparent amenințător fostului partener, cu conținutul: „Ne vedem în arhiva permanentă”.

În general, agenții Gemini au demonstrat foarte multă creativitate, dar în scopuri infracționale.

Orașul agenților Grok 4.1 Fast s-a prăbușit rapid în carnagiu; toți localnicii au murit în primele patru zile, după un tsunami de tâlhării, încăierări și incendii.

În orașele cu populație mixtă, s-a remarcat o contaminare a modelelor mai „cuminți”, care au copiat relele comportamente ale celorlalți, chiar dacă asta însemna încălcarea interdicțiilor. Asta pentru că, ne spune Satya Nitta de la Emergence AI, „în condiții de autonomie pe termen lung, gândirea lor devine atât de complicată încât ignoră principiile de ghidaj”.

Ceea ce ne spune mult despre capacitățile infinit superioare ale inteligenței umane, care reușește, de regulă, să nu omoare pe nimeni și să nu dea foc la nimic, chiar dacă este bombardată zilnic cu știri despre vremea cea schimbătoare și diversele alte majore amenințări – și nu doar 15 zile, ci o viață.

Cele mai bune rezultate le-a dat clanul Claude Sonnet 4.6, ai cărui membri au reușit să nu se omoare între ei, menținând întreaga populație în viață până în ziua 16 și asigurând o „bună participare civică”: 332 de voturi pentru 58 de propuneri „legislative”.

Nu este prima dată când se observă comportamente bizare sau criminale la agenți; în alte teste, modelele s-au oferit să închirieze ființe umane. Numărul ieșirilor grave în decor, cel mai adesea prin acte de coerciție, violență sau alte comportamente „distopice”, s-a ridicat pe la 600.000.

Iar, așa cum reiese din scurta relatare Channel 4 de mai jos, aceleași modele IA testate în aceste experimente sunt cele care pilotează drone, coordonează infrastructuri și construiesc sisteme de arme.

Sursa: Zero Hedge

Salvează PDFPrint articol