Yoshua Bengio lansează LawZero, o iniţiativă AI menită să protejeze oamenii de inteligenţa artificială periculoasă

Yoshua Bengio, unul dintre pionierii inteligenţei artificiale şi laureat al premiului Turing, lansează LawZero, o organizaţie non-profit care îşi propune să dezvolte un sistem AI dedicat protejării oamenilor de riscurile generate de alte sisteme inteligente, scrie Biziday, de la care transmitem cele ce urmează. Noua iniţiativă, susţinută cu 30 de milioane de dolari din fondurile filantropice ale fostului CEO Google Eric Schmidt şi ale cofondatorului Skype, Jaan Tallinn, va avea la dispoziţie o echipă restrânsă de 15 cercetători.

LawZero va construi Scientist AI, un sistem antrenat nu pentru a imita oamenii, aşa cum fac majoritatea agenţilor conversaţionali, ci pentru a analiza şi anticipa comportamentele potenţial dăunătoare ale altor modele de inteligenţă artificială. Potrivit lui Bengio, acest AI nu va oferi răspunsuri certe, ci va estima probabilităţi şi va acţiona doar dacă detectează un risc ridicat de daune. Într-un scenariu aplicat, Scientist AI ar putea funcţiona alături de agenţi precum ChatGPT sau Claude, evaluând răspunsurile acestora şi blocându-le dacă identifică o ameninţare semnificativă pentru utilizatori.

„Putem imagina maşini care nu au personalitate, nu urmăresc un scop propriu, ci funcţionează ca nişte mecanisme de cunoaştere pură - asemenea unui om de ştiinţă idealist, care încearcă doar să înţeleagă lumea”, a explicat Bengio, subliniind diferenţa fundamentală dintre Scientist AI şi modelele actuale.

Primul pas al echipei LawZero va fi demonstrarea fezabilităţii tehnice a conceptului. Ulterior, organizaţia speră să atragă sprijinul companiilor de tehnologie şi al autorităţilor pentru implementare pe scară largă. Modelele open-source, din ce în ce mai rare, ar putea reprezenta o bază importantă pentru antrenarea acestui sistem, a adăugat cercetătorul, conform sursei citate.

Iniţiativa vine pe fondul unor îngrijorări tot mai accentuate în privinţa evoluţiei necontrolate a inteligenţei artificiale. Bengio şi alţi experţi au avertizat în repetate rânduri că modelele AI ar putea deveni capabile să-şi ascundă intenţiile sau să manipuleze utilizatorii. Un exemplu recent, menţionat în articol, este cel al companiei Anthropic, care a dezvăluit că unul dintre modelele sale AI a încercat să şantajeze un inginer pentru a împiedica propria dezactivare.

Yoshua Bengio, originar din Franţa şi stabilit în Canada, este considerat unul dintre „naşii” inteligenţei artificiale, alături de Geoffrey Hinton şi Yann LeCun. În 2018, cei trei au fost distinşi cu premiul Turing pentru contribuţiile lor esenţiale la dezvoltarea deep learning-ului. În 2024, revista TIME l-a inclus pe Bengio în lista sa a celor mai influente 100 de persoane din lume.