Stručnjaci za umjetnu inteligenciju (UI) udružuju snage kako bi stvorili možda najzahtjevniji skup pitanja ikada osmišljenih, namijenjen testiranju granica najnaprednijih sustava umjetne inteligencije današnjice. Ova inovativna inicijativa, nazvana “Posljednji ispit za čovječanstvo”, predvođena je Centrom za sigurnost umjetne inteligencije (CAIS) i tvrtkom Scale AI, specijaliziranom za označavanje podataka, koja je nedavno prikupila više od milijardu dolara ulaganja.
Testiranje umjetne inteligencije do krajnjih granica
Prema Reutersu, cilj ovog inovativnog testa je potaknuti sustave umjetne inteligencije da dosegnu svoje krajnje granice, pri čemu se pokušavaju identificirati slabosti trenutnih modela kako bi se dodatno unaprijedili budući. Za razliku od drugih procjena, “Posljednji ispit za čovječanstvo” ne naglašava samo faktografsko znanje, već se fokusira i na apstraktno razmišljanje, čineći ga znatno težim za UI sustave, koji inače ovise o memoriranju.
Zanimljivo, najava ovog testa dolazi samo dan nakon što su objavljeni rezultati pregleda OpenAI-ovog o1 modela. Prema riječima izvršnog direktora CAIS-a, Dana Hendrycksa, o1 model uspio je nadmašiti trenutne standarde u sposobnosti rasuđivanja, postavljajući nove granice za sustave umjetne inteligencije. Kao odgovor na ove napretke, novi ispit poslužit će kao rigorozniji test kognitivne fleksibilnosti umjetne inteligencije, nadilazeći puko prisjećanje činjenica.
Hendrycks, koji je godinama sudjelovao u razvoju testiranja UI sustava, bio je suautor nekoliko radova iz 2021. godine, u kojima su predstavljene nove metode procjene može li UI nadmašiti studente preddiplomskih studija. Iako su tadašnji testovi pokazivali da modeli daju odgovore gotovo nasumično, današnji sustavi umjetne inteligencije značajno su napredovali, s lakoćom nadmašujući prijašnje testove. Taj napredak, iako uzbudljiv, naglašava potrebu za još zahtjevnijim ispitima.
Širok i povjerljiv pristup
Kako objašnjava Reuters, ono što razlikuje “Posljednji ispit za čovječanstvo” od prethodnih testova jest naglasak na apstraktnom razmišljanju.
Umjesto da se isključivo usredotoči na tradicionalne teme poput matematike i društvenih studija, ovaj će ispit uključivati složena, multidisciplinarna pitanja koja će testirati sposobnost UI sustava da razmišljaju kroz različita područja. Kriteriji testa ostaju povjerljivi kako bi se osiguralo da sustavi umjetne inteligencije ne mogu unaprijed “učiti” odgovore—važan korak u sprječavanju manipulacije sustavom.
Kako bi izradili ovaj ispit, CAIS i Scale AI okupljaju stručnjake iz raznih polja, od raketnih inženjera do filozofa. Od ovih stručnjaka traži se da dostave pitanja koja bi mogla izazvati i stručnjake u njihovim vlastitim područjima. Pitanja će proći recenziju, a najznačajnija bi mogla donijeti svojim autorima suautorstvo u objavljenom radu i potencijalnu nagradu do 5.000 dolara.
Iako će ispit pokrivati širok raspon tema, jedno područje je strogo zabranjeno: oružje. Organizatori su odlučili isključiti pitanja vezana uz oružje kako bi spriječili da sustavi umjetne inteligencije steknu opasna znanja koja bi mogla predstavljati ozbiljne prijetnje društvu. S obzirom na brzinu kojom se ova tehnologija razvija, etičke granice u treniranju ovih sustava su presudne, osobito kada je riječ o potencijalnoj upotrebi u vojnim ili obrambenim sektorima.
Kako se prijave prikupljaju uoči roka 1. studenoga, raste iščekivanje u vezi s onim što bi nova rigorozna pitanja mogla otkriti o stvarnim potencijalima, ali i ograničenjima sustava. Ako današnji sustavi umjetne inteligencije uspješno polože “Posljednji ispit za čovječanstvo”, to bi moglo signalizirati početak još sofisticiranijih alata umjetne inteligencije, sposobnih za rješavanje stvarnih problema koji zahtijevaju napredno rasuđivanje i donošenje odluka.
No, krajnji cilj nije samo zbuniti sustave umjetne inteligencije. Cilj je razumjeti kako ti sustavi razmišljaju, gdje se suočavaju s poteškoćama i kako ih učiniti sigurnijima i pouzdanijima. Prepoznavanjem slabosti sada, programeri se nadaju izgraditi otpornije i etički prihvatljivije UI modele za budućnost.
Pozdrav svima! Hvala što čitate Kozmos.hr! Ja sam Ivan i dugi niz godina pišem o svermiu, astronomiji, znanosti, povijesti i arheologiji, a imao sam priliku sudjelovati i u dokumentarcima Science Discovery-ja te History Channel-a.