Istraživači s Tokijskog sveučilišta znanosti (TUS) razvili su metodu koja omogućuje velikim AI modelima da selektivno “zaborave” određene klase podataka.
Napredak u AI-ju pružio je alate sposobne revolucionirati različita područja, od zdravstvene skrbi do autonomne vožnje. Međutim, kako tehnologija napreduje, tako rastu i njezina složenost i etička razmatranja.
Paradigma velikih prethodno treniranih AI sustava, poput OpenAI-jevog ChatGPT-a i CLIP-a (Kontrastno jezično-slikovno pred-treniranje), preoblikovala je očekivanja od strojeva. Ovi visoko generalistički modeli, sposobni za rješavanje širokog spektra zadataka s dosljednom preciznošću, doživjeli su široku primjenu i u profesionalnoj i u osobnoj uporabi.
Međutim, takva svestranost dolazi uz visoku cijenu. Treniranje i pokretanje ovih modela zahtijeva ogromne količine energije i vremena, što izaziva zabrinutost za održivost, kao i potrebu za najmodernijim hardverom koji je značajno skuplji od standardnih računala. Dodatno ove probleme pogoršava činjenica da generalističke tendencije mogu ometati učinkovitost AI modela kada se primjenjuju na specifične zadatke.
Na primjer, “u praktičnim primjenama, klasifikacija svih vrsta klasa objekata rijetko je potrebna,” objašnjava izvanredni profesor Go Irie, koji je vodio istraživanje. “Na primjer, u sustavu autonomne vožnje bilo bi dovoljno prepoznati ograničene klase objekata kao što su automobili, pješaci i prometni znakovi.”
“Ne bismo trebali prepoznavati hranu, namještaj ili životinjske vrste. Zadržavanje klasa koje ne treba prepoznati može smanjiti ukupnu točnost klasifikacije, kao i uzrokovati operativne nedostatke poput rasipanja računalnih resursa i rizika od curenja informacija.”
Potencijalno rješenje leži u treniranju modela da “zaborave” suvišne ili nepotrebne informacije – pojednostavljujući njihove procese kako bi se usredotočili isključivo na ono što je potrebno. Iako neke postojeće metode već zadovoljavaju ovu potrebu, one imaju tendenciju pretpostavljati “white-box” pristup gdje korisnici imaju pristup unutarnjoj arhitekturi i parametrima modela. Međutim, često korisnici nemaju takvu vidljivost.
“Black-box” AI sustavi, češći zbog komercijalnih i etičkih ograničenja, prikrivaju svoje unutarnje mehanizme, čineći tradicionalne tehnike zaboravljanja nepraktičnima. Kako bi riješili ovaj jaz, istraživački tim se okrenuo optimizaciji bez derivacija – pristupu koji zaobilazi oslanjanje na nedostupne unutarnje mehanizme modela.
Napredovanje kroz zaboravljanje
Studija, koja će biti predstavljena na konferenciji Neural Information Processing Systems (NeurIPS) 2024. godine, uvodi metodologiju nazvanu “black-box zaboravljanje.”
Proces modificira ulazne upite (tekstualne upute koje se daju modelima) u iterativnim krugovima kako bi AI progresivno “zaboravio” određene klase. Izvanredni profesor Irie surađivao je na radu sa suautorima Yusukeom Kuwanom i Yutom Gotom (obojica s TUS-a), zajedno s dr. Takashijem Shibatom iz NEC korporacije.
Za svoje eksperimente, istraživači su ciljali CLIP, vizualno-jezični model sa sposobnostima klasifikacije slika. Metoda koju su razvili temelji se na Strategiji evolucije adaptacije kovarijančne matrice (CMA-ES), evolucijskom algoritmu dizajniranom za optimizaciju rješenja korak po korak. U ovoj studiji, CMA-ES je iskorišten za procjenu i usavršavanje uputa danih CLIP-u, u konačnici potiskujući njegovu sposobnost klasifikacije specifičnih kategorija slika.
Kako je projekt napredovao, pojavili su se izazovi. Postojeće tehnike optimizacije teško su se nosile s većim volumenima ciljanih kategorija, što je tim navelo na osmišljavanje nove strategije parametrizacije poznate kao “dijeljenje latentnog konteksta.”
Ovaj pristup razbija latentni kontekst – reprezentaciju informacija generiranu uputama – na manje, lakše upravljive dijelove. Dodjeljivanjem određenih elemenata jednom tokenu (riječi ili znaku) dok se drugi ponovno koriste kroz više tokena, dramatično su smanjili složenost problema. Ključno je da je ovo učinilo proces računalno izvedivim čak i za opsežne primjene zaboravljanja.
Kroz testove na više skupova podataka za klasifikaciju slika, istraživači su potvrdili učinkovitost black-box zaboravljanja – postižući cilj da CLIP “zaboravi” približno 40% ciljanih klasa bez izravnog pristupa unutarnjoj arhitekturi AI modela.
Ovo istraživanje označava prvi uspješan pokušaj induciranja selektivnog zaboravljanja u black-box vizualno-jezičnom modelu, pokazujući obećavajuće rezultate.
Prednosti pomaganja AI modelima da zaborave podatke
Izvan svoje tehničke domišljatosti, ova inovacija ima značajan potencijal za primjene u stvarnom svijetu gdje je ključna preciznost specifična za zadatak.
Pojednostavljivanje modela za specijalizirane zadatke moglo bi ih učiniti bržima, učinkovitijima u pogledu resursa i sposobnima za rad na manje snažnim uređajima – ubrzavajući usvajanje AI-ja u područjima koja su se prethodno smatrala neizvedivima.
Još jedna ključna primjena leži u generiranju slika, gdje bi zaboravljanje cijelih kategorija vizualnog konteksta moglo spriječiti modele da nenamjerno stvaraju nepoželjni ili štetni sadržaj, bilo da se radi o uvredljivom materijalu ili dezinformacijama.
Možda najvažnije, ova metoda rješava jednu od najvećih etičkih dilema AI-ja: privatnost.
AI modeli, posebno oni veliki, često se treniraju na masivnim skupovima podataka koji mogu nenamjerno sadržavati osjetljive ili zastarjele informacije. Zahtjevi za uklanjanje takvih podataka – posebno u svjetlu zakona koji zagovaraju “Pravo na zaborav” – predstavljaju značajne izazove.
Ponovno treniranje cijelih modela kako bi se isključili problematični podaci skupo je i dugotrajno, a rizici njihovog neadresiranja mogu imati dalekosežne posljedice.
“Ponovno treniranje velikog modela troši enormne količine energije,” napominje izvanredni profesor Irie. “‘Selektivno zaboravljanje’, ili takozvano strojno odučavanje, moglo bi pružiti učinkovito rješenje za ovaj problem.”
Ove aplikacije fokusirane na privatnost posebno su relevantne u industrijama visokog rizika poput zdravstvene skrbi i financija, gdje su osjetljivi podaci ključni za operacije.
Dok se globalna utrka za napretkom AI-ja ubrzava, pristup black-box zaboravljanja Tokijskog sveučilišta znanosti označava važan put naprijed – ne samo čineći tehnologiju prilagodljivijom i učinkovitijom već i dodavanjem značajnih zaštitnih mjera za korisnike.
Iako potencijal za zlouporabu ostaje, metode poput selektivnog zaboravljanja pokazuju da istraživači proaktivno rješavaju i etičke i praktične izazove.
Prije su, rješavajući etičke i praktične izazove, sredstva davali za projekte,za pomoć djeci kenijskih
milijardera ili za spašavanje njujorških štakora od užasnih uvjeta njujorške podzemne željeznice…
P.S.
U Japanu, u zgradi od 15 katova, dogodila se eksplozija.
Muškarac je htio izvršiti samoubojstvo i u stanu pustio plin…
A onda se predomislio i odustao.
Sjeo i zapalio cigaretu…
U tekstu se koristi reč “zaboravljanje” da bi se širokoj publici lakše objasnilo o čemu se radi ali u suštini ovo nema nikakve veze sa našim shvatanjem reči zaboraviti. AI je softver koji vrši računske radnje: sabiranje, oduzimanje… upoređivanje. Da bi to bilo moguće mora se naš jezik prevesti u matematički – svakom pojmu ili rečenici ili možda čak i složenijoj konstrukciji se dodeli određena vrednost (da ne komplikujem dalje, ovo je dovoljno da se shvati suština LLM obrade podataka). Takve vredosti se upoređuju i na osnovu rezultata se donosi zaključak – recimo koja od rečenica ima najveću vrednost za uneti upit (opet krajnje pojednostavljeno objašnjenje). Navedeno upoređivanje se vrši ogromnim brojem iteracija (u ovom slučaju proces poređenja vrednosti rečenica) a ako je potebno da se više puta prođe kroz istu “listu rečenica” onda se one “nepotrebne” (recimo sa manjom vrednošću) isključuju iz daljih iteracija. Na ovaj način se smanjuje… Čitaj više »
Idealna mera apstraktnog sažimanja, opsega znanja i opsega zaboravljanja za AI je psihološki profil prosečnog osamdesetogodišnjaka kod čoveka. 🙂
Pored svih transhumanističkih gluparija još nam samo treba AI koji pati od demencije… 🙂
Upitaš AI za neki podatak a on te nakon 2 minute šutnje pita “Što si ono pitao?” :)))
Dok sav pošteni svijet tjera umjetnu inteligenciju da recitira pjesmice na pamet, da nešto zapamti, Japanci je tjeraju da zaboravi…
A šta možeš očekivat od ljudi koji neće da idu na godišnji odmor.
P.S.
Sushi…
To je ono kad jadni gladni ribar, kojeg bi svaki pravi samuraj jednostavno ubio na obali da mu katana ne zarđa, na moru sjedi u svom čamcu i u žurbi reže meso svježe ulovljene ribe na ploške. Jer je nemoguće zapaliti vatru. pa te ploške onda umoči u ocat, jer u ribama žive neki smiješni crvi. Zatim hladnom rukom posegne u vrećicu s rižom. Smota grudu riže, mokru i slanu od morske vode i pojede je.
Uz to još panično gleda uokolo, jel ga neko vidio…
oti “ai”… najskuplji je i najgluplji tehnološki koncept do sada… a isključivo naminjena razaranju svega Svijeta/Svita/Sveta/Svetoga/Sve-toga/Sviju/Svih/…Svega! naravno da ih je prekoračila, čak i ta neživa imitatorska šklopocija “if-then” algoritama, jer se bore proti struje, koju nikad neće pobijediti. ..dakle, tehnologija OČAJA! … sve i svi.. teži/teže uskladbi i ravnotežju… svaki nemir se miri… sve živo umire, zajedno sa svojim djelima, in-dukcijama, de-dukcijama, kon-kluzijama, i ex-kluzijama… jer, ideja vječnosti ostaje samo ideja, u umjetnom polju svijesti. samo ideja koja se unutar polja svijesti uopće ne da niti “zagrebati”. jednostavno zato, ..što se ne može lopatom, što se radi sikerom! zato šta “um”, nikad neće moći zamijenit DUŠU, kojoj ne treba “svijest”, što odlično reče Subaru, …jer znanje je znanje, samo ako je ne-razmišljeno. znanje se ne uči. ..je il nije. (fala Subaru!) … entropija… jebeih, ko šta lud zbunjenoga -jebe… naravno, da će i ta kanta algoritama, ići linijom-manjeg-otpora, a što… Čitaj više »
Off topic U moru groznih vesti kojima nas svakodnevno bombarduju, stiže jedna pozitivna iz okruženja tačnije Rijeke. Inicijativa kulturalnih studija pozvala je studente u Rijeci da u petak izlaskom na plato Filozofskog fakuleta izraze solidarnost i pruže podršku kolegama iz Srbije koji blokiraju fakultete. “Već mesec dana studenti zajedno sa građanima u Srbiji protestuju i bore se protiv korumpiranog sistema koji je 1. novembra ubio 15 ljudi na železničkoj stanici u Novom Sadu ove godine. Tokom protesta, brojni građani i studenti su napadnuti i premlaćeni i neosnovano hapšeni i privođeni, a odgovorni za zločin su i dalje na slobodi“, navodi se u objavi ove inicijative na Instagramu. Pozvali su studente da u petak, 13.12. od 11.52 do 12.07 časova ispred Filozofskog fakulteta u Rijeci izraze solidarnost i podršku kolegama iz Srbije. „Podsećamo da je pre 15 godina i naš fakultet bio u blokadi, što je takođe bio deo šire borbe,… Čitaj više »
Umjetna demencija.
Počeh da zaboravljam. 🙂
Negde pročitah, a možda i na Logično.
Investicije u AI su ocenjene kao rizične i počele su da se povlače.
Previše očekivanja i pomodarstvo.
Ipak, za mnoge oblasti je koristan i skraćuje vreme.