„Google“ pristatė tai, ką vadina nauju „samprotavimo“ DI (dirbtinis intelektas) modeliu. Jis dar eksperimentinėje stadijoje. Iš trumpų testų matyti, kad yra erdvės tobulinimui.
Naujasis modelis, vadinamas „Gemini 2.0 Flash Thinking Experimental“, yra prieinamas „AI Studio“, „Google“ DI prototipų kūrimo platformose. Modelio kortelėje jis apibūdinamas kaip tinkamiausias multimodaliniam supratimui, mąstymui ir programavimui, bei galintis spręsti pačias sudėtingiausias problemas tokiose srityse kaip programavimas, matematika ir fizika.
Savo pranešime socialiniame tinkle „X“ Loganas Kilpatrikas (Logan Kilpatrick), vadovaujantis produktų kūrimui „AI Studio“, pavadino „Gemini 2.0 Flash Thinking Experimental“ pirmuoju žingsniu „Google“ samprotavimo kelionėje. Džefas Dynas (Jeff Dean), „Google DeepMind“ (DI tyrimų padalinys) vyriausiasis mokslininkas, savo įraše nurodė, kad „Gemini 2.0 Flash Thinking Experimental“ yra mokomas naudoti mąstymo procesus, kad sustiprintų savo gebėjimą samprotauti.
„Pastebime daug žadančius rezultatus, kuomet padidiname skaičiavimo laiką, reikalingą modeliui apsvarstyti klausimą,“ – sakė Dynas, turėdamas omenyje kompiuterinių resursų panaudojimą modelio atsakymų pateikimui.
Sukurta remiantis neseniai „Google“ pristatyto „Gemini 2.0 Flash“ pagrindu, „Gemini 2.0 Flash Thinking Experimental“ atrodo panaši į „OpenAI“ o1 ir kitus vadinamuosius samprotavimo modelius. Skirtingai nuo daugumos DI, samprotavimo modeliai patys efektyviai tikrina faktus. Taip išvengiama kai kurių klaidų, kurios paprastai pasitaiko DI modeliuose.
Didžiausias samprotavimo modelių trūkumas – laikas. Dažnai pateikti sprendimui jiems prireikia kelių sekundžių ar net minučių.
Gavęs užklausą „Gemini 2.0 Flash Thinking Experimental“ prieš atsakant stabteli, apsvarsto daugybę susijusių užklausų ir paaiškina savo samprotavimo procesą. Tuomet modelis apibendrina tai, laiko pačiu tiksliausiu atsakymu.
Po o1 modelio išleidimo prasidėjo tikras samprotavimo modelių bumas. Jį paskatino ne tik „Google“, bet ir konkurentų DI laboratorijos. Lapkričio pradžioje „DeepSeek“, DI tyrimų įmonė, finansuojama prekybininkų, pristatė pirmąjį savo samprotavimo modelį „DeepSeek-R1“. Tą patį mėnesį „Alibaba“ „Qwen“ komanda pristatė modelį, kurį jie apibūdino kaip pirmąjį „atvirą“ o1 konkurentą.
2023 metų spalį „Bloomberg“ pranešė, kad „Google“ turi net kelias komandas, dirbančias prie samprotavimo modelių kūrimo. Lapkritį „The Information“ paskelbė, kad „Google“ įdarbinęs mažiausiai 200 tyrėjų darbui su šia technologija.
Gali iškilti klausimas: sukėlė samprotavimo modelių proveržį? Viena priežasčių – siekis rasti naujų būdų generatyviam DI tobulinti. Tai reikalinga todėl, kad metodai, skirti DI modeliams plėsti, nebeduoda tokio paties proveržio kaip anksčiau.
Tačiau ne visi tiki, kad samprotavimo modeliai yra geriausias kelias į priekį. Vienas iš iššūkių – jų aukšta kaina, atsirandanti dėl didelio skaičiavimo pajėgumo poreikio. Ir nors šie modeliai gerai pasirodė įvairiuose testuose, kol kas nėra aišku, ar jiems pavyks toliau taip sparčiai tobulėti.
Informacija dalintis ar ją kopijuoti be technomanai.lt leidimo draudžiama. Dėl leidimo kreiptis į info@technomanai.lt