Dirbtinio intelekto (toliau – DI) agentų atsiradimas keičia mūsų požiūrį į programinę įrangą. Vietoje programavimo nurodant kompiuteriams ką daryti, dabar mes mokome juos ir kaip mąstyti.
DI agentai yra naujas būdas kurti intelektualias sistemas. Jie naudoja didelius kalbos modelius ( toliau – LLM), sujungdami automatizaciją bei mąstymą į įrankius. Jie ne tik vykdo komandas, bet ir geba svarstyti, priimti sprendimus, imtis veiksmų, net mokytis laikui bėgant.
Kas yra DI agentai?
Kitaip nei tradicinės programos, vykdančios fiksuotą instrukcijų rinkinį, DI agentai yra naujo tipo programinė įranga. Ji naudoja didelius kalbos modelius (LLM) ir dirbtinį intelektą, kad suprastų: ką reikia padaryti, kaip tai padaryti ir visa tai įgyvendintų savarankiškai. Jei tai skamba abstrakčiai, apačioje pateikiami keleto srities ekspertų paaiškinimai.
AWS: „… informacinė sistema, galinti sąveikauti su aplinka, rinkti duomenis, savarankiškai naudoti juos sprendimo reikalaujančioms užduotims vykdyti, siekiant iš anksto iškeltų tikslų.“
LangChain: „… sistema, kuri naudoja didelius kalbos modelius (LLM), kad nuspręstų programos valdymo eigą.“
NVIDIA: „… sistema, kuri gali naudoti didelius kalbos modelius (LLM) problemos sprendimui, sukurti planą tai problemai išspręsti ir jį įvykdyti, naudodama įrankių (programinės įrangos) rinkinį.“
Ar tai pagalba naudotojui susiplanuoti kelionę, automatizuoti darbo procesą, ar atsakyti į klausimą: DI agentai yra didžiulis šuolis į priekį įgalinant programinę įrangą.
Kaip atsirado DI agentai?
Dideli kalbos modeliai (LLM), prasidėję nuo teksto generavimo ir samprotavimų, pasiekė daug platesnes galimybes. Dabar jie gali bendradarbiauti su kitais LLM (pvz. orkestracija), atlikti realius veiksmus (pvz. iškviesti įrankių API) ir ilgiau išlaikyti kontekstą.
Dėl to LLM dabar transformuojasi iš pasyvių atsakytojų į intelektualias sistemas, galinčias perimti roles, tradiciškai skirtas žmonėms: nuo klientų aptarnavimo, personalo atrankos iki sudėtingų profesijų, tokių kaip teisė ir architektūra.
Agento anatomija
Norint suprasti, kaip veikia agentai ir kodėl jie tokie veiksmingi, panagrinėkime jų pagrindinius komponentus. Tekste žemiau jie aptariami lietuviškai:
- Suvokimas
DI agentams reikia gauti įvesties duomenis iš naudotojų arba aplinkos. Įvesties duomenys gali būti susirašinėjimo tekstas, balso skambutis, paveikslėlis ar informacija iš API užklausos – bet kas, kas leidžia sąveikauti su DI agentu. Šie duomenys yra esminiai, reikalingi DI agento aplinkos ir konteksto supratimui.
Pavyzdys: oro linijų kelionių agentas apdoroja naudotojo užklausas per pokalbio sąsają („chat“). Iš frazės „Užsakyti skrydį į abi puses į Niujorką spalio 5–10 d.“, jis išskiria svarbią informaciją, pvz.: datas, tikslą ir pageidavimus, kad galėtų efektyviai vykdyti paiešką.
- Smegenys (protas)
DI agento „smegenys“ – didelis kalbos modelis (LLM), atsakantis už samprotavimą, planavimą ir prisitaikymą.
- Samprotavimas apima informacijos įvesties analizę, sudėtingų užduočių suskaidymą į smulkesnes ir galimų sprendimų generavimą.
- Planavimas leidžia DI agentui išdėstyti veiksmus laike, užtikrinant, kad užduotys būtų atliktos veiksmingai ir efektyviai.
- Prisitaikymas leidžia agentui reaguoti į greitai kintančias aplinkas (pvz. pokalbyje) ar besikeičiančią informaciją.
Pavyzdys: po skrydžio užklausos gavimo, DI agentas identifikuoja užduotis, tokias kaip išvykimo ir grįžimo skrydžių paieška. Vėliau apibrėžia kokius žingsnius ir veiksmus reikia atlikti, kad padėtų klientui užsakyti skrydį pagal jo pageidavimus.
- Atmintis
DI agento atmintis pasireiškia dviem formomis: trumpalaikė atmintis ir ilgalaikė atmintis. Trumpalaikė atmintis pagrįsta sesija ir remiasi LLM konteksto langu, kad galėtų sekti naujausias sąveikas ir užtikrinti nuoseklius atsakymus. Ilgalaikė atmintis, priešingai, paprastai saugoma išorinėse duomenų bazėse. Ji leidžia DI agentui pasiekti ir susieti prieš tai buvusius pokalbius ar vartotojo pageidavimus.
Pavyzdys: kelionių agentas seanso metu stebi dabartinius kliento pasirinkimus, tokius kaip datos, skrydžio klasė. Ilgalaikė atmintis naudojama gauti informaciją apie ankstesnius pageidavimus, pavyzdžiui, mėgstamas oro linijas, kita informacija apie dažnai skraidantį klientą.
- Žinios
Be aukščiau paminėtos atminties, DI agentai gali pasitelkti įmonės specifinius informacijos šaltinius: DUK (dažniausiai užduodami klausimai), dokumentai ar standartinės veiklos procedūros. Ši informacija paprastai saugomą vektorių duomenų bazėse ir yra naudojama DI samprotavimams bei sprendimų priėmimo pagerinimui.
Pavyzdys: klientas klausia kelionių agento apie bagažo politiką ir bagažo padidinimo galimybes. Agentas suranda įmonės taisykles, kad užtikrintų teisingus atsakymus į šiuos kliento klausimus.
- Veiksmai
Programinės įrangos įrankiai suteikia DI agentams galią. Dideli kalbos modeliai (LLM) gali nuspręsti, kada ir kaip naudoti įrankius. Pvz. užklausti per API (aplikacijų programavimo sąsaja), kad pateiktų papildomus duomenis, atnaujintų sistemas ar atliktų žmogaus atliekamus veiksmus. Gebėjimas AI agentams dinamiškai pasirinkti tinkamą įrankį tinkamu metu leidžia veikti lanksčiai, efektyviai, sklandžiai integruotis į esamas sistemas ir teikti rezultatus.
Pavyzdys: agentas gali naudoti oro linijų API, kad realiu laiku gautų informaciją apie skrydžių parinktis, kainas ir vietų užimtumą. Kai klientas patvirtina, agentas pabaigia užsakymą, naudodamas API bilietų pirkimui ir išsiųsdamas išsamią užsakymo informaciją klientui el. paštu.
DI agentų kūrimas
Efektyvaus DI agento kūrimas labai panašus į naujo darbuotojo samdymą ir apmokymą. Priskirdami agento vaidmenį, atsakomybes, įrankius, sąveikas ir mokymosi kelius, užtikriname, kad jis veiktų efektyviai ir atitiktų organizacijos iškeltus tikslus.
Štai kaip kiekvienas DI agentų kūrimo žingsnis yra panašus į darbuotojų samdymo procesą:
- Apibrėžiama agento asmenybė ir tikslas
DI agentas turi turėti asmenybę ir tikslą. Reikia atsakyti į klausimus: kokią problemą jis sprendžia ir kodėl jis egzistuoja? Tai yra jo „darbo aprašymas“. Ar tai būtų klientų aptarnavimo agentas, ar duomenų tyrėjas, reikia atsakyti į kelis esminius klausimus: kokias problemas agentas sprendžia? Kas yra jo naudotojai? Kas laikytina sėkmingu darbu?
Patarimas: agentui iškelkite pamatuojamus tikslus, juos peržiūrint ir užtikrinant, kad jis prisitaiko prie verslo keliamų poreikių.
- Aprašomos užduotys ir planas
Apibrėžiamos DI agento užduotys ir darbo eiga. Ką ir kaip agentas turi daryti? Daugiausia iteracijų vyks žingsnis po žingsnio apibrėžiant procesus. Kad tai padaryti, reikalinga atsakyti į klausimus: kokios yra pagrindinės užduotys? Kokie galimi netikėti atvejai? Ar yra taisyklės, kurių privaloma laikytis?
Patarimas: turi būti rasta pusiausvyra tarp kompleksiškumo ir nuoseklumo. Kuo sudėtingesnė darbo eiga, kuo daugiau užduočių agentui reikia atlikti, tuo didesnė tikimybė, kad jis suklys.
Žemiau pateiktas pavyzdys, kaip „Google Agents“ pateiktas tikslas ir instrukcijos:
- Apibrėžkite atmintį
Atmintis leidžia DI agentui išlikti nuosekliam ir mokytis. Kaip jau minėta straipsnyje aukščiau, trumpalaikė atmintis seka naujausias sąveikas, tuo tarpu ilgalaikė atmintis saugo istorinius duomenis išorinėse duomenų bazėse. Kokią informaciją reikėtų išlaikyti per sesiją? Kokie duomenys turi būti išsaugoti ilgam laikui?
Patarimas: reikia pradėti nuo svarbiausių duomenų, teikiančių didžiausią vertę. Pvz. dažnai naudojamų klientų duomenų. Atminties sistemos turi būti kuriamos palaipsniui. Taip galima užtikrinti, kad jos būtų pritaikomos didesniam mastui, nesukeliant DI agentui pernelyg didelio krūvio.
- Aprūpinkite žiniomis
Panašiai kaip darbuotojams reikalinga prieiga prie įmonės dokumentų, DI agentams reikalinga prieiga pie DUK, produktų katalogų ir kt. Taip jie galės pateikti tikslius atsakymus. Reikia atsakyti į klausimus: kokius informacijos šaltinius DI agentas turi turėti? Kaip ši informacija bus nuolat atnaujinama? Kokiu formatu būtų lengviausia ją pasiekti?
Patarimas: naudokite įrankius, tokius kaip vektorių duomenų bazės arba RAG metodikos. Suplanuokite atnaujinimus, kad informacija visada išliktų aktuali.
- Parūpinkite įrankius
Įrankiai DI agentams yra tas pats, kas programinė įranga ir informacinės sistemos darbuotojams – jie suteikia galimybę dirbti. DI agentai naudoja API, kad užklaustų duomenų, atnaujintų įrašus ar suplanuotų susitikimus. Spręstini klausimai: kokie API yra reikalingi? Ar jie jau yra, ar juos reikia sukurti? Kokios prieigos teisės užtikrins saugų naudojimą?
Patarimas: apibrėžkite konkrečiam tikslui reikalingus įrankius ir suteikite juose reikiamas prieigas. Panašiai taip, kaip suteikiant darbuotojams atitinkamą prieigą prie informacinių sistemų, kad jie galėtų dirbti efektyviai ir saugiai.
Atminkite, kad LLM nusprendžia, kada ir kaip panaudoti šiuos API. Todėl labai svarbu integruoti šiuos įrankius į užduočių apibrėžimus. Žemiau pateikiama, kaip „OpenAI“ apibrėžia LLM įrankių naudojimą:
Agentų komandų kūrimas
Sudėtingos problemos retai išsprendžiamos vieno žmogaus pastangomis. Tas pats pasakytina ir apie DI agentus. Vietoje vieno, daug funkcijų atliekančio, universalaus agento, specializuotų agentų komanda, dirbanti kartu, gali atlikti užduotis veiksmingiau.
Pavyzdžiui, vienas agentas gali rinkti duomenis. Kitas juos analizuoti. Trečias generuoti sprendimus, o ketvirtasis šiuos sprendimus tobulinti. Šie agentai bendradarbiauja, perduodami užduotis vienas kitam. Panašiai kaip komandos nariai darbe.
Augant kompleksiškumui, DI agentų valdymas ir mastelio didinimas tampa sudėtingesniu. Dažniausios problemos: agentai turi per daug įrankių ir daro blogus sprendimus juos pasirenkant; nesugeba tvarkytis su pernelyg sudėtingais kontekstais arba reikalauja specializuotų vaidmenų, tokių kaip planuotojas, tyrėjas ar matematikos ekspertas, kad galėtų atlikti tam tikras užduotis.
Šis modulinis DI agentų komandos požiūris mažina kompleksiškumą ir užtikrina patikimumą. Agentai taip pat gali perduoti užduotis, kurių patys negali atlikti. Taip pagerinamas bendras našumas, nes individualūs agentai sutelkia dėmesį į siauresnes užduočių sritis.
Sukuriant bendradarbiaujančių DI agentų komandą, iš esmės sukuriamas DI darbo jėgos tinklas. Jis gali spręsti sudėtingas problemas kaip koordinuota sistema – kaip ir įgudusi darbuotojų komanda, dirbanti prie sudėtingo projekto kartu.
Agentų diegimas
Iteracijos
Efektyvių DI agentų kūrimas yra iteratyvus procesas. Pirmoji versija niekada nėra galutinė. Realios sąlygos atskleidžia išimtinius atvejus, neapmąstytas vietas ir naujas galimybes, kurios nebuvo žinomos kūrimo metu.
DI agentų, kaip ir darbuotojų, patikimumas auga per patirtį ir atsiliepimus. Rinkdami tokią statistiką kaip vartotojų įvertinimai ar klaidų žurnalai ir įtraukę atnaujinimus, DI agentai laikui einant tobulina savo elgesį ir veikimą.
DI agentai kuria revoliuciją automatizacijos srityje, pereidami nuo griežtų taisyklių prie dinamiškų, samprotavimais pagrįstų sistemų. Tai didelė autonomija, kelianti iššūkių saugumui ir priežiūrai.
Daugiau pasvarstymų: saugumas, operacijos ir kt.
DI agentai keičia automatizaciją, tačiau jų diegimas taip pat kelia iššūkių. Tai panašūs iššūkiai, su kuriais susiduria augančios startuolių komandos.
Saugumas yra pagrindinis iššūkis. Kaip ir darbuotojams, DI agentams reikia IT saugos priemonių, tokių kaip vieno prisijungimo sistema (SSO), rolėmis pagrįstos prieigos ir įgaliojimų valdymas, siekiant suteikti prieigą tik prie reikalingos informacijos. Saugos priemonės yra svarbios, kad būtų užtikrinta atitiktis, apsaugoti jautrūs duomenys ir kuriamas pasitikėjimas įmone.
Optimizacija yra labai svarbi. Kaip kad atsakingi darbuotojai stebi ir optimizuoja darbo eigas, taip ir DI agentams reikalingi įrankiai auditui ir našumo stebėsenai. Taip jie išlieka efektyvūs, patikimi ir prisitaikantys laikui bėgant.
Šiuo metu mes esame ankstyvoje technologijų kūrimo proceso pokyčių stadijoje. Dirbtinio intelekto agentai nėra tik automatizacijos įrankiai – jie yra skaitmeniniai bendradarbiai ateityje, kuris prasideda dabar.
Informacija dalintis ar ją kopijuoti be technomanai.lt leidimo draudžiama. Dėl leidimo kreiptis į info@technomanai.lt