Olvasási idő: kb. 9 perc
A mesterséges intelligencia (MI) olyan számítógépes rendszerek összessége, amelyek képesek az emberi gondolkodást utánzó feladatok végrehajtására, például tanulásra, következtetésre, problémamegoldásra vagy kommunikációra. A fejlesztők célja, hogy olyan algoritmusokat hozzanak létre, amelyek képesek érzékelni a környezetüket, döntéseket hozni, és ezek alapján önállóan cselekedni vagy fejlődni.
Három nagy MI csoportot különböztetünk meg képességek (intelligencia) szempontjából
- A szűk mesterséges intelligencia (Artificial Narrow Intelligence – ANI). Ez az a mesterséges intelligencia, amivel ma a legtöbbet találkozunk. Kifejezetten egy adott feladatra lett „betanítva”, például arcfelismerésre, nyelv feldolgozásra vagy ajánlórendszerek működtetésére. Az a lényeg, hogy amire képes, azt sokszor az emberi sebességnél gyorsabban vagy akár pontosabban végzi, viszont nem képes kilépni a saját területéről. Nem gondolkodik „általánosan”, és nem tud új, szokatlan helyzetekhez alkalmazkodni, mint mi, emberek.
- Az általános mesterséges intelligencia (Artificial General Intelligence – AGI). Ez már egy magasabb szint, amit ma még csak elméletben ismerünk. Az a cél, hogy olyan gépet hozzunk létre, ami valóban képes lenne emberi szinten gondolkodni és tanulni – bármilyen feladatról is legyen szó. Nem csak egy konkrét dologra lenne jó, hanem ugyanúgy tudna érvelni, tervezni vagy akár problémát megoldani, mint egy ember. Jelenleg ilyen még nem létezik, de rengeteg kutató dolgozik rajta.
- A szuperintelligencia. Ez már a tudományos fantasztikum határát súrolja, de komolyan gondolkodnak róla. Olyan MI-ről lenne szó, ami minden területen túlszárnyalná az emberi intelligenciát, vagyis gyorsabban gondolkodna, kreatívabb lenne stb. Ez persze izgalmas, de egyben ijesztő is, mert rengeteg etikai és biztonsági kérdést vet fel. Például: ki irányítana egy ilyen rendszert? És hogyan tudnánk biztosítani, hogy jó célokra használják?
A MI működési módja szerint csoportosíthatjuk (válogatás)
1) Prediktív MI – előrejelzésekre
Korábbi adatok alapján megjósolja, mi fog történni a jövőben.
Tipikus területek:
- Időjárás-előrejelzés
- Pénzügyi trendek (pl. tőzsde)
- Ügyfélviselkedés előrejelzése
- Karbantartási igények (pl. iparban)
Kulcsszó: Valószínűség. A prediktív MI nem jóslatokat ad, hanem valószínűségeket számol. Az alapján, amit korábban látott, megpróbálja kitalálni, mi jön ezután.
2) Generatív MI – tartalom létrehozása
Új szöveget, képet, zenét vagy akár videót hoz létre a meglévő minták alapján.
Példák:
- Szövegírás (pl. ChatGPT)
- Képgenerálás (pl. DALL·E, Midjourney)
- Zenealkotás
- Videóanimációk készítése
Kulcsszó: Kreativitás. A generatív MI úgy működik, mint egy nagyon szorgalmas művész: rengeteget tanul, majd a saját stílusában új dolgokat alkot.
3) Osztályozó és felismerő MI – mintaazonosítás
Felismeri és osztályozza a különböző kapott példákat, amelyek lehetnek képek, hangok, mozgások stb.
Példák:
- Arcfelismerés (pl. biztonságtechnika)
- Hangfelismerés (pl. okos asszisztensek)
- Orvosi képelemzés (pl. röntgenfelvételek)
- Önvezető járművek (tárgyak, sávok felismerése)
Kulcsszó: Mintázat. Ez a típus nem értelmezi a látottakat, csak felismeri, de azt nagyon gyorsan és nagyon pontosan. Megmondja, hogy mit lát, de nem feltétlenül tudja vagy érti meg azt, hogy ez mit jelent.
A gépi tanulás
A gépi tanulás a mesterséges intelligencia egyik legfontosabb területe, amelynek lényege, hogy számítógépes rendszerek adatokból, példákból képesek mintázatokat megtanulni felismerni és általánosítani általuk. Nem előre beprogramozott szabályokat követnek, hanem tapasztalatból, adathalmazok feldolgozása során tanulják meg, hogyan oldjanak meg feladatokat. Ez teszi lehetővé például azt, hogy egy alkalmazás felismerje az arcokat, ajánljon filmeket, vagy éppen fordítson szövegeket.
A gépi tanulás tehát a MI „motorja”: míg a mesterséges intelligencia tágabb fogalom, amely az emberihez hasonló intelligens viselkedést célozza, a gépi tanulás adja azt a módszertani keretet, amellyel a gépek ténylegesen képesek alkalmazkodni és fejlődni.
Három, egymástól jól elkülöníthető tanulási módot különböztetünk meg:
- Felügyelt tanulás: itt az algoritmust előre címkézett példákkal tanítjuk. Például ha képeket mutatunk neki, ahol meg van jelölve, melyik a macska és melyik a kutya, akkor a rendszer idővel képes lesz magától felismerni, hogy egy új képen mi látható: kutya vagy macska.
- Felügyelet nélküli tanulás: ebben az esetben nincsenek előre megadott címkék. Az algoritmusnak magának kell észrevennie a mintázatokat, csoportokat alkotni, hasonlóságokat keresni az adatok között. Jellemző például ügyfélcsoportok azonosítása során.
- Megerősítéses tanulás: itt a gép kísérletezik, és visszajelzést kap arról, hogy a döntései mennyire voltak helyesek mások szerint. Olyan, mintha egy játékkal tanulna játszani, mikor minden helyes lépésért jutalmat kap, a hibás lépésekért pedig büntetést. Így idővel egyre jobb stratégiát dolgoz ki.
Nagy nyelvi modellek (Large Language Modells – LLM)
A nagy nyelvi modellek olyan mesterséges intelligencia rendszerek, amelyek hatalmas szövegkorpuszokon tanulva képesek nyelvi mintázatok felismerésére és új szöveg előállítására. Ilyen modellek például a GPT (OpenAI), a BERT (Google) vagy a Claude (Anthropic).
Felhasználásuk rendkívül széleskörű: alkalmazhatók szövegírásra, fordításra, kérdés-válasz rendszerekben, ügyfélszolgálati chatbotokban, kutatási segédletekben, programozási támogatásban stb.
Hogyan tanulnak a nyelvi modellek?
Az LLM-ek gépi tanulás (machine learning) és különösen a mélytanulás (deep learning) módszereire épülnek. A tanulási folyamat során hatalmas mennyiségű szöveges adatot kapnak (pl. könyvek, cikkek, weboldalak). A modellek a szavak és kifejezések közötti statisztikai összefüggéseket tanulják meg: milyen szó követ nagy valószínűséggel egy másikat egy adott kontextusban. Ez nem „megértést” jelent emberi értelemben, hanem mintafelismerést és valószínűségszámítást.
A tanítás gyakran két fázisban történik: Először az előtréning, amelynek célja az általános nyelvi minták megtanulása, majd a finomhangolás, vagyis a speciális feladatokra, témákra való alkalmazkodás (pl. orvosi szövegek megismerése, ügyfélszolgálati beszédpanelek áttekintése).
Az LLM-ekben rejlő lehetőségek és az esetleges korlátok
Lehetőségek:
- Nagy mennyiségű információ feldolgozására és összegzésére képesek.
- Kiválóan alkalmazhatók gyors szövegalkotásra, ötletgenerálásra és fordításra.
- Jól működnek strukturált feladatokban (pl. kódgenerálás, dokumentumokból vázlat készítése).
- Rugalmasan beilleszthetők különböző alkalmazásokba.
Korlátok:
- Nem rendelkeznek valódi tudással vagy megértéssel, hanem valószínűségi alapon működnek.
- Előfordulhat, hogy hibás, pontatlan vagy elavult információt adnak.
- Érzékenyek az adatminőségre: ha a tréningadatokban torzítás van, a modell is torz eredményt produkálhat.
- Nagy számítási és energiaigényük miatt a fenntarthatósági kérdések is felmerülnek.
A „hallucináció” jelensége
Az LLM-ek egyik gyakori problémája az úgynevezett hallucináció: a modell meggyőzően hangzó, de tényszerűen hibás vagy kitalált információt állít elő. Ez azért történik, mert a modell nem „ismeri” a valóságot, hanem nyelvi mintázatokat követve dolgozik tehát könnyen „kitalál” egy idézetet, forrást vagy tényt, amely valójában nem létezik.
Miért kell mindig ellenőrizni a MI által adott tartalmat/választ?
Az LLM-ek által generált szövegek gyakran jól megfogalmazottak, így könnyen hitelesnek tűnhetnek. Ugyanakkor olyan alapvető hibák lehetnek bennük, amelyet ember, vagy az adott nyelvet beszélő nem követne el. Jó példa arra, amikor a MI egy sokadik, immár rektorhelyettesi engedélyhez kötött vizsgaalkalom kérvényébe beleírja a következőket: „A tárgy sikeres teljesítéséhez különórákat és álló órát is venni fogok.”
Sok esetben a MI-k olyan következtetéseket vonnak le, amelyek jól hangzanak, de logikailag nem állják meg a helyüket, a tények ismeretében. Kutatásban, oktatásban vagy szakmai munkában ezért különösen fontos a kritikus gondolkodás és a forrásellenőrzés. A MI által generált tartalom nem forrás! A felhasználónak mindig érdemes megbízható szakirodalommal, hivatalos adatokkal összevetni a MI által generált tartalmat.