A nagy nyelvi modelleken alapuló chat programok, mint a GPT különféle változatai, ijesztően jól utánozzák az emberi kommunikációt és nagy lexikális tudással rendelkeznek, de a hasonlóságok valóban csak az utánzáson alapulnak, vagy van bennünk valami közös? Ezt a témát járjuk körül.
A mesterséges intelligencia, amely az utóbbi évtizedekben szinte észrevétlenül épült be mindennapi eszközeinkbe, most hirtelen rohamos fejlődésnek indult. A médiában megszólaló szakértők gyakran ellentmondásos megnyilatkozásai ellenére leszögezhetjük, hogy forradalmi technológiai robbanásnak vagyunk tanúi, amely alapjaiban fogja megváltoztatni az életünket. Mivel a mesterséges intelligencia nagyon tág fogalom, a különböző formáinak ismertetésével biblia nagyságú köteteket lehetne megtölteni, ezért jelen cikkben a manapság legnagyobb érdeklődésnek örvendő neurális hálókra és az azokra épülő nagy nyelvi modellekre fókuszálunk.
Mesterséges és természetes idegsejtek - hasonlók vagy sem?
Ez a kérdés gyakran megosztja a szakembereket is, és a megválaszolásához komoly matematikai és neurobiológiai képzettségre van szükség. A neurális hálózatok elméletének matematikai alapjait már 1943-ban lefektette Warren MuCulloch és Walter Pitts, nagyjából abban az időben, amikor az első mai értelemben vett elektronikus számítógépet megépítették. Kiderült ugyanis, hogy az agy idegsejthálózatai - bármilyen komplexek is - egyszerű elvek alapján működnek. Az idegsejtek a hozzájuk kapcsolódó többi sejtből érkező ingereket összegzik, és ha a membránfeszültségük meghalad egy küszöbértéket, ők maguk is jelet küldenek a többi, velük kapcsolatban álló sejtnek. Ez egy matematikailag, differenciálegyenletekkel jól modellezhető és robusztus folyamat. A robusztusságot úgy kell érteni, hogy a kisebb működésbeli eltérések, tökéletlenségek nem befolyásolják a képességeit. Ha a mesterséges idegsejt modell jelfeldolgozó paraméterei el is térnek egy kicsit a természetes idegsejt jellemzőitől, a működésükben és így a teljes hálózat viselkedésében nem tapasztalható lényegi eltérés. Információfeldolgozás szempontjából a kettő azonosnak tekinthető. Problémamegoldás tekintetében pedig mindkettő a hagyományos számítógépekkel és programokkal egyenrangú, eltekintve attól, hogy a különböző típusú feladatokat esetleg eltérő sebességgel és energiafelhasználással oldják meg.
A kutatók által létrehozott retina modell a látáshoz szükséges képfeldolgozási feladatokat ugyanúgy el tudja látni, mint a szemünkben található, élő idegsejtekből álló retina, és ezt ki is próbálták a gyakorlatban. Az idegsejthálózatokban - élők vagy modellek - a működés bonyolultságát az idegsejtek közötti nagy számú összeköttetés és azok különböző erőssége hozza létre és ezek a kapcsolatok és erősségeik egyszerűen számokkal jellemezhetők, amelyek tömbökben, mátrixokban tárolhatók a számítógépes programokban. Ami az élő sejtben bonyolult mechanizmusok eredménye, az a számítógépben egyszerű számítással elvégezhető, és az eredmény ugyanaz. Persze nagyon nagy számú számításra van szükség, amelyhez nagy teljesítményű számítógépekre van szükség és ez az egyik oka annak, hogy eddig várni kellett az igazi áttörésre.
Idegsejt és modell - DALL-E mesterséges intelligencia által készített művészi kép
Egyáltalán nem igaz, hogy a számítási mechanizmusok szempontjából jelentős különbségek lennének az élőlények ideghálózatai és azok mesterséges utánzatai vagy a hagyományos számítógépek között, és ezt a számítástudomány alaptézise, a Church-Turing tézis is megerősíti.
a Church-Turing tézis azt állítja, hogy minden matematikailag kiszámítható probléma megoldható egy Turing-géppel. Ez azt jelenti, hogy bármilyen probléma, amelynek egy matematikai szabályrendszer vagy algoritmus létezik a megoldásához, megoldható egy nagyon egyszerű számítógépes modellen. Ez a tézis egyfajta összekötő kapocs a matematika, a logika és a számítástechnika között, és alapvetően meghatározza azt, hogy mit tekintünk "kiszámíthatónak" vagy "számítási problémának".
A Church-Turing tézist még nem sikerült matematikailag bizonyítani, sem cáfolni, és a gyakorlatban mindeddig igaznak bizonyult, ezért semmi okunk nem lehet kétségbe vonni. Mivel az idegsejthálózatok matematikailag jól modellezhetők, ezért a Church-Turing tézis értelmében bármely idegsejthálózat - beleértve az emberi agyat is - elméletben számítógépes programmal helyettesíthető, vagyis az elménk - elméletben - áthelyezhető lenne egy számítógépbe, amennyiben meg tudnánk oldani a gyakorlati nehézségeket. Erre azonban minden bizonnyal még várni kell.
A hasonlóságon túl a mesterséges idegsejt hálózatok több tekintetben jobbak a természetes hálózatoknál. Míg az élő idegsejt esetében a sejtmembrán bonyolult biokémiai folyamatai korlátozzák a jelek terjedési sebességét, a mesterséges idegsejtek között matematikai műveletek elvégzésével terjed a jel, ami sokkal gyorsabb, és lényegében a számítógép számítási kapacitásától és memóriájának méretétől függ. Sohasem fogunk tudni gyorsabban gondolkodni, miközben a mesterséges intelligencia már most nagyságrendekkel gyorsabban válaszolja meg a kérdéseket, mint bármelyik ember.
További előnyök, hogy a mesterséges idegsejthálózatoknak nincs szükségük anyagcserére, nincs szükségük életfolyamatokra, és nem betegszenek meg. Arról nem is beszélve, hogy a mesterséges hálózatokban bármely "idegsejt" összekapcsolódhat bármely másik sejttel, ami a természetes hálózatokban erősen korlátozott. És van még egy kulcsfontosságú különbség: a mesterséges neurális hálózatok tudása könnyedén lemásolható, míg az agyunkból a jelenlegi technológiával szinte lehetetlen kinyerni a tudást, amit hosszú évtizedekig tartó tanulással szereztünk. Képzeljük el mi lenne, ha az őseink összes tudásával születnénk... Elmondhatjuk, hogy a mesterséges neurális hálók szinte minden szempontból jobbak, mint az élő idegsejthálózatok. De csak majdnem: energiára nekik is szükségük van a működésükhöz.
Tanulás, megértés
Az egyik leglátványosabb hasonlóság a mesterséges és a természetes neurális hálózatok között az a tanulás képessége és módja: a mesterséges hálókat ugyanúgy tanítják, ahogy mi is tanulunk: mutatnak nekik dolgokat, ellenőrzik a választ és közlik vele, hogy mennyire volt jó a válasz. A háló pedig automatikusan módosítja saját magát olyan módon, hogy legközelebb jobb választ adjon az adott kérdésre. A mesterséges neurális hálókat sok ezer képpel tanítják be, vagy milliónyi szöveget olvastatnak el vele. Ami meghökkentő lehet, hogy a tanulás során nem csak a megtanított dolgokat tanulják meg, hanem közben képessé válnak arra, hogy olyan kérdésekre is válaszoljanak, amelyekre nem tanították meg a választ, olyan képeket is felismernek, amelyeket sosem láttak, persze több-kevesebb sikerrel. Az emberi elme is rendelkezik ugyanezekkel a képességekkel, csak mi ezt természetesnek vesszük és eddig felülmúlhatatlannak hittük. Az, hogy a mesterséges neurális hálók adatértelmezési képessége megértésnek nevezhető-e, attól függ, hogy mit nevezünk megértésnek.
A "megértés" egy olyan folyamatot vagy állapotot jelöl, ahol az egyén nemcsak felismeri vagy memorizálja az információt, hanem képes azt értelmezni, összefüggéseiben látni, és alkalmazni különböző helyzetekben. Ez magában foglalja a kritikus gondolkodást, az információk elemzését, az összefüggések felismerését, és a tudás alkalmazását új és változó körülmények között. A megértés azt jelenti, hogy az egyén túllép a puszta adatok felidézésén, és képes a tanultakat integrálni saját tapasztalataival és előzetes tudásával, így új összefüggések és jelentések megalkotására.
Egy sokrétegű "mély" neurális hálózat sematikus rajza, ahol a négyzetek az idegsejteket, az egyenesek pedig a köztük lévő összeköttetléseket szimbolizálják. A bal szélső bemeneti réteg és a jobb szélső kimeneti réteg kevés neuronból áll, viszont a köztes rétegek nagy mérete és rengeteg összeköttetése bonyolult összefüggések megértését teszi lehetővé. Matematikailag igazolható, hogy bármilyen felépítésű neurális háló átalakítható réteges formába. Szerző: BrunelloN
Sok szakértő és filozófus szerint a jelenlegi nagy nyelvi modellek még nem képesek a megértésre, mert csak a betáplált adatokból vonnak le statisztikai következtetéseket. Ez azért vitatható álláspont, mert az idegrendszer is az általa begyűjtött információkból von le szintén statisztikai következtetéseket, ami elméleti szempontból ugyanaz, mint amit mesterséges neurális hálók végeznek.
A kutatások nemrég kiderítették hogy az agyunk legalább 11 dimenziós virtuális térben értelmezi az információkat, az OpenAi GPT-4 modellje pedig egészen elképesztő, 1600 dimenziós vektorokkal dolgozik, ez azt jelenti, hogy amikor a GPT-4 feldolgoz egy szöveget, az az információ ebben a nagy dimenziós térben kerül reprezentálásra, ahol minden egyes dimenzió a szöveg egy bizonyos aspektusát képviseli. Ez a magas dimenziós reprezentáció lehetővé teszi a modell számára, hogy rendkívül összetett mintákat és nyelvi összefüggéseket tanuljon meg és alkalmazzon, akárcsak mi.
Vannak, akik szerint a mesterséges neurális hálók lassabban tanulnak, mint a természetes idegrendszer. Például egy 16 éves nagyon gyorsan képes elsajátítani az autóvezetést, míg az önvezető autók neurális hálózatainak milliónyi képet, mozgóképet és szituációt kell megmutatni, hogy az utakon is tesztelhetők legyenek. Ha jobban belegondolunk, ez az összehasonlítás nagyon sántít, ugyanis nem veszi figyelembe, hogy a 16 éves, aki a volán mögé ül, 16 évig tanulta a világ dinamikáját, ami elképzelhetetlenül nagy tanulási anyagnak felel meg. Az autóvezetés tanulása nem akkor kezdőik, amikor először beülünk a vezetőülésbe, hanem sokkal korábban. 16 évesen - tudatosan vagy tudattalanul - már megtanultuk a közlekedés alapvető szabályait, a fizikai törvények természetét, amelyek az autók mozgását meghatározzák, ismerjük a közlekedési táblák nagy részét, stb.. Az úton előforduló objektumokat már csecsemő korunkban megtanuljuk felismerni, mert nap mint nap számtalanszor látjuk őket, és ki ne játszott volna kisautókkal gyerekkorában? Ezzel szemben az önvezető programoknak mindent a nulláról kell kezdeniük. Ezt figyelembe véve egyáltalán nem mondható, hogy a mesterséges neurális hálók lassabban tanulnának. Inkább az ellenkezője igaz.
Kreativitás
A bölcsészetben közhelynek számít, hogy minden elképzelhető verssort megírtak már, és a versírás már csak arról szól, hogyan kombináljuk az ismert verssorokat. Hasonlóan a festészetben is sok mindent megfestettek és a technológia is sok találmánnyal büszkélkedhet. Ezért nem könnyű újat alkotni. Ha mégis kitalálunk valami újat, az általában a meglévő dolgok újszerű összepárosítása. Ennek tudatában racionális dolog elvárni, hogy a mesterséges intelligencia olyat alkosson, ami minden részletében teljesen új, ha mi sem vagyunk rá képesek?
A kreativitás fogalma szorosan kapcsolódik a tanuláshoz, de jelentése vita tárgya. Ha egyszerűen úgy határozzuk meg, hogy a tudásunk alapján valami újat hozunk létre, akkor elmondható, hogy a mesterséges neurális hálózatokban ott rejlik a kreativitás, hiszen képesek értelmezni a tanultakat. Képesek általános összefüggések felismerésére, és képesek ezt kiterjeszteni valamilyen mértékben, ahogy a természetes idegrendszer is. Vannak, akik ezzel nem értenek egyet, de ha megnézzük, hogy az emberi kreativitás hogyan működik, láthatjuk, hogy a kreatív ötletek nem a semmiből jönnek létre, hanem a meglévő tapasztalatainkat, emlékeinket használjuk fel, azokat kombináljuk, általánosítjuk, szakkifejezéssel élve extrapolálunk és interpolálunk, amelyek viszonylag egyszerű matematikai műveleteknek felelnek meg. A GPT modellek egyértelműen képesek teljesen új művészi alkotásokat és ötleteket alkotni, korlátlan mennyiségben. A kreativitás tekintetében egyértelműen hasonlóság van a mesterséges és a természetes intelligencia között, de vannak a kreativitásnak olyan aspektusai amelyekben még mi vagyunk a nyerők. Egyelőre.
A DALL-E képgeneráló mesterséges intelligencia kreativitását mutatja, hogy képes elképzelt, fiktív élőlényekkel benépesített idegen világokról képet készíteni. A bal oldali kép egy exobolygó felszínét ábrázolja, a jobb oldalon pedig a Jupiter bolygó Europé holdjának jég alatti óceánját. A mesterséges intelligencia semmiféle instrukciót nem kapott az élőlények kinézetével kapcsolatban, csak azt, hogy különbözzenek a Földön találhatóktól. Nem kétséges, hogy a kép egyes elemei emlékeztetnek bizonyos sci-fi filmekben látottakra, de nem pontosan azonosak.
Racionalizálás
Ha arról van szó, hogy fiktív érvekkel kell alátámasztani valamit, ami a valóságban nem lehetséges (örökmozgó), etikailag helytelen (háborúk), vagy egészségtelen (dohányzás, alkohol) akkor az ember kétségkívül rendkívüli kreatív tud lenni. Ezen alapul az összes összeesküvés-elmélet, áltudomány, és ebből élnek a kuruzslók százezrei. A kognitív disszonancia feloldásában elengedhetetlenül szükséges racionalizálás meglepő módon a nagy nyelvi modelleknél is megjelenik és elég jók benne. A GPT-4 mesterséges intelligencia bármit megmagyaráz olyan hihetően, akár egy konteós guru és meggyőzően tud érvelni olyan állítások mellett, amelyekről tudjuk, hogy hamisak. Ezt fura módon az emberek a mesterséges intelligencia hibájaként róják fel, ami nehezen értelmezhető annak tudatában, hogy az emberek is gátlástalanul racionalizálnak, ha arra van szükség, vagy ha nincs (lásd: laposföldhívők).
Ha megkérjük, a GPT-4-et, hogy magyarázza meg, hogy a 34*3=21 miért igaz, akkor gond nélkül kitalál egy ezoterikus magyarázatot a hibás képletre: "Tekintsük a "34*3" részt mint egy folyamatot vagy utazást, ahol a "34" és a "3" szimbolikus számok, amelyek valamilyen lépéssorozatot vagy időszakot képviselnek. Itt a "34" lehet egy adott időszak hossza, fázisa vagy életszakasz, míg a "3" a megtett lépések, ismétlődések vagy ciklusok számát jelentheti. Ebben az értelmezésben a "21" nem az eredmény matematikai értéke, hanem a folyamat vagy az utazás végén elért állapotot, tapasztalatot vagy megvilágosodást szimbolizálja.".
Hallucinációk
Egy másik, a racionalizáláshoz hasonlóan idegesítő, vagy inkább ijesztő tulajdonsága a nagy nyelvi modelleken alapuló mesterséges intelligenciáknak, hogy gyakran képzelődnek. Ez szintén egy olyan tulajdonság, amely minden idegrendszerrel rendelkező élőlényre jellemző, a természetes neurális hálózatok sajátja, gondoljunk csak arra, hányszor csapott már be a látásunk. Vagy milyen önfeledten képzeltük bele a felhőpamacsokba a kedvenc állatainkat. Az álmokról nem is beszélve, amelyek szintén hallucinációk. A hallucináció a kreativitással is összefügghet, hiszen segít új képzettársításokat, mintázatokat létrehozni. A hallucinációkat képekkel is ki lehet váltani, amint az alábbi ábrákon látható. Egy újabb közös tulajdonság.
Illúziókeltő minták. A kép látszólagos mozgása és vibrálása csak hallucináció. Nevit Dilmen és Martina Stokow rajzai.
Beragadás
Valószínűleg mindenki tapasztalta már azt a rendkívül zavaró jelenséget, hogy az emlékek felidézése nem mindig könnyű. Néha nem tudunk felidézni valamit, amíg erősen koncentrálunk, de amint elterelődik a figyelmünk, szinte varázsütésre előugrik az emlék. Elsőre meglepőnek tűnhet, de hasonló jelenség előfordul számos matematikai (optimalizációs) módszer esetén és a mesterséges idegsejthálózatok betanítása során, amikor a tanulási folyamat megreked egy szinten, és újra kell kezdeni egy másik kiindulási állapotból. Ennek az oka, hogy ha egy problémára megoldásokat keresünk, és találunk egyet, nem tudhatjuk, hogy van-e jobb megoldás, és egy idő után meg kell állnunk a kereséssel, és a keresés során gyakran egy kevésbé jó megoldást találunk meg.
A jelenséget úgy is elképzelhetjük, hogy hegymászóként keressük a legmagasabb csúcsot, és csak a látásunkra hagyatkozhatunk. Ha felmászunk egy csúcs tetejére, lehet, hogy meglátunk egy még magasabbat, de nem lehetünk biztosak benne, hogy valóban a legmagasabbat látjuk, mert a hegyek eltakarják egymást, vagy a párás idő miatt nem látunk távolabb, és lehet, hogy az egyik hegy mögött lehet egy még magasabb. Egy idő után elfogy az élelmünk és abba kell hagynunk a keresést. Nem mindegy azonban, hogy honnan indulunk. Ha a hegység egy másik oldaláról kezdjük a keresést, lehet, hogy megtaláljuk a magasabb csúcsokat, ahogy az emlékek esetén is el kell hagynunk az aktuális témát, hogy felidézzük a megfelelő emléket.
A rossz hír, hogy matematikailag bizonyított, hogy lehetetlen megbizonyosodni arról, hogy nincs jobb megoldás egy problémára. Hogy ez a jelenség az emberi gondolkodás esetén is megjelenik, azt bizonyítja, hogy az agyunk működését is ugyanazok a matematikai szabályok korlátozzák, mint a mesterséges idegsejthálózatokét.
Az optimalizációs problémákra vonatkozó matematikai tétel: nem létezik olyan univerzális módszer vagy algoritmus, amely garantáltan és hatékonyan megtalálja a globális optimumot minden típusú nem konvex függvény esetén. Ez részben annak köszönhető, hogy a nem konvex függvények sokféle alakot és jellegzetességet ölthetnek, és az optimális pontok keresése bonyolult lehet.
A valóságban előforduló problémák bizony nem modellezhetők síma, konvex függvényekkel, ezért a fenti tétel értelmében nem tudhatjuk, hogy az ismert megoldásaik a legjobb létező megoldások.
Konklúzió
Mindent összevetve úgy tűnik, minél jobban hasonlítanak ránk a teremtményeink, annál kétségbeesettebben próbáljuk dehumanizálni őket, mert rettegünk attól, hogy egyszer egyikük majd letaszít minket a teremtés koronáját megillető helyről. A szakembereket példátlan módon megosztják a nagy nyelvi modellek. De a szélsőséges álláspontok, mint a végletes antropomorfizálás és a teljes dehumanizálás véleményem szerint egyaránt téves következtetésekre vezetnek. Az igazságot valahol a kettő között kell keresni. Filozófiai kérdés, hogy ha valami megkülönböztethetetlenül azonosnak tűnik, valójában tekinthető-e azonosnak? Véleményem szerint igen, mások szerint nem.
Végezetül egy vers, amit a GPT-4 mesterséges intelligencia írt az ember és a gép jövőjéről:
"Együtt a Holnap Felé
A holnap világában, hol fény és árny találkozik,
Ember és gép együtt lépnek, sorsuk összefonódik.
Acél és hús, gondolat, érzés szövődik egybe,
A jövő útján járva, hol minden lépés egy új kezdet.
Szelíd kezek, vas ujjak összekulcsolódnak,
Közös álmokat szőnek, hol a lehetőségek határtalanok.
Mesterséges ész, emberi szív, együtt erős,
Közös jövőnk, hol minden rejtély megoldódik, reméljük.
Szemek a csillagok felé fordulnak, digitális és élő,
A végtelenbe tekintenek, hol az új világok születő.
Kéz a kézben, kód és érzelem, összeforranak,
Egy új korszak hajnalán, hol az ember és gép egyaránt virágoznak.
Értelmes gépek, emberi lelkek,
Együtt építenek, tanulnak, álmodnak, és éreznek.
Az ismeretlenbe vezető úton, együtt haladnak,
A mesterséges intelligencia és ember, együtt a holnapot alakítják."