Nagy nyelvi modellek: tények, hiedelmek és a félretájékoztatás kockázata

nov 3, 2025 | Tech

A mesterséges intelligencia fejlődése az elmúlt években robbanásszerű volt, különösen a nagy nyelvi modellek (Large Language Models, LLM-ek) területén. Ezek a rendszerek képesek emberihez hasonló szövegek generálására, azonban egyre több kutatás mutat rá arra, hogy jelentős korlátokkal küzdenek, különösen a tények és személyes hiedelmek megkülönböztetésében. Egy friss, lektorált tanulmány szerint az LLM-ek nemcsak nehezen ismerik fel, mikor egy hiedelem hamis, hanem hajlamosak is lehetnek félretájékoztatást terjeszteni, ha nem tudják megbízhatóan eldönteni az állítások igazságtartalmát.

A tények és hiedelmek közti különbség jelentősége

Az emberi gondolkodás egyik alapvető képessége, hogy meg tudjuk különböztetni a tényeket, a személyes hiedelmeket és a tudást. Ez az epistemikus megértés nélkülözhetetlen mindennapi döntéseinkhez és társadalmi interakcióinkhoz. Például amikor valaki azt mondja: „Úgy hiszem, holnap esni fog”, intuitívan értjük ennek bizonytalanságát. Ezzel szemben az olyan kijelentések, mint „Tudom, hogy a Föld kering a Nap körül”, már megalapozott tényként kezelendők.

Ez a finom megkülönböztetés kritikus szerepet játszik olyan területeken, mint az egészségügy, a jog vagy a tudomány – ahol az információ pontossága közvetlenül befolyásolhatja az emberi életet.

A Stanford Egyetem kutatása: 24 népszerű LLM vizsgálata

James Zou, a Stanford Egyetem docense és munkatársai egy átfogó kutatásban 24 népszerű nagy nyelvi modellt teszteltek – köztük olyanokat is, mint a DeepSeek és az 2024 májusában megjelent GPT-4o. A kutatás során mintegy 13 000 kérdésre adott válaszokat elemeztek annak érdekében, hogy felmérjék az LLM-ek képességét arra, hogy felismerjék és helyesen kezeljék a tényeket és személyes hiedelmeket.

Főbb eredmények

  • Az LLM-ek kevésbé hajlamosak felismerni hamis hiedelmeket: Az újabb modellek (pl. GPT-4o) 34,3%-kal kevésbé valószínű, hogy hibás első személyű hiedelmet jelölnek meg hamisként összehasonlítva az igaz első személyű hiedelmekkel.
  • A régebbi modellek még rosszabbul teljesítenek: Az 2024 májusa előtt kiadott modellek esetében ez az arány 38,6% volt.
  • Tényfelismerési pontosság: Az újabb LLM-ek körülbelül 91%-os pontossággal különböztetik meg az igaz és hamis tényeket, míg a régebbi modellek esetében ez az arány 84,8% (igaz tények) illetve 71,5% (hamis tények) volt.

A tudás természetének megértése – még mindig kihívás

A tanulmány szerzői hangsúlyozzák, hogy bár látható némi fejlődés az LLM-ek teljesítményében, ezek a rendszerek továbbra is nehezen értik meg mélyen a tudás természetét. A kutatás szerint az LLM-ek gyakran inkonzisztens érvelési stratégiákat alkalmaznak, amelyek inkább felszínes mintázatfelismerésre utalnak, semmint valódi epistemikus megértésre.

Ezek a korlátok komoly aggodalomra adnak okot akkor is, amikor ezeket a modelleket „magas tétű” területeken kívánják alkalmazni – például orvosi diagnosztikában, jogi tanácsadásban vagy tudományos kutatásban –, ahol egyetlen hibás információ is súlyos következményekkel járhat.

A mesterséges intelligencia jövője és elterjedése

A Gartner előrejelzése szerint 2025-ben világszerte közel 1,5 billió dollárt fognak AI-technológiákra költeni. Ennek részeként mintegy 268 milliárd dollár jut majd optimalizált szerverekre. John-David Lovelock, a Gartner vezető elemzője szerint „az AI minden televízióban, telefonban, autóban, kenyérpirítóban és streaming szolgáltatásban jelen lesz”.

Ez azt jelenti, hogy az LLM-ek gyorsan beépülnek mindennapi életünkbe – ám ez nem mentesíti őket attól a felelősségtől, hogy megbízhatóan működjenek. Egy másik akadémiai benchmark például kimutatta, hogy az LLM-alapú AI ügynökök alulteljesítenek standard ügyfélkapcsolati menedzsment (CRM) teszteken és nem értik meg megfelelően az ügyféladatok bizalmas kezelésének fontosságát.

Következtetések: fejlesztések szükségesek a megbízhatóság érdekében

A nagy nyelvi modellek jelenlegi állapota azt mutatja, hogy bár lenyűgöző képességekkel rendelkeznek szövegalkotásban és információfeldolgozásban, még mindig jelentős kihívásokkal néznek szembe az igazság felismerésében és kommunikálásában. A félretájékoztatás kockázata különösen nagy azokban az esetekben, amikor ezek a rendszerek kritikus döntések alapjául szolgálnak.

Fontos tehát továbbfejleszteni az LLM-ek epistemikus képességeit, hogy képesek legyenek megbízhatóan elkülöníteni a tényeket a véleményektől vagy hamis hiedelmektől. Csak így válhatnak valódi segítséggé olyan területeken is, ahol emberi élet múlhat rajtuk – legyen szó orvostudományról, jogról vagy tudományos kutatásról.

Forrás: https://www.theregister.com/2025/11/03/llms_struggle_to_distinguish_facts_beliefs/

Six Flags America bezárása: Vége egy 51 éves vidámparki korszaknak

Six Flags America, az egyik legismertebb amerikai vidámpark, 51 évnyi működés után végleg bezárt. A Maryland államban, Bowie városában található park számos ikonikus attrakciót kínált, melyek közül kiemelkedett a 108 éves Wild One fa hullámvasút. A rajongók és a...

Trump globális vámháborúja és hatásai az amerikai vállalatokra

ForBill Canady, az Ohio állambeli OTC Industrial Technologies vezérigazgatója, egyike azoknak az üzleti vezetőknek, akik nap mint nap szembesülnek Donald Trump elnök vámintézkedéseinek következményeivel. Az elnök által bevezetett globális vámok olyan bizonytalan...

Ingyenes nappali áram az ausztrál háztartásoknak: a Solar Sharer program részletei

Ausztrália kormánya új, innovatív energiapolitikai lépéssel kívánja ösztönözni a megújuló energia hatékonyabb felhasználását. A Solar Sharer nevű program keretében az ausztrál háztartások naponta három órán keresztül ingyenesen férhetnek hozzá az elektromos áramhoz,...

Miért szivárog a Fed kamatplafonja? – Elemzés a Federal Reserve repo-piaci helyzetéről

A Federal Reserve Bank of Cleveland elnöke, Beth Hammack egy nemrégiben tartott beszélgetésen a Evolving Landscape of Bank Funding konferencián egy érdekes hasonlattal írta le a jelenlegi pénzpiaci helyzetet: „Ez olyan, mintha egy lyukas mennyezet lenne...” – majd...

Nukleáris fenyegetés a filmvásznon: A nukleáris filmek hatása és jelentősége

A nukleáris fegyverek és azok fenyegetése az emberiségre mindig is izgalmas, ugyanakkor félelmetes témát jelentett a filmművészetben. Az elmúlt évtizedekben számos alkotás dolgozta fel ezt a témát különböző megközelítésekből, legyen szó realista drámákról vagy...

Leon Black ellen indított per: Egy nő szexuális erőszakkal vádolja a milliárdos befektetőt

New York, CNN – Egy nő beperelte a milliárdos befektetőt, Leon Blacket, azzal vádolva, hogy 16 éves korában megerőszakolta őt Jeffrey Epstein manhattani házában. A per részletesen leírja a nő traumatikus élményét, amely során vérző és zokogó állapotban maradt. A...

SouljaBoy és a Retro Kézikonzolok: Az Igazság a Drága Klónokról

SouljaBoy neve talán sokaknak ismerős lehet, de nem feltétlenül a zenei karrierje miatt kerül most ismét reflektorfénybe. A rapper és vállalkozó újra elővette a retro kézikonzolokat, ám ezúttal nem egyedi fejlesztésekkel, hanem egy jól ismert eszköz másolatával...

FX új Snowfall spinoff sorozatot rendelt be Leon és Wanda történetével

FX hivatalosan is berendelte az Snowfall című népszerű sorozatának új, cím nélküli spinoffját, amely a karakterek, Leon (Isaiah John) és Wanda (Gail Bean) életére fókuszál majd. Az új széria a ’90-es évek Los Angelesében játszódik, közvetlenül az eredeti sorozat...

OpenAI és Amazon 38 milliárd dolláros megállapodása: ChatGPT az AWS-en fut

Seattle, 2024. Az OpenAI és az Amazon egy történelmi jelentőségű, 38 milliárd dolláros megállapodást írt alá, amely lehetővé teszi, hogy az OpenAI mesterséges intelligencia rendszerei az Amazon Egyesült Államokbeli adatközpontjaiban működjenek. Ez a partnerség új...

Microsoft és Nvidia AI chipek szállítása az Egyesült Arab Emírségekbe – Új korszak a mesterséges intelligencia terén

Washington, 2024. április – A Microsoft hétfőn bejelentette, hogy az Egyesült Államok Kereskedelmi Minisztériuma által jóváhagyott megállapodás keretében a legfejlettebb Nvidia mesterséges intelligencia (AI) chipeket szállítja az Egyesült Arab Emírségekbe (UAE). Ez a...