Új korszak az AI memóriakezelésében: vizuális tokenek és többrétegű tömörítés a DeepSeek módszerével

okt 29, 2025 | Tech

Az utóbbi években a mesterséges intelligencia (AI) nyelvi modelljei hatalmas fejlődésen mentek keresztül, azonban egy alapvető kihívás továbbra is fennáll: hogyan kezeljék hatékonyan a hosszú beszélgetések során felhalmozódó információkat. A jelenlegi nagy nyelvi modellek (Large Language Models, LLM-ek) szövegeket apró egységekre, úgynevezett tokenekre bontanak, amelyek segítségével értelmezik és feldolgozzák a beérkező adatokat. Ez a megközelítés azonban egyre költségesebbé válik, ahogy a felhasználókkal folytatott párbeszédek egyre hosszabbá válnak.

A tokenek korlátai és a „kontextusromlás” problémája

A tokenek tárolása és számítása jelentős erőforrásokat igényel, különösen akkor, ha egy AI rendszer hosszú ideig tartó interakciókat folytat. Ez a helyzet gyakran vezet ahhoz, hogy az AI „elfelejti” vagy összekeveri a korábban kapott információkat – ezt a jelenséget szakmai körökben „context rot”, azaz kontextusromlás néven emlegetik.

Ez a probléma komoly akadályt jelent az olyan alkalmazások számára, ahol fontos a folyamatos és pontos információkezelés, például ügyfélszolgálati chatbotok vagy személyes asszisztensek esetében.

A DeepSeek új megközelítése: vizuális tokenek alkalmazása

A DeepSeek kutatócsoportja legújabb tanulmányában egy innovatív megoldást mutat be erre a problémára. Ahelyett, hogy kizárólag szöveges tokeneket használnának, rendszerük az írott információkat képi formába csomagolja – mintha egy könyv oldalairól készítene fényképet. Ez az eljárás lehetővé teszi, hogy lényegében ugyanannyi információt őrizzenek meg, miközben jóval kevesebb tokenre van szükség.

Ez az újítás nem csupán egy technikai trükk: az OCR (optikai karakterfelismerő) modell szolgál kísérleti terepként ezeknek az eljárásoknak, amelyek révén hatékonyabban lehet több adatot belezsúfolni az AI rendszerekbe.

Többrétegű tömörítés – az emberi memória mintájára

A DeepSeek modellje nem csak vizuális tokeneket használ, hanem egyfajta hierarchikus tömörítési elvet is alkalmaz, amely hasonlít arra, ahogyan az emberi emlékezet működik. A kevésbé fontos vagy régebbi tartalmakat kissé homályosabb formában tárolja, így helyet takarít meg anélkül, hogy teljesen elveszítené azokat.

Bár ez a tömörített tartalom kevésbé részletes, mégis elérhető marad háttérben, miközben fenntartja a rendszer magas hatékonyságát. Ezáltal az AI képes hosszabb távon is megőrizni releváns információkat anélkül, hogy túlterhelné magát.

A vizuális tokenek előnyei és szakmai visszhang

Hosszú ideje a szöveges tokenek voltak az AI rendszerek alapvető építőkövei. A vizuális tokenek alkalmazása viszont újszerű megközelítésnek számít, amely gyorsan felkelti a kutatók érdeklődését.

Andrej Karpathy, a Tesla korábbi AI vezetője és az OpenAI egyik alapító tagja is méltatta a DeepSeek tanulmányát. Egy X-en (korábbi Twitter) közzétett bejegyzésében azt írta, hogy a képek akár jobb bemenetként szolgálhatnak majd a nagy nyelvi modellek számára, mint maga a szöveg. Szerinte a szöveges tokenek „feleslegesek és rosszak bemenetként”.

Manling Li, a Northwestern Egyetem számítástechnikai adjunktusa szerint ez a tanulmány új keretrendszert kínál az AI memória kihívásainak kezelésére. Bár az ötlet nem teljesen új – hiszen korábban is felmerült már kép alapú tokenek használata –, ez az első olyan kutatás, amely ilyen mélységben vizsgálja és bizonyítja ennek működőképességét.

Összegzés: Az AI jövője hatékonyabb memóriakezeléssel

A DeepSeek által bemutatott módszer forradalmi lépést jelenthet abban, hogyan kezelik majd az AI rendszerek a hosszú távú kontextust és memóriát. A vizuális tokenek alkalmazása és a többrétegű tömörítés ötvözése lehetővé teszi, hogy kevesebb erőforrással több információt őrizzenek meg – így csökkentve a „kontextusromlás” problémáját.

Ez nemcsak technológiai áttörés lehet, hanem alapjaiban változtathatja meg azt is, hogyan kommunikálunk majd mesterséges intelligenciákkal hosszabb távon. Az innovációk nyomán várhatóan még megbízhatóbb és intelligensebb AI asszisztensek születnek majd, amelyek jobban megértik és emlékeznek ránk.

  • Tokenek: apró egységek, amelyekre bontják a szöveget az AI modellekben.
  • Kontekstusromlás: amikor az AI elfelejti vagy összekeveri korábbi információkat hosszú beszélgetések során.
  • Vizuális tokenek: képi formába csomagolt információk, amelyek kevesebb erőforrást igényelnek.
  • Többrétegű tömörítés: régebbi vagy kevésbé fontos adatok homályosabb tárolása helytakarékosság céljából.
  • OCR modell: optikai karakterfelismerő technológia tesztelési platformként szolgál ezekhez az újításokhoz.

Forrás: https://www.technologyreview.com/2025/10/29/1126932/deepseek-ocr-visual-compression/?utm_medium=tr_social&utm_source=reddit&utm_campaign=site_visitor.unpaid.engagement

1X NEO: Az Otthoni Segítő Humanoid Robot Előrendelhető

1X, a kaliforniai mesterséges intelligencia és robotika vállalat, most megnyitotta a NEO humanoid robot előrendelését. Ez az innovatív gép kifejezetten arra készült, hogy automatizálja a mindennapi házimunkákat, és személyre szabott segítséget nyújtson a...

NEO: A 20 000 dolláros humanoid robot, amely elvégzi a házimunkát

NEO egy olyan humanoid társ, amelyet az otthoni élet átalakítására terveztek – mondta Dar Sleeper, a 1X termék- és dizájn alelnöke. Ez a mesterséges intelligenciával és fejlett hardverrel felszerelt robot képes segíteni a mindennapi házimunkákban, így intelligenciát...

Az amerikai jegybank újabb kamatcsökkentése és annak gazdasági hatásai

Az Egyesült Államok Szövetségi Tartalékbankja (Federal Reserve, Fed) 2019. október 30-án ismét csökkentette irányadó kamatlábát, immár második alkalommal egymást követő ülésén. A döntés értelmében a kamat 0,25 százalékponttal mérséklődött, így a sáv 3,75% és 4,00%...

CBS News jelentős leépítései a Paramount-Skydance egyesülés után

A CBS News munkatársai hónapok óta feszülten várták a bejelentett leépítéseket, amelyek a Paramount és Skydance Media sikeres egyesülését követő 2 milliárd dolláros költségcsökkentési terv részeként valósulnak meg. A várakozásoknak megfelelően a leépítések szerdán...

Caterpillar: A vámok hatása és a hosszú távú stratégiai tervek

A Caterpillar Inc., a világ egyik vezető bányászati és építőipari gépgyártó vállalata, idén jelentősebb vámhatásokra számít, mint azt korábban előre jelezte. A cég legfrissebb pénzügyi jelentéseiben részletezte, hogy a vámok teljes éves nettó hatása várhatóan 1,6 és...

1X NEO: Az Otthoni Segítő Humanoid Robot Előrendelhető

1X, a kaliforniai mesterséges intelligencia és robotika vállalat, most megnyitotta a NEO humanoid robot előrendelését. Ez az innovatív gép kifejezetten arra készült, hogy automatizálja a mindennapi házimunkákat, és személyre szabott segítséget nyújtson a...

A Tdap oltás és a szamárköhögés kitörése Louisiana államban: miért fontos a gyors reagálás?

A Tdap vakcina hatékony védelmet nyújt a szamárköhögés (pertussis) ellen, amely különösen veszélyes a csecsemőkre nézve. Mivel az újszülöttek első pertussis elleni oltását csak 2 hónapos koruk után kaphatják meg, az Amerikai Betegségmegelőzési és Járványügyi Központ...

Luigi Mangione zenei ízlése és börtönélete a UnitedHealthcare CEO-gyilkosság ügyében

Luigi Mangione, akit azzal vádolnak, hogy 2024 decemberében megölte a UnitedHealthcare vezérigazgatóját, Brian Thompsont, nem csupán jogi csatározásairól ismert. Egy frissen nyilvánosságra került levélből kiderül, hogy a 27 éves férfi a börtönben töltött idő alatt új...

William Daniels, a Boy Meets World sztárja bírálja Donald Trumpot a Fehér Ház felújítása miatt

William Daniels, a ’90-es évek kedvelt sorozatának, a Boy Meets World-nek legendás Mr. Feeny tanára, nemrégiben nyíltan kritizálta az Egyesült Államok elnökét, Donald Trumpot a Fehér Házban zajló nagyszabású felújítási munkálatok miatt. A 98 éves színész és színházi...

Apple rekordösszegű lobbiköltése az EU-ban 2025-ben – részletes elemzés

Apple 2025-ben több pénzt fordított az Európai Unió tisztviselőinek befolyásolására, mint valaha korábban – derül ki a Corporate Europe Observatory legfrissebb adataiból. Az amerikai technológiai óriás évente mintegy 7 millió eurót (8,2 millió dollárt) költ arra, hogy...

Maria Riva: Marlene Dietrich lánya és televíziós úttörő 100 éves korában elhunyt

Maria Riva, a legendás színésznő, Marlene Dietrich egyetlen gyermeke, aki ritka szerződéses játékosként a CBS televízió egyik meghatározó személyisége volt a médium élő, kineszkóp adásainak korai időszakában, 100 éves korában elhunyt. Élete utolsó napjai és halála...

NEO: A 20 000 dolláros humanoid robot, amely elvégzi a házimunkát

NEO egy olyan humanoid társ, amelyet az otthoni élet átalakítására terveztek – mondta Dar Sleeper, a 1X termék- és dizájn alelnöke. Ez a mesterséges intelligenciával és fejlett hardverrel felszerelt robot képes segíteni a mindennapi házimunkákban, így intelligenciát...