Új korszak az AI memóriakezelésében: vizuális tokenek és többrétegű tömörítés a DeepSeek módszerével

okt 29, 2025 | Tech

Az utóbbi években a mesterséges intelligencia (AI) nyelvi modelljei hatalmas fejlődésen mentek keresztül, azonban egy alapvető kihívás továbbra is fennáll: hogyan kezeljék hatékonyan a hosszú beszélgetések során felhalmozódó információkat. A jelenlegi nagy nyelvi modellek (Large Language Models, LLM-ek) szövegeket apró egységekre, úgynevezett tokenekre bontanak, amelyek segítségével értelmezik és feldolgozzák a beérkező adatokat. Ez a megközelítés azonban egyre költségesebbé válik, ahogy a felhasználókkal folytatott párbeszédek egyre hosszabbá válnak.

A tokenek korlátai és a „kontextusromlás” problémája

A tokenek tárolása és számítása jelentős erőforrásokat igényel, különösen akkor, ha egy AI rendszer hosszú ideig tartó interakciókat folytat. Ez a helyzet gyakran vezet ahhoz, hogy az AI „elfelejti” vagy összekeveri a korábban kapott információkat – ezt a jelenséget szakmai körökben „context rot”, azaz kontextusromlás néven emlegetik.

Ez a probléma komoly akadályt jelent az olyan alkalmazások számára, ahol fontos a folyamatos és pontos információkezelés, például ügyfélszolgálati chatbotok vagy személyes asszisztensek esetében.

A DeepSeek új megközelítése: vizuális tokenek alkalmazása

A DeepSeek kutatócsoportja legújabb tanulmányában egy innovatív megoldást mutat be erre a problémára. Ahelyett, hogy kizárólag szöveges tokeneket használnának, rendszerük az írott információkat képi formába csomagolja – mintha egy könyv oldalairól készítene fényképet. Ez az eljárás lehetővé teszi, hogy lényegében ugyanannyi információt őrizzenek meg, miközben jóval kevesebb tokenre van szükség.

Ez az újítás nem csupán egy technikai trükk: az OCR (optikai karakterfelismerő) modell szolgál kísérleti terepként ezeknek az eljárásoknak, amelyek révén hatékonyabban lehet több adatot belezsúfolni az AI rendszerekbe.

Többrétegű tömörítés – az emberi memória mintájára

A DeepSeek modellje nem csak vizuális tokeneket használ, hanem egyfajta hierarchikus tömörítési elvet is alkalmaz, amely hasonlít arra, ahogyan az emberi emlékezet működik. A kevésbé fontos vagy régebbi tartalmakat kissé homályosabb formában tárolja, így helyet takarít meg anélkül, hogy teljesen elveszítené azokat.

Bár ez a tömörített tartalom kevésbé részletes, mégis elérhető marad háttérben, miközben fenntartja a rendszer magas hatékonyságát. Ezáltal az AI képes hosszabb távon is megőrizni releváns információkat anélkül, hogy túlterhelné magát.

A vizuális tokenek előnyei és szakmai visszhang

Hosszú ideje a szöveges tokenek voltak az AI rendszerek alapvető építőkövei. A vizuális tokenek alkalmazása viszont újszerű megközelítésnek számít, amely gyorsan felkelti a kutatók érdeklődését.

Andrej Karpathy, a Tesla korábbi AI vezetője és az OpenAI egyik alapító tagja is méltatta a DeepSeek tanulmányát. Egy X-en (korábbi Twitter) közzétett bejegyzésében azt írta, hogy a képek akár jobb bemenetként szolgálhatnak majd a nagy nyelvi modellek számára, mint maga a szöveg. Szerinte a szöveges tokenek „feleslegesek és rosszak bemenetként”.

Manling Li, a Northwestern Egyetem számítástechnikai adjunktusa szerint ez a tanulmány új keretrendszert kínál az AI memória kihívásainak kezelésére. Bár az ötlet nem teljesen új – hiszen korábban is felmerült már kép alapú tokenek használata –, ez az első olyan kutatás, amely ilyen mélységben vizsgálja és bizonyítja ennek működőképességét.

Összegzés: Az AI jövője hatékonyabb memóriakezeléssel

A DeepSeek által bemutatott módszer forradalmi lépést jelenthet abban, hogyan kezelik majd az AI rendszerek a hosszú távú kontextust és memóriát. A vizuális tokenek alkalmazása és a többrétegű tömörítés ötvözése lehetővé teszi, hogy kevesebb erőforrással több információt őrizzenek meg – így csökkentve a „kontextusromlás” problémáját.

Ez nemcsak technológiai áttörés lehet, hanem alapjaiban változtathatja meg azt is, hogyan kommunikálunk majd mesterséges intelligenciákkal hosszabb távon. Az innovációk nyomán várhatóan még megbízhatóbb és intelligensebb AI asszisztensek születnek majd, amelyek jobban megértik és emlékeznek ránk.

  • Tokenek: apró egységek, amelyekre bontják a szöveget az AI modellekben.
  • Kontekstusromlás: amikor az AI elfelejti vagy összekeveri korábbi információkat hosszú beszélgetések során.
  • Vizuális tokenek: képi formába csomagolt információk, amelyek kevesebb erőforrást igényelnek.
  • Többrétegű tömörítés: régebbi vagy kevésbé fontos adatok homályosabb tárolása helytakarékosság céljából.
  • OCR modell: optikai karakterfelismerő technológia tesztelési platformként szolgál ezekhez az újításokhoz.

Forrás: https://www.technologyreview.com/2025/10/29/1126932/deepseek-ocr-visual-compression/?utm_medium=tr_social&utm_source=reddit&utm_campaign=site_visitor.unpaid.engagement

Halo fejlesztők elítélik az ICE játékos toborzó kampányát

Az Immigration and Customs Enforcement (ICE) egy vitatott toborzó poszttal keltett nagy visszhangot, amikor a népszerű Halo videojáték-sorozat ikonikus képeit és szlogenjeit használta fel. A katonai sci-fi témájú játék főhősének, a Master Chief-nek az ábrázolása...

Arcazonosító technológia a határőrizetben: valóság vagy disztópia?

Az utóbbi időben egyre több videó került nyilvánosságra, amelyek az Egyesült Államok Határ- és Vámvédelmi Hivatala (CBP) és a Bevándorlási és Vámellenőrzési Hivatal (ICE) tisztjeit mutatják be, amint arcfelismerő technológiát alkalmaznak a terepen. Ez a gyakorlat nem...

Federal Reserve kamatcsökkentése és a monetáris politika kihívásai 2023 őszén

2023 októberében a Federal Reserve (Fed) két napos politikai ülése zárul, amelynek legkönnyebb része várhatóan az előre jelzett kamatcsökkentés bejelentése lesz. Az igazi kihívást azonban az egyéb, összetettebb kérdések kezelése jelenti, amelyek jelenleg jelentős...

Google és Amazon titkos kódja az izraeli kormány felhőadatainak védelmében – A „kacsintó mechanizmus” részletei

2021-ben a Google és az Amazon egy jelentős, 1,2 milliárd dolláros felhőszolgáltatási szerződést kötött az izraeli kormánnyal, amelynek különleges feltétele volt egy titkos kód használata. Ez a megállapodás vált ismertté „kacsintó mechanizmus” néven, amely egyedi...

AI chatbotok korhatár-ellenőrzése: új törvényjavaslat az online gyermekvédelemért

Az utóbbi években az AI chatbotok egyre népszerűbbé váltak, azonban a technológia fejlődése számos aggályt vet fel, különösen a gyermekek biztonsága szempontjából. Ezzel összefüggésben két amerikai szenátor, Josh Hawley (R-MO) és Richard Blumenthal (D-CT) egy új...

Halo fejlesztők elítélik az ICE játékos toborzó kampányát

Az Immigration and Customs Enforcement (ICE) egy vitatott toborzó poszttal keltett nagy visszhangot, amikor a népszerű Halo videojáték-sorozat ikonikus képeit és szlogenjeit használta fel. A katonai sci-fi témájú játék főhősének, a Master Chief-nek az ábrázolása...

AI által generált zenék hódítanak a Billboard listákon – Új korszak a zeneiparban

Az elmúlt hónapban egyre több mesterséges intelligencia (AI) által létrehozott zenei alkotás jelent meg a Billboard slágerlistáin, ami új, izgalmas, ugyanakkor vitákat is kiváltó trendet indított el a zeneiparban. Egyes AI „előadók” már milliós hallgatottságot értek...

Philadelphia ingyenes óvodai programja és a vita a városi üdítőital-adóról

Philadelphia nyolc évvel ezelőtt indította el ingyenes előkészítő óvodai programját, a PHLpreK-t, amely azóta több mint 30 000 gyermeket szolgált ki. A program célja, hogy minden család számára elérhetővé tegye a korai oktatást, függetlenül a jövedelmi helyzettől....

Spektroszkópiai Eclipse Térképezés: Eigenspectra és ThERESA Módszerek Alkalmazása és Elemzése

A modern exobolygó-kutatás egyik legizgalmasabb területe a bolygók légkörének részletes feltérképezése, különösen a spektroszkópiai eclipse térképezés révén. Ebben a cikkben két kiegészítő módszert mutatunk be, az Eigenspectra és a ThERESA spektroszkópiai eclipse...

Ethan Hawke és Robin Williams: Egy felejthetetlen színészi lecke a Holt Poéták Társaságában

Ethan Hawke mélyen emlékszik a Robin Williams által adott színészi leckére, amelyet a legendás színésszel közösen töltött idő alatt tanult meg. A két művész együtt játszott a 1989-es Holt Poéták Társasága című filmben, amely az egyik első drámai szerep volt Williams...

Bruce Willis betegségei és Emma Heming Willis gondoskodása – Egy váratlan út

Emma Heming Willis továbbra is fontos ügyként kezeli férje, Bruce Willis egészségi állapotának ismertetését, és megosztotta azt az első tünetet, amelyről soha nem gondolta volna, hogy a betegség jele lehet. Bruce Willis diagnózisai: afázia és frontotemporális demencia...

Differenciális adatvédelem és a 2020-as népszámlálás: Valóság vagy politikai vita?

A 2020-as amerikai népszámlálás kapcsán az adatvédelem és a politikai következmények kérdései egyaránt nagy figyelmet kaptak. Különösen a differenciális adatvédelem (differential privacy) alkalmazása vált vitatémává, amelynek célja az egyéni adatok védelme, miközben...