arXiv, a tudományos kutatások preprint publikációs platformja, amely különösen fontos szerepet tölt be a mesterséges intelligencia (AI) kutatások területén, nemrégiben bejelentette, hogy többé nem fogad el számítástechnikai áttekintő (review) cikkeket és állásfoglaló (position) tanulmányokat. Mi áll ennek a döntésnek a hátterében? Egyre nagyobb hullámban érkeznek olyan, alacsony színvonalú, főként AI-generált anyagok, amelyek „alig többek, mint annotált bibliográfiák, valódi kutatási kérdések érdemi tárgyalása nélkül” – olvasható a változásról kiadott sajtóközleményben.
Mi az az arXiv és miért fontos?
Az arXiv egy nyílt hozzáférésű tudományos preprint archívum, ahol kutatók feltölthetik legfrissebb tanulmányaikat még a hivatalos szakmai lektorálási folyamat befejezése előtt. Ez a platform kulcsfontosságúvá vált az olyan gyorsan fejlődő tudományterületeken, mint az AI és a gépi tanulás, hiszen itt jelennek meg elsőként a legújabb felfedezések és eredmények.
Az arXiv különböző tudományágakban működik: fizikában, matematikában, biológiában, közgazdaságtanban, statisztikában és természetesen számítástechnikában is. A feltöltött anyagokat szakértő moderátorok ellenőrzik, akik biztosítják a tartalom relevanciáját és minőségét.
Áttekintő és állásfoglaló cikkek: mit jelentenek ezek?
Áttekintő cikkek (review articles) egy adott témakör aktuális kutatásainak összefoglalói, amelyek segítenek eligazodni egy tudományterület legfontosabb eredményei között. Ezzel szemben az állásfoglaló cikkek (position papers) inkább véleménycikkekhez hasonlíthatók, amelyek egy adott kérdésben képviselnek egy álláspontot vagy javaslatot.
Ezeket a két típusú publikációt érinti most az arXiv szigorítása.
Miért vezeti be az arXiv ezt a korlátozást?
A számítástechnika kategóriájában az elmúlt években drasztikusan megnőtt az ilyen típusú cikkek száma. Az arXiv sajtóközleménye szerint „az elmúlt néhány évben özönlöttek be a tanulmányok”, melyeket nagyrészt generatív AI és nagy nyelvi modellek (LLM-ek) segítségével készítenek el gyorsan és könnyedén – különösen azok esetében, amelyek nem mutatnak be új kutatási eredményeket.
Ez a jelenség jelentős terhet ró a moderátorokra, akik így kevesebb időt tudnak fordítani valóban értékes és újszerű kutatások feldolgozására.
Milyen változások lépnek életbe pontosan?
- Áttekintő és állásfoglaló cikkek csak akkor kerülhetnek elfogadásra, ha sikeres szakmai lektorálás dokumentációját is csatolják hozzájuk.
- Ezek hiányában az ilyen típusú anyagokat valószínűleg elutasítják és nem jelennek meg az arXiv-on.
- A szabályozás elsősorban a számítástechnika kategóriára vonatkozik, ahol a helyzet volt a legsúlyosabb.
- Az arXiv hangsúlyozza, hogy korábban sem fogadott el gyakran ilyen cikkeket, csak akkor, ha azok tudományosan érdekesek voltak és ismert kutatóktól származtak.
- Ha más kategóriákban is hasonló mértékben megnő az AI-generált áttekintő vagy állásfoglaló cikkek száma, ott is változhatnak majd a moderációs gyakorlatok.
A mesterséges intelligencia hatása a tudományos publikációkra
Az AI által generált kutatási anyagok problémája nem új keletű. Bár már korábban is léteztek olyan csaló tudományos folyóiratok, amelyek fizetős publikálási rendszerekkel éltek vissza, az LLM-ek megjelenése felgyorsította ezt a folyamatot. Nemcsak hamis vagy alacsony minőségű cikkek árasztják el a piacot, hanem néha komoly szakmai folyóiratok is kénytelenek visszavonni olyan tanulmányokat, amelyek például mesterségesen generált képeket tartalmaztak – mint például egy óriási patkány nemi szervéről készült AI-kép esetében történt.
A szakmai lektorok is egyre gyakrabban használnak ChatGPT-t vagy más AI-eszközöket munkájuk során annak ellenére, hogy ez időnként pontatlanságokhoz vagy hiányosságokhoz vezethet – részben azért is, mert jelentős időnyomás alatt dolgoznak.
Frissítés
A cikk eredeti változata félreérthetően azt sugallta, hogy az arXiv teljes egészében beszüntette a számítástechnikai cikkek elfogadását még akkor is, ha azok szakmai lektorálás alatt állnak. Valójában csak az áttekintő és állásfoglaló cikkekre vonatkozik ez a szigorítás. A történetet és az alcímet ennek megfelelően frissítettük és korrigáltuk ezt a tévedést.
Szerzői információk
Matthew Gault íróként dolgozik különleges technológiák, nukleáris háborúk és videojátékok témakörében. Munkái megjelentek többek között a Reutersnél, Motherboardnál és a New York Times-nál.
Forrás: https://www.404media.co/arxiv-changes-rules-after-getting-spammed-with-ai-generated-research-papers/