Hogyan működnek a deepfake orvosi képek – és miért tévesztik meg az orvosokat?

Amikor a MI megtanul röntgent hamisítani

A generatív mesterséges intelligencia esszéket írhat, zenét szerezhet és fotorealisztikus portrékat készíthet. Most már olyan meggyőző orvosi képeket is képes előállítani, amelyek megtévesztik a képzett radiológusokat. A Radiology folyóiratban megjelent tanulmány szerint az orvosok csak az esetek körülbelül 75 százalékában tudták helyesen megkülönböztetni a MI által generált röntgenfelvételeket a valódiaktól – ami alig jobb, mint egy pénzfeldobás, ha nem figyelmeztették őket a hamisítványok jelenlétére.

A megállapítás rávilágított egy gyorsan kibontakozó fenyegetésre: a deepfake orvosi képekre. Annak megértése, hogy hogyan készülnek, miért olyan nehéz őket észlelni, és mit lehet tenni ellenük, minden beteg, biztosító és klinikus számára fontos.

Hogyan készülnek a szintetikus orvosi képek?

A modern deepfake röntgenfelvételek két fő MI-családra támaszkodnak. A diffúziós modellek, mint például a Stanford Medicine-ben kifejlesztett nyílt forráskódú RoentGen rendszer, több ezer hiteles felvétel statisztikai mintáit tanulják meg, majd pixelről pixelre új képeket generálnak. A multimodális nagyméretű nyelvi modellek, mint például a ChatGPT-4o, ma már egyszerű szöveges utasításból is képesek anatómiailag plauzibilis röntgenfelvételeket készíteni – például: "mutass egy mellkasröntgent jobb oldali pneumothoraxszal".

Az eredmény egy olyan kép, amely valósághű csontsűrűséget, tüdőrajzolatot és lágyrész-kontrasztot tartalmaz. A durva fotószerkesztésektől eltérően ezek a szintetikus felvételek a semmiből épülnek fel, ami a hagyományos manipuláció-észlelési módszereket nagyrészt használhatatlanná teszi.

Miért nehéz az orvosoknak és a MI-nek a hamisítványok észlelése?

A Mount Sinai vezetésével 12 kutatóközpontban 17 radiológussal végzett tanulmány szakaszokban tesztelte az észlelést. Amikor a résztvevők nem tudták, hogy hamisítványok is vannak a képek között, csak 41 százalékuk jelölte meg spontán módon a MI által generált képeket. Még azután is, hogy elmondták nekik, hogy szintetikus felvételek is vannak, az átlagos pontosság mindössze 75 százalékot ért el. Az egyéni teljesítmény 58 és 92 százalék között mozgott, és a több éves tapasztalat nem mutatott statisztikai különbséget.

A MI sem teljesített jobban. Négy vezető multimodális modell – GPT-4o, GPT-5, Gemini 2.5 Pro és Llama 4 Maverick – 57 és 85 százalék között teljesített a Nature tanulmányban megjelent beszámolója szerint. A hamisítványok "túl tökéletesnek" tűnnek – jegyezték meg a kutatók: a csontok túlságosan simának, a gerinc természetellenesen egyenesnek, a törésvonalak pedig gyanúsan tisztának tűnnek – ezeket a finomságokat könnyű elnézni egy forgalmas leletező szobában.

Valós kockázatok

A következmények messze túlmutatnak egy akadémiai gyakorlaton:

Biztosítási csalás – Egy hamisított törés- vagy daganatkép több ezer dollár értékű hamis kárigényt támaszthat alá.
Diagnózis manipulálása – Ha egy kórház képarchiváló rendszerét feltörik, egy támadó képeket illeszthet be vagy módosíthat, ami szükségtelen műtéthez vagy visszatartott kezeléshez vezethet.
Tudományos manipuláció – Hamis felvételek szennyezhetik a kutatási adatkészleteket, vagy bizonyítékként nyújthatók be klinikai vizsgálatokban és bírósági eljárásokban.

"Az a képesség, hogy minimális erőfeszítéssel rendkívül valósághű orvosi képeket generálhatunk, új sebezhetőségeket vezet be az egészségügyi rendszerekbe, amelyeket soha nem arra terveztek, hogy megkérdőjelezzék egy röntgenfelvétel hitelességét" – írták a tanulmány szerzői.

Hogyan védekezik a terület?

A kutatók és a szabványügyi szervezetek számos védelmi réteget alkalmaznak:

Láthatatlan vízjelek – A kép készítésekor beágyazott digitális jelölők egy adott géphez és technikushoz kötik a felvételt, ami észlelhetővé teszi az utólagos hamisítást.
Kriptográfiai aláírások – A hash-alapú ellenőrzés biztosítja, hogy bármilyen pixel szintű módosítás megszakítsa az aláírási láncot, figyelmeztetve a rendszereket a manipulációra.
MI-alapú detektorok – A célra épített neurális hálózatok, mint például a Dual-Stage Knowledge Infusing Detector (DSKI) és az EfficientNetV2 architektúrák, ellenőrzött tesztekben 90 százalék feletti észlelési pontosságot értek el, felülmúlva mind az emberi leletezőket, mind az általános célú MI-t.
Blockchain auditnyomok – A decentralizált főkönyvek naplózhatnak minden hozzáférési és módosítási eseményt egy orvosi képhez, létrehozva egy megváltoztathatatlan őrzési láncot.

Mi következik?

Ezek a védőintézkedések egyike sem szabványos még a klinikai gyakorlatban. A legtöbb kórházi képalkotó rendszer még mindig kriptográfiai eredet nélkül tárolja a fájlokat, és a szabályozási keretek sem tartottak lépést a generatív MI képességeivel. A szakadék aközött, amit a MI hamisíthat, és amit az intézmények ellenőrizhetnek, egyre nő – és ennek áthidalása összehangolt fellépést igényel a technológiai szállítóktól, a kórházi hálózatoktól és a szabályozó hatóságoktól egyaránt.

Egyelőre a tanulság egyértelmű: egy olyan korban, amikor a látás már nem jelent feltétlenül hitet, az orvosi képalkotásnak szüksége van a digitális megfelelőjére egy hamisításbiztos pecsétnek.

Hogyan működnek a deepfake orvosi képek – és miért tévesztik meg az orvosokat?

Amikor a MI megtanul röntgent hamisítani

Hogyan készülnek a szintetikus orvosi képek?

Miért nehéz az orvosoknak és a MI-nek a hamisítványok észlelése?

Valós kockázatok

Hogyan védekezik a terület?

Mi következik?

Kapcsolódó cikkek

Hogyan működik az Air Force One – a repülő Fehér Ház

Hogyan működik az EU Polgári Védelmi Mechanizmusa

Hogyan működnek az amerikai katonai bázisok Európában – és miért

Hogyan Működik a Polipok Intelligenciája – Egy Megosztott Elme

Hogyan működik az Air Force One – a repülő Fehér Ház

Hogyan működik a háborús jogkörökről szóló határozat – és miért hagyják figyelmen kívül az elnökök

Hogyan Működik a Triple Crown – A Lóversenyzés Legnehezebb Díja

Hogyan térképezi fel a NASA SPHEREx űrtávcsöve az egész eget 102 színben

Ne maradjon le az új cikkekről!