Semmelweis Federált Adattárház kialakítása a nemzeti genomikai adatok adatvédelmet biztosító megosztásának támogatására (SEFA)

Tématerületi kutatás vezetője: Dr. Molnár Mária Judit

Támogatási összeg: 750 000 000 HUF

Projekt azonosítója: TKP2021-NVA-15

Az NKFIH támogatásával 2021-ben létrejött a BBMRI-ERIC Magyar Nemzeti Csomópont,  amely ezáltal be is kapcsolódott Európa vezető biobank hálózatába. A Nemzeti Csomópontot a Semmelweis Egyetem koordinálja, tagjai a Szegedi Tudományegyetem, a Pécsi Tudományegyetem, a Debreceni Egyetem, a Délpesti Centrum Kórház és a Richter Gedeon Nyrt. A kapcsolódás a partnerek számára emeli a nemzetközi tudományos kollaborációk számát, serkenti a terület innovációs aktivitását, azáltal hogy megosztja az egészségipari szereplőkkel és kutatókkal a tag intézmények egészségügyi adatkincseit. A Csomópont ezáltal a személyre szabott orvoslás egyik legfontosabb kutatási infrastruktúráját biztosítja. A Semmelweis Biobank Hálózat (SE Biobank) több mint 10 éves múltra tekint vissza, kb. 100.000 egyén biológiai mintáit és klinikai adatait őrzi, melyek az Egyetem klinikáinak rutin működése és/vagy tudományos projektjeiben keletkeztek. Ez az adatvagyon azonban diverz, fragmentált, egymással nem interoperábilis adatgyűjtő rendszerek kezelik. A érzékeny egészségügyi adatok nemzetbiztonsági szempontból is biztonságos megosztása hazánkban még kidolgozatlan.

A nemzetközi kapcsolódás előfeltétele, hogy intézményen belül biztosítsuk a GDPR kompatibilis  adatharmonizációt, az érzékeny adatok olyan módon történő megosztását, hogy illetéktelen kezekbe ne kerülhessenek, de azok, a személyes adatok védelmének maximális biztosítása mellett, mégis kiaknázhatóak legyenek a K+F+I terület számára. Az SE adatbázisait egységesítő adattárház nemcsak orvosbiológiai kutatások, hanem a magyar társadalom egészségi állapotáról is torzítatlan képet mutató adatvagyon csírája lesz, mely segítségével becsléseket tehetünk a nemzet jövőbeli egészségügyi kihívásaira.

Az interoperábilis adattárház kialakítása a személyes adatok védelmét biztosító federált mesterséges intelligencia alapú adatmegosztással pilot projektnek tekinthető. Sikeres megvalósítás esetén a BBMRI Magyar Csomópontjának tagjai a már kialakított know-how és metodika szerint tudják megvalósítani a saját intézményükben az adatharmonizációt és -megosztást. A TKP keretein belül kialakítandó adattárház egy nemzeti szintű genomikai adat-tó alapját is is megteremtheti, amely az EESZT-vel kommunikálva Magyarországot a nemzetközi mezőnyben is előkelő helyre emelné a precíziós medicina implementációja vonatkozásában. A fentiek mellett a jelenleg futó EUs 1 Millió Genom program számára is hatékonyan tudna az SE, legtöbb teljes genom és exom szekvencia adattal rendelkező egységként, adatokat szállítani. A nemzeti genomikai adatvagyon védelme érdekében csakis federált privacy-preserving adatmegosztással szeretnénk az SE adatait megosztani. Távlati tervünk a most formálódó  Európai Health Data Space-be való adatszolgáltatás biztonságossá tételéhez metodika és know-how fejlesztése, továbbá az uniós transznacionális együttműködésen alapuló stratégiai jelentőségű projekt státusz elérése az  IPCEI (Important Projects of Common European Interest) keretében.

Célok: A SE-n belül egy egységes adatmodellre szabványosított  nagyméretű federált adatforrásokból álló hálózat létrehozása, amely megteremti az alapját a nemzeti egészségügyi “big data” biztosított védelemmel való megosztására, ezáltal támogatja az adatvezérelt precíziós medicina fókuszú kutatási projekteket, innovációkat és klinikai alkalmazásokat.

A kialakítandó rendszer jellegzetességei:

  1. TRANSZPARENCIA – a láthatóság biztosításával a feltételeknek megfelelő minta létezése, hozzáférhetősége, a hozzátartozó adatok lekérdezhetővé válnak. Az adatbázisban szereplő egyének által reprezentált betegségcsoportokra vonatkozó statisztikai adatok válnak megismerhetővé..
  2. INTEROPERÁBILITÁS – a nemzetközi hálózatba történő integráció intézményi (a tervek szerint később nemzeti) szinten harmonizált és központosított módon történik;
  3. FEDERÁLT – az adat biztonsági-védelmi kockázatok nélkül kerül megosztásra, amely megosztandó adat érzékeny, kiemelt stratégiai jelentőségű, illetve megkülönböztetett státuszú pl. személyes, egészségügyi adat.

Ehhez az szükségesek:  (1) a BBMRI-ERIC Csomópontként üzemelő  adat-tó és a nemzetközi hálózattal való adatmegosztás lehetőségének megteremtése, (2) a hazai biobankokban tárolt személyes, klinikai, genomi stb. adatok közötti kapcsolat kiépítése.

Míg az (1) pontban kidolgozott, nemzetközi szinten kipróbált módszertan, de legalábbis rendelkezésre állnak irányelvek, a (2) pontban egy hazai viszonyokra adaptált, többlépcsős adatharmonizációs folyamat kidolgozása és egységes adatmodell kifejlesztése szükséges.

A TKP távlati célja a nagy adathalmazok feldolgozására irányuló precíziós orvoslás megvalósításának támogatása mind K+F+I, mind az implementáció szintjén. Az átfogó genomi és a klinikai adatok nagy mintaszámon történő elemzése nemcsak az egyén, hanem a társadalom egészségére is nagy hatással van. A pilot projekt megvalósítása során megszerzett tudás és kifejlesztett szolgáltatás a hasonló témájú nemzeti és nemzetközi projektek megvalósítását támogatja.