A Briefings in Bioinformatics folyóiratban elfogadták Dr. Tusnády Gábor és Dr. Dobson László közreműködésével készült cikket.
Az AlphaFold2 egy mély gépi tanuláson alapuló módszer, amely forradalmasította a szerkezeti biológiát. Az AlphaFold sosem látott pontossággal képes megbecsülni a fehérje három dimenziós szerkezetét, amiért a John Jumper és Demis Hassabis 2024-ben kémiai Nobel-díjat kaptak. Az AlphaFold számos alkalmazás alapjául szolgált és gyorsította a fehérjékkel kapcsolatos kutatásokat. Azonban az optimizmus miatt sok esetben figyelmen kívül hagyták az adatszivárgás (data leakage) problémáját, amely torzíthatja az AlphaFoldra épülő gépi tanulási módszerek értékelését. Ebben a munkában egy szigorú teszthalmazt mutatunk be, amely olyan szerkezeteket és szekvenciákat tartalmaz, amelyeket az AlphaFold2 nem láthat(ott) sem a tanulás, sem a becslés során. Ez lehetővé teszi az AlphaFoldra épülő alkalmazások megbízható tesztelését, és segít a létrehozott modellek objektív értékelésében.
A cikkhez kapcsolódó BETA adatbázis a https://beta.pbrg.hu/ címen érhető el.