Munkatársaink, Dr. Pollner Péter, Dr. Joó Tamás és szerzőtársaik a Machine Learning And Knowledge Extraction című folyóiratban 2025. február 10-én megjelent, az Egészségbiztonság Nemzeti Laboratórium Adatvezérelt Egészség Dívizió keretében végzett kutatásukban azt vizsgálták, hogyan lehet a legjobban testre szabni a nagy nyelvi modelleket – mint például a ChatGPT-t – a különféle szakterületeken való használatra.
Két fő módszert hasonlítottak össze: az egyik a modell „újratanítása” egy adott témára (DFT, Domain-Specific Fine-Tuning = tartomány-specifikus finomhangolás), a másik pedig egy külső tudásbázisból való információlekérés és az abból való szövegalkotás (RAG, Retrieval-Augmented Generation = visszakereséssel megerősített generálás).
Az eredmények azt mutatták, hogy a módszer szinte minden mutatóban jobban teljesít: pontosabb válaszokat ad, hatékonyabb, és kevesebbet „hallucinál” (azaz kevesebb hibás információt generál). A kutatók egy egyszerűsített RAG-modellt is javasolnak, amely különösen jól működik megbízható, szakmai tartalmak létrehozására.
Bár a kutatás eredményei szerint a RAG-alapú megoldások ígéretesek és pontosabb tudásalapú rendszerek kialakítását teszik lehetővé, további vizsgálatokra van szükség ahhoz, hogy megtaláljuk a legjobb módját a RAG és a finomhangolás (DFT) együttes alkalmazásának. A tanulmány rámutat: miközben a megbízhatóság fontos, nehéz egyensúlyt teremteni a kreativitás és a tényszerűség között a nagy nyelvi modellek használatakor.