GeMTeX

GeMTeX

German Medical Text Corpus

Ansprechpartner

Matthias Gietzelt

Kooperationspartner

Förderung

Das Projekt GeMTeX wird im Rahmen der Medizininformatik-Initiative durch das Bundesministerium für Bildung und Forschung mit ca. 6,8 Mio. € Gesamtvolumen gefördert. Davon werden ca. 200.000 € für die MHH zur Verfügung gestellt (Förderkennzeichen: 01ZZ2314J).

Kurzbeschreibung

Im klinischen Alltag fallen viele Texte wie Arztbriefe und Befunde an, die wertvolle Informationen zur Krankheitsgeschichte, zum -verlauf und zur Behandlung enthalten. Mit Hilfe dieser Texte könnten Programme für die automatische Verarbeitung natürlicher Sprache (Natural Language Processing, kurz NLP) Ärztinnen und Ärzte sowie Forschende bei ihrer Arbeit unterstützen. Allerdings kann das volle Potenzial der klinischen Dokumente aufgrund fehlender Standardisierung nicht ausgeschöpft werden. Die Methodenplattform GeMTeX (German Medical Text Corpus) möchte diese Lücke schließen und hat zum Ziel, medizinische Texte aus der Patientenversorgung für Forschungsprojekte verfügbar zu machen. Damit soll der größte medizinische Textkorpus in deutscher Sprache entstehen.

Die MHH fokussiert ihre Arbeiten in diesem Projekt auf die Verarbeitung molekularpathologischer Befunde, die eine Reihe von besonderen Fachbegriffen, bioinformatischen Zusmmenhängen und speziellen Terminologien enthalten.

Laufzeit

2023-2026

Mitarbeiter