Egal, ob bei der Ausbreitung von Viren, bei Transkriptomanalysen oder beim Teilungsverhalten von Stammzellen: Wichtige Resultate verstecken sich oft im Datenrauschen. Fabian Theis entwickelt Methoden, um diesen Schatz zu heben. Vom Labor in die Praxis ist es nicht weit.
„Für mich ist Big Data nicht nur mit großen, sondern auch mit heterogenen Datensätzen verbunden“, erklärt Professor Dr. Dr. Fabian Theis (39), Systembiologe vom Helmholtz Zentrum München. Ursprünglich hat Theis an der Universität Regensburg Mathe und Physik studiert. Über Machine Learning kam er zu den Lebenswissenschaften. Sein Erfolgsmodell: ein breites Methodenspektrum, das es ihm ermöglicht, unterschiedliche biologische und medizinische Aspekte zu erforschen. „Mich fasziniert es, in großen Datenmengen Muster zu erkennen“, so Theis weiter. Ein Thema, das künftig an Relevanz gewinnen wird.
Von Regensburg ging es weiter nach Göttingen. Zusammen mit Dirk Brockmann hat Theis am Max-Planck-Institut für Dynamik und Selbstorganisation Reisewege von Banknoten [Paywall] untersucht. Dafür nutzten sie das Portal „Where's George“, über das viele US-Amerikaner die Wege von Ein-Dollar-Noten tracken. Wissenschaftler freuen sich über derartige Datenschätze. Theis: „Wir haben die Scheine als Stellvertreter für menschliche Bewegungen verwendet.“ Brockmanns Modell zeigt Ausbreitungsmuster diverser Krankheiten: nicht mehr wellenförmig, wie in mittelalterlichen Pestzeiten, sondern mit Sprüngen in kurze und in weite Richtungen. Auf dieser Basis ließen sich Flughäfen oder Bahnhöfe als Knotenpunkte identifizieren, die im Pandemiefall abgeschottet werden müssten. Fabian Theis fand heraus, dass geographische Barrieren, etwa die Appalachen, für unsere Mobilität immer noch von Bedeutung sind. Auch hier ging es um die Interpretation großer Datenmengen.
Von der Methodenvielfalt der Bioinformatik begeistert, wechselte Fabian Theis bald darauf an das Helmholtz Zentrum München und an die Technische Universität München. Seine Ziele: immer größere Datenmengen, wie sie in der Zellbiologie anfallen, auswerten und hinter dem Rauschen Phänomene entdecken. Besonders interessieren ihn Experimente mit Anwendungsbezug. So hat Theis zum Beispiel zusammen mit Kollegen pluripotente, embryonalen Stammzellen [Paywall] per Langzeitmikroskopie beobachtet. Der Transkriptionsfaktor Nanog (benannt nach Tír na nÓg, dem „Land der ewigen Jugend“) steuert die Selbsterneuerung von Stammzellen. Forscher dachten bisher, jedes Netzwerk bestehe aus Knoten – sprich Zellen – und Interaktionen – also regulatorischen Proteinen. Weit gefehlt: „Entgegen der bisherigen Meinung konnten wir zwei verschiedene Arten von Kolonien identifizieren“, berichtet Theis. Er hat im Institut Tools zur Auswertung entwickelt. „Während eines davon Nanog in einem Mosaikmuster reexprimierte, entstand bei dem anderen über Generationen hinweg kein Nanog.“ Zellpopulationen sind wesentlich heterogener als bislang angenommen, so die Quintessenz. Fabian Theis. ICB, Institute of Computational Biology, © Helmholtz Zentrum München
Das biomathematische Methodenspektrum ist damit aber noch lange nicht ausgereizt. Fabian Theis untersuchte zusammen mit Kollegen Transkriptome einzelner Zellen. Auch hier ließen sich interessante Effekte entdecken. Störfaktoren wie kurzfristige Veränderungen durch den Zellzyklus oder durch Differenzierungsprozesse beeinflussen das Ergebnis. Dank mathematischer Verfahren wie dem Single Cell Latent Variable Model gelang es jetzt, unterschiedliche Reifestadien von T-Zellen zu charakterisieren. Auch andere Forscher konnten Ergebnisse zu dieser Thematik beitragen. Betazellen im Pankreas oder Zellen in einem soliden Tumor sind nicht so homogen wie bislang angenommen. Kommt es bald zum Paradigmenwechsel? Theis: „Der Begriff eines Zelltyps war früher rein funktional definiert. Später erlaubten Oberflächenmarker eine klarere Einteilung. Diese Begrifflichkeiten werden zunehmend infrage gestellt“, erklärt Theis. Viele scheinbar homogene Zellpopulationen haben Subpopulationen – eine Erkenntnis, die klinische Studien revolutionieren könnte. „Ersetzen wir Probanden durch Einzelzellen, können wir bekannte Verfahren der Epidemiologie anwenden und Fehler besser von Daten trennen“, so Theis. Er sieht die Arzneistoffforschung als wichtigste Möglichkeit. Ohne großen Rekrutierungsaufwand ließen sich zelluläre Kohorten realisieren – gäbe es nicht ein paar Hindernisse.
Datenschutz ist Theis zufolge „weltweit ein großes Thema“, wobei gerade die nordischen Länder im gesellschaftlichen Prozess schon weiter sind. So haben Wissenschaftler aus Island bereits 104.000 Menschen genotypisiert – ein Drittel aller Einwohner. „Man muss mit der Bevölkerung diskutieren und Patienten erklären, dass ihnen unsere molekularbiologische und systemmedizinische Arbeit wirklich hilft“, gibt der Bioinformatiker zu bedenken. Forschende Kliniker sind schon heute mit im Boot, wobei ihnen technische Aspekte einen Strich durch die Rechnung machen. Viele Systeme zur Datenerhebung sind inkompatibel, manche Ärzte arbeiten noch mit Papier. Aber auch sie erkennen mehr und mehr den Vorteil von „Big Data“. Im nächsten Schritt muss jetzt der Sprung von der Forschung in die Praxis gewagt werden.