Genom-Sequenzierungen sind in Zeiten der Pandemie besonders wichtig. Doch die herkömmlichen Analysemethoden haben eine große Fehlerquote – die kann laut einer aktuellen Studie behoben werden.
Oft unterscheiden sich Varianten von SARS-CoV-2 nur in winzigen Details. Deshalb ist eine möglichst exakte Darstellung des Genoms wichtig, um Virenstämme miteinander vergleichen zu können. Dafür müssen erstmal neue Virenstämme gefunden werden. Eine Möglichkeit dafür ist es, das Abwasser einer Stadt zu untersuchen, in dem Coronaviren ihre Spuren hinterlassen. Kurz gesagt wird dazu die Viren-RNA mit einem Gerät in kleine Stücke zerschnitten und analysiert. Aus diesen Stücken werden anschließend die Genome der Viren rekonstruiert – bislang allerdings mit einer recht hohen Fehlerrate.
Solche genetischen Analysen werden in der Regel mit sogenannten Nanopore-Sequenziergeräten durchgeführt. Der Vorteil: Sie sind günstig und handlich – und können lange Gensequenzen ausgeben. „Eine Sequenz kann bis zu 10.000 Basen umfassen“, sagt Professor Alexander Schönhuth von der Technischen Fakultät und dem Institut für Bioinformatik-Infrastruktur (BIBI) der Universität Bielefeld. Das Genom von SARS-CoV-2 besteht aus etwa 30.000 Basen – entsprechend entstehen durch die Sequenzierung nur wenige Teile, die aber viele Informationen umfassen.
Auf Grund der hohen Fehlerrate von 10 Prozent müssen die Teile für eine Analyse nicht nur wieder zusammengesetzt, sondern auch korrigiert werden. Für Forscher ist die Arbeit mit den Gensequenzen der Viren-Varianten wie das Lösen eines Puzzles: „Wir haben viele große Teile, aber wir wissen gar nicht, wie viele verschiedene Puzzles es eigentlich gibt“, sagt Alexander Schönhuth. Das liegt daran, dass nicht klar ist, wie viele Varianten von SARS-CoV-2 das Material überhaupt enthält. „Manche Teile sind zudem verschwommen oder haben Fehler im Bild.“ Die Teile genau zuordnen zu können, ist aber entscheidend – etwa für die funktionelle Genomik, die Präzisionsmedizin und viele andere Disziplinen.
Solche Fehler können jetzt frühzeitig durch die Methode Strainline korrigiert werden. Schönhuth hat sie gemeinsam mit den Doktoranden Xiao Luo und Xiongbin Kang aus seiner Arbeitsgruppe Genominformatik entwickelt. Zugrunde der Methode liegt die Idee, die Genome nicht als Buchstabenketten, sondern in Form einer grafischen Anwendung darzustellen. Diese zeigt die Verbindungen zwischen Genomen als Knotenpunkte und filtert auch Auffälligkeiten schnell heraus.
Auf ähnliche Weise funktioniert auch die Methode Phasebook, die das Forschungsteam ebenfalls entwickelt hat. Sie hilft dabei menschliche Chromosomensätze besser analysieren zu können. Phasebook setzt darauf, Analysefehler in langen Sequenzen schon frühzeitig zu erkennen und zu korrigieren. Außerdem ermöglicht die Methode durch einen Algorithmus eine bessere Zuordnung der Teile.
„Viele andere Methoden verwenden stattdessen ein sogenanntes Referenzgenom“, sagt Schönhuth. „Dieses stammt aber von einem Europäer und funktioniert nicht so gut, wenn man beispielsweise das Genom von Menschen in Afrika oder Südamerika analysieren möchte.“ Mit Phasebook lässt sich laut Schönhuth auch ohne ein solches Referenzgenom rekonstruieren, welcher Teil der genetischen Ausstattung von der Seite der Mutter und welche von der Seite des Vaters stammt.
Dieser Text basiert auf einer Pressemitteilung der Universität Bielefeld. Die Originalpublikation haben wir euch hier und im Text verlinkt.
Bildquelle: Mel Poole, unsplash