Ein neues statistisches Verfahren könnte dabei helfen, die Funktion von bisher unbekannten Genen aufzuklären. Eine Filtermethode aus der Sprachsignalverarbeitung wurde adaptiert, um Sequenzierdaten und die Aktivität von Ribosomen besser zu interpretieren.
Aus der modernen Datenverarbeitung sind mathematischen Methoden, die aus „verrauschten“ Daten die relevanten Informationen herausfiltern, längst nicht mehr wegzudenken. Jetzt wendet Uwe Ohler vom Berlin Institute for Medical Systems Biology (BIMSB) am Max-Delbrück-Centrum für Molekulare Medizin (MDC) diese Filtermethoden auf die Molekularbiologie an. Sein Forschungsteam hat so „RiboTaper“ entwickelt und getestet. Das Programm filtert aus bestimmten Sequenzier-Daten heraus, ob die Ribosomen auf einer RNA tatsächlich aktiv ist. RiboTaper baut dabei auf ein Laborverfahren auf, das vor einigen Jahren in den USA entwickelt wurde. Es heißt Ribo-seq und dient der Identifizierung von Genen, die für ein Protein kodieren. Das ist insofern wichtig, als der Lehrsatz, dass die DNA Bauanleitungen für Proteine enthält, nicht ganz stimmt. Tausende von Genen werden zwar in RNA transkribiert, aber es ist nicht bekannt, ob sie eventuell kleine, proteinkodierende Abschnitte enthalten. Insgesamt ist nur ein kleiner Teil des Genoms dafür zuständig, Eiweiße zu produzieren. Hinzu kommt: Von Zelle zu Zelle werden unterschiedliche Gene manchmal hoch- und manchmal heruntergeregelt oder stillgelegt. Wie aber findet man nun heraus, aus welchen Genen in welcher Zelle tatsächlich Proteine produziert werden und aus welchen gerade nicht?
Dazu muss man sich die Ribosomen anschauen und die Bauanleitungen, nach denen sie arbeiten. Ribo-seq, das Verfahren aus dem „wet lab“, friert gewissermaßen die Ribosomen dort fest, wo sie am RNA-Strang sitzen. Alles außer Ribosom und der damit verbundenen RNA werden mit biochemischen Werkzeugen verdaut. Das ermöglicht den Molekularbiologen festzustellen, mit welcher Anleitung die Ribosomen gerade arbeiten. Das Problem dabei: Die Daten, die man mit Ribo-seq erhält, sind „verrauscht“. Es gibt in jeder Zelle winzige Reste von DNA, RNA und Proteinen, die natürlicherweise entstehen und abgebaut werden. Hinzu kommt, dass man nie genau weiß, ob die Ribosomen an der identifizierten Stelle auf den RNAs auch wirklich aktiv sind und Proteine produzieren oder ob sie gewissermaßen erst auf ein weiteres Signal warten. Die „dry lab“-Methode RiboTaper soll diese Informationslücke schließen. Damit können die Rollen von DNA, RNA und Ribosomen viel genauer als bisher aufgeklärt werden. „Wir wissen beispielsweise, dass ein bestimmtes Ribosom gewöhnlich 29 RNA-Bausteine – die Nukleotide – abdeckt“, erzählt Uwe Ohler. „Und wir wissen auch, dass das Ribosom entlang der RNA immer in Abständen von 3 Nukleotiden entlang wandert.“ So entsteht ein periodisches Muster, nach dem die Bioinformatiker in all den Daten suchen können. „Das zeigt uns dann, an welchen Stellen der RNA etwas Signifikantes passiert“, sagt Ohler.
Uwe Ohler erklärt: „Mit RiboTaper können wir in bislang wenig studierten Genen Jagd auf kleine Proteine machen und dazu beitragen, widersprüchliche Dateninterpretationen aufzuklären.“ Ohler sieht noch einen Vorteil: „Sequenziergeräte stehen heutzutage in vielen Labors, aber nur wenige Zentren haben auch eine gute Massenspektrometrie zur Hand. Mit RiboTaper können wir aus den Sequenzierdaten Schlüsse ziehen, was gerade translatiert wird.“ Um das neue Verfahren zu testen, hat Ohler die Probe aufs Exempel gemacht und bei seinem MDC-Kollegen Matthias Selbach die RiboTaper-Daten mittels Massenspektrometrie überprüfen lassen. Nachdem es bereits eine ganze Reihe von Gruppen am MDC gibt, die Ribo-seq nutzen, dürfte es spannend sein, wie RiboTaper ihnen bei der Interpretation zu helfen vermag. Originalpublikation: Detecting actively translated open reading frames in ribosome profiling dataLorenzo Calviello et al.; Nature Methods, doi: 10.1038/nmeth.3688; 2015