KIs können viel – auch bei der Aufklärung zu Coronavirus-Proteinen. Dadurch wurde nun enthüllt, wie das Virus unser Immunsystem austrickst.
Wie gelingt es dem SARS-CoV-2-Virus, sich der Immunabwehr zu entziehen und sich in den Zellen von Patienten zu replizieren? Um diese Frage zu klären, hat ein internationales Forschungsteam den bislang umfassendsten Überblick aller bisher verfügbaren Analysen der exakten dreidimensionalen Form der SARS-CoV-2-Proteine – darunter auch das bekannte Spike-Protein – zusammengetragen.
Eine strukturelle Landkarte als Basis
Um diese Übersicht zusammenzustellen, verwendete das Team Hochdurchsatz-Maschinenlernen. Dieser Ansatz ermöglicht es, basierend auf Analysen verwandter Proteine, strukturelle Zustände von Coronavirus-Proteinen vorherzusagen. Inzwischen besteht die Datenbank aus 2.060 3D-Modellen mit atomarer Auflösung. Auf der Website Aquaria-COVID sind alle Strukturmodelle frei verfügbar.
„Dies bietet einen beispiellosen Detailreichtum, der Forschenden helfen wird, die molekularen Mechanismen der COVID-19-Infektion besser zu verstehen und Therapien zur Bekämpfung der Pandemie zu entwickeln, beispielsweise indem sie potenzielle neue Angriffspunkte für zukünftige Behandlungen oder Impfstoffe identifizieren“, sagt Burkhard Rost, Inhaber des Lehrstuhls für Bioinformatik an der TU München.
Von der Struktur zur Funktion?
In einem zweiten Teil der Studie wurde ein komplementärer Ansatz verwendet, der als Human-in-the-Loop Machine Learning bekannt ist. Hier wurde eine neuartige, visuelle Schnittstelle erzeugt, die alles zusammenfasst, was derzeit über die dreidimensionale Form von SARS-CoV-2-Proteinen bekannt ist – und was nicht.
Forschende können die visuelle Schnittstelle auch als Navigationshilfe verwenden, um für spezifische Forschungsfragen geeignete Strukturmodelle zu finden. Die Arbeit mit den Modellen hat bereits einige wichtige Hinweise darauf gegeben, wie Coronaviren es schaffen, das Kommando in unseren Zellen übernehmen.
So tricksen uns Coronavirus-Proteine aus
Mithilfe der Machine-Learning-Algorithmen identifizierte das Team drei Coronavirus-Proteine (NSP3, NSP13 und NSP16), die menschliche Proteine „nachahmen“ und den Wirtszellen erfolgreich vorgaukeln, sie seien körpereigene Proteine, die im besten Interesse der Zelle arbeiten.
Die Modellierung ergab auch fünf Coronavirus-Proteine (NSP1, NSP3, Spike-Glykoprotein, Hüllprotein und ORF9b-Protein), die Prozesse in menschlichen Zellen „zweckentfremden“ oder stören. Auf diese Weise gelingt es dem Virus, die Kontrolle zu übernehmen, seinen Lebenszyklus zu vervollständigen und sich auszubreiten.
Erweitertes Verständnis als Waffe gegen das Coronavirus
„Bei der Analyse dieser Strukturmodelle haben wir außerdem neue Hinweise darauf gefunden, wie das Virus sein eigenes Genom kopiert – das ist der zentrale Prozess, der es dem Virus ermöglicht, sich bei Infizierten schnell auszubreiten“, sagt Burkhard Rost. „Die Erkenntnisse aus unserer Studie bringen uns näher an das Verständnis, wie das Virus funktioniert und was wir tun können, um es zu stoppen.“
„Je länger das Virus zirkuliert, desto größer ist die Gefahr, dass es mutiert und neue Varianten wie den Delta-Stamm bildet“, sagt Sean O’Donoghue, Erstautor der Studie und Professor am Garvan Institute in Sydney. „Unsere Ressource wird Forschern helfen zu verstehen, wie sich neue Virusstämme voneinander unterscheiden – ein Puzzleteil, von dem wir hoffen, dass es beim Bekämpfen neu auftauchender Varianten hilft.“
Dieser Artikel basiert auf einer Pressemitteilung der Technischen Universität München. Die Originalpublikation findet ihr hier.
Bildquelle: Eleventh Wave, Unsplash.