Immer wieder werfen Fälle von Plagiaten, Fälschungen und fehlerhaften Ergebnissen einen Schatten auf die Qualität im Forschungsbetrieb. Der letzte Clou: Fake-Artikel in Fachmagazinen, die offenbar nach wie vor im Umlauf sind. Wie kann Unsinn überhaupt publiziert werden?
Die Wissenschaft leistet viel, doch es wird auch viel betrogen. Gefälschte Studienergebnisse, geschönte Statistiken, aufgehübschte Lebensläufe und Plagiate in Doktorarbeiten. Immer wieder kommen Verstöße gegen die gute wissenschaftliche Praxis ans Licht. 2013 kam ein neuer Trend hinzu: Am Rechner generierte Textschnipsel, die willkürlich zusammengesetzt werden, um sie dann auf wissenschaftlichen Konferenzen vorzustellen oder in renommierten Zeitschriften zu veröffentlichen, wie etwa beim Wissenschaftsverlag Springer Verlag oder in Beiträgen des Institute of Electrical and Electronics Engineers (IEEE), das Dutzende Fachmagazine herausgibt. Mehr als 100 Fake-Artikel, die hauptsächlich als Kongressberichte gedruckt wurden, sind dort erschienen. Anscheinend ohne je auf ihren Inhalt geprüft worden zu sein. Kürzlich entdeckte die Süddeutsche Zeitung, dass vom IEEE bereits gelöschte Fake-Artikel in einer anderen Datenbank noch zu finden und käuflich zu erwerben sind. Da stellt sich die Frage, wieso bei so strengen Kontrollen und Peer-Review-Verfahren eigentlich keine genaue Inhaltsprüfung der eingereichten Artikel erfolgte. Diese Nonsense-Paper sind auf den ersten Blick weniger auffällig als man denkt. Software wie SCIgen („science generator“) erschaffen einen kompletten wissenschaftlichen Text mit dem üblichen Aufbau, der grammatikalisch korrekt ist, typische Fachwörter verwendet sowie komplette Schaubilder, Diagramme und sogar Quellenangeben enthält – nur eben ohne jeden Sinn. Für jeden Auftrag werden die Wörter per Zufall neu zusammengewürfelt und bestehen damit jeden Plagiatstest. Erst wenn man sich den Inhalt genauer ansieht und versucht, das Geschriebene zu verstehen, bemerkt man, dass es sich um kompletten Blödsinn handelt.
Der französische Computerwissenschaftler Cyril Labbé berichtete bereits 2012 in der Zeitschrift Scientometrics über 85 gefälschte Beiträge in Magazinen des US-Informatiker-Verbandes IEEE. Entdeckt hatte er die sinnlosen Beiträge mittels einer eigens programmierten Software, die wiederum Texte aufspürt, die von SCIgen entworfen wurden. „SCIgen benutzt immer die gleichen Wörter. Deshalb war ich mir sicher, dass man die Texte recht einfach finden könnte“, sagt er. Sein Programm vergleicht die Texte in wissenschaftlichen Datenbanken mit SCIgen-Artikeln und schlägt an, wenn die Überschneidungen groß genug sind. So wie bei den Texten von IEEE und Springer. Verbandsvertreter beteuerten nach der Entdeckung strengere Kontrollverfahren zu implementieren, doch bereits ein Jahr später entdeckte Labbé erneut Nonsense-Artikel.
Dazu sollte man sich erst einmal anschauen, woher der Trend ursprünglich stammt. Angefangen hat alles als ein Studentenstreich. Die drei Computerwissenschafts-Doktoranden Jeremy Stribling, Maxwell Krohn und Daniel Aguayo vom Massachusetts Institute of Technology (MIT) waren genervt von der überwältigenden Anzahl an Einladungen zu wissenschaftlichen Tagungen, die sie erhielten. Sie waren davon überzeugt, dass bei einigen Konferenzen keine nennenswerte Qualitätskontrolle stattfindet, allein deshalb, weil es durch die Fülle der Einsendungen kaum möglich ist. 2005 machten sie dann den Test: Sie reichten bei der World Multi-Conference on Systemics, Cybernetics and Informatics (WMSCI) eine Nonsens-Arbeit mittels ihrer eigens entwickelten Software SCIgen ein. Ihr Kauderwelsch-Beitrag wurde prompt akzeptiert. Weitere Versuche anderer Leute folgten, denn die Software SCIgen kann kostenlos heruntergeladen und genutzt werden. So konnten sich über 120 Nonsense-Artikel in den Datenbanken ansammeln. Die Fachzeitschrift Nature kontaktierte sogar einen Wissenschaftler, der als Co-Autor bei einer chinesischen Fake-Veröffentlichung zur „Methodik des Aufbaus von E-Commerce“ gelistet war. Dieser beteuerte jedoch, er habe nichts mit dem Artikel zu tun und wusste nicht einmal, dass er darin als Autor genannt wurde. Die anderen aufgelisteten Autoren hingegen antworteten erst gar nicht. Bis heute ist nicht bekannt, wie viele Quatsch-Veröffentlichungen mit SCIgen erstellt wurden – und noch unentdeckt in Datenbanken schlummern. Labbé konnte nur eine begrenzte Menge an Dokumenten prüfen. Es ist unklar, ob es sich dabei vielleicht nur um die Spitze des Eisbergs handelt.
Jeremy Stribling, einer der Erfinder von SCIgen, arbeitet heute bei einem Software-Unternehmen in Kalifornien. „Ich war mir gar nicht der Bedeutung des Problems bewusst, aber ich wusste natürlich, dass das passiert. Wir bekommen gelegentlich E-Mails von Leuten, die uns mitteilen, wenn SCIgen Paper auftauchen“, so Stribling. Ein schlechtes Gewissen habe er nicht: „Es vergnügt mich ohne Ende, dass Leute immer noch SCIgen benutzen, um die weniger qualitätsbewussten Verlage in der akademischen Veröffentlichungsindustrie bloßzustellen.“ Cyril Labbé versteht nicht, warum Leute Nonsense-Texte einreichen. Vielleicht aus Jux und Dollerei; vielleicht, um möglichst viele Konferenzbeiträge im Lebenslauf zu listen und so die eigene Karriere zu beflügeln. Die meisten Konferenzen, bei der Fake-Artikel entdeckt wurden, fanden in China statt. Die kontaktierten Autoren und Editoren fühlten sich jedoch entweder nicht zuständig oder gaben nie eine Stellungnahme ab. Labbé hat sogar eine eigene Website eingerichtet, auf der Benutzer testen können, ob Paper mit SCIgen erzeugt wurden. Doch noch einfacher ist es, wenn man sich einer simplen Google-Suche bedient und die Texte durchliest. „Mein Programm eignet sich für große Datenmengen, zum Testen Hunderter Aufsätze. Aber für einige Texte reicht es vollkommen, zwei Sätze des Artikels zu lesen“, sagt der Computerwissenschaftler. Für seine Studie und um auf die Größe des Problems aufmerksam zu machen, wurde der 41-jährige Franzose dann auch selbst zum Fälscher. Labbé erzeugte 102 Fake-Paper und erfand einen Autor namens Ike Antkare. Er zeigte, wie leicht es ist, diese Nonsense-Artikel in die Google Scholar Datenbank zu bringen und schaffte es sogar innerhalb kurzer Zeit, seinen erfundenen Autor Antkare zu dem 21. meist zitierterten Wissenschaftler der Welt zu machen, bevor er die Wissenschaftswelt über den Fake aufklärte.
Der Fall wirft grundsätzliche Fragen nach der Qualität der Peer-Review-Prozesse in Wissenschaftsverlagen auf, vor allem, da die gefälschten Artikel zu einem hohen Preis an ihre Leser verkauft wurden. Und das ist kein Einzelfall. 2013 konnte der Biologe und Wissenschaftsjournalist John Bohannon aufdecken, dass wissenschaftliche Artikel häufig ungelesen gedruckt oder online gestellt werden, indem er ein unsinniges Manuskript bei über 300 Verlagen einreichte, die von den Autoren Gebühren erheben. 60 Prozent der Zeitschriften akzeptierten Bohannons Beitrag – ohne dass ein Wissenschaftler je den Inhalt überprüft hätte. Und große Fachverlage und Herausgeber von Kongress-Zeitschriften haben kaum bessere Qualitätsprüfungen als Pay-to-publish-Anbieter. Dabei sollten eigentlich Arbeiten vor Veröffentlichungen von unabhängigen Experten auf dem entsprechenden Gebiet begutachtet werden – nicht nur auf die Form, sondern vor allem auch auf fachliche Qualität, Relevanz und Seriosität, ganz abgesehen von der Überprüfung der Autoren und Urheberrechte. Der Springer-Verlag zog aus der Affäre seine Konsequenzen: Er zog die Quatsch-Artikel zurück und versah sie entsprechend mit einem Fälschungshinweis. „Leider sind auch wissenschaftliche Publikationen nicht immun gegen Betrug oder Fehler“, hieß es in einem Statement an die Öffentlichkeit. Hubertus von Riedesel, Executive Vice President Publishing bei Springer, erklärte damals, dass man die Qualitätssicherung bei Tagungsbänden weitgehend den Veranstaltern überlasse. „Wir müssen ihnen Werkzeuge an die Hand geben und Arbeitsabläufe so organisieren, dass zukünftig keine SCIgen-generierten-Artikel mehr in unseren Publikationen einlaufen“, kommentierte er. Außerdem wandte sich der Springer-Verlag direkt an Cyril Labbé. Der französische Wissenschaftler solle einen Workshop für Mitarbeiter halten und außerdem an einem System mitarbeiten, das SCIgen generierte Aufsätze in Zukunft vor der Veröffentlichung entdeckt, so der Wunsch des Verlags. Seit letztem Jahr befindet sich „SCIdetect“ in der Anwendung, doch laut Springer wurde bisher kein Nonsense-Artikel entdeckt.
Medizinstudent Robert Kzasak hat auch schon von den Nonsense-Artikeln gehört: „Ich war sehr überrascht, dass es überhaupt möglich ist, sinnlose Paper bei einer Konferenz einzureichen – vor allem aber darüber, dass es so oft geklappt hat. Ich weiß, dass es im Internet auch entsprechende Websites gibt, wo man sich aus Spaß unglaublich wissenschaftlich klingende Artikel zusammenstellen kann, aber, dass dann wirklich Leute so was verwenden, um ihre Karriere zu fördern, finde ich ziemlich feige.“ „Es zeigt eine Kultur, die mir auch in der Uni häufig auffällt“, sagt Kzasak. „Dozenten, aber auch Medizinstudenten schmeißen mit Fachbegriffen um sich, verstehen aber häufig gar nicht richtig, was das bedeutet. Die anderen trauen sich nicht zu fragen, weil sie dann ja zugeben müssten, es auch nicht zu verstehen. Also bleibt der Fachbegriff im Raum stehen und klingt total wissenschaftlich und als ob derjenige es voll drauf hätte, aber eigentlich sagt er vielen nichts. Ich denke, dass so auch manche Fake-Artikel durch den Review-Prozess gerutscht sind.“ Auch Jana Wernsehengen, Münchner Assistenzärztin, hat schon ähnliche Erfahrungen gemacht: „Ich finde es traurig, dass solche Artikel durchgekommen sind, da die Arbeit der hart und ehrlich an ihren Artikeln arbeitenden Forscher dadurch entwertet wird. Eigentlich ist der Peer-Review-Prozess gut, doch wenn man genauer hinschaut, gibt es ein paar Stellen, an denen es Probleme gibt. Gerade in der Medizin gibt es eine Flut an zweit- und drittklassigen Konferenzen. Das führt zu einer Flut an zu erstellenden Gutachten. Als Folge ertrinken die Reviewer quasi in Gutachter-Anfragen und schauen dann eben nicht genau hin und winken Paper ungelesen durch. Wird ein Artikel abgelehnt, kann man ihn auch woanders noch Mal einreichen – bis er irgendwo akzeptiert wird. So können schnell unsaubere Arbeiten oder eben auch Nonsense-Schriften veröffentlicht werden.“
Cyril Labbé ist der Meinung, dass wir immer mehr in einen „Spamming Krieg“ geraten, der im Herzen der Wissenschaft anfängt. Forscher fühlen sich immer stärker genötigt, so viele Paper wie möglich in immer kürzerer Zeit zu publizieren. Der Druck wächst, Chef und Geldgeber wollen bahnbrechende Ergebnisse sehen und vor allem eine große Anzahl an Publikationen. So ist es auch kein Wunder, dass Nonsense-Software wie SCIgen eingesetzt wird, um schneller und besser als die anderen zu sein. „Unsere Artikel stammen überwiegend von echten, lebenden Asiaten, die das Programm genutzt haben, um ihre Veröffentlichungsrate zu erhöhen“, erklärt Hubertus von Riedesel vom Springer-Verlag. „Aufstrebende Nationen schaffen finanzielle Anreize für Wissenschaftler, die in guten Zeitschriften und Büchern publizieren. Das führt dann zu unethischen Praktiken wie dieser hier.“ Doch gleichzeitig arbeitet die Wissenschaft immer stärker daran, ihre Qualitätsstandards sicherzustellen. „Die kommen mit neuen Dingen und wir als Verlag müssen unser Immunsystem dagegen stärken und dem entgegenwirken“, erklärt von Riedesel. Das Problem: SCIgen ist bei weitem nicht die einzige Software für automatische Texterstellung. Es gibt bereits neue, die durch den entwickelten Such-Algorithmus von SCI-detect durchschlüpfen. Den Wettlauf zwischen Fälschungen und deren Entdeckung gibt es schon seit Jahrzehnten und er wird auch in Zukunft bestehen. Letztlich hilft wohl doch nur das banale Lesen einer Arbeit, um den Inhalt tatsächlich zu prüfen.