Bekanntermaßen birgt künstliche Intelligenz (KI) sowohl Chancen als auch Risiken für die Veröffentlichung seriöser wissenschaftlicher Arbeiten. Datenverfälschung und -halluzination, gefälschte Ergebnisse und KI-generierte Texte, die plausibel klingen, aber irreführend sind, können in die Fachliteratur gelangen, wenn sie im Peer-Review-Verfahren nicht als solche Produkte erkannt werden.
Hinzu kommen neuerdings Bedenken, dass der Missbrauch leicht zugänglicher öffentlicher Daten zur schnellen Veröffentlichung einer großen Menge minderwertiger Artikel führen kann, eine Praxis, die mitunter mit unseriösen wissenschaftlichen Publikationen in Verbindung gebracht wird. Solche Publikationen wenden oft fragwürdige statistische Methoden an (z.B. „P-Hacking“), um schnell Ergebnisse zu generieren, die zwar neuartig erscheinen, aber falsch oder irreführend sein können.
Wenn zum Beispiel Zufalls-Signifikanzen oder Korrelationen ohne Kausalitätsbeweis, ohne Untersuchung möglicher Hintergrundvariablen publiziert werden, können solche irreführenden Ergebnisse in der veröffentlichten Literatur Ärzte und Patienten beeinflussen und möglicherweise zu Problemen führen, wenn (soziale) Medien das Thema verbreiten und Patienten aufgrund einer unrichtigen Schlussfolgerung reagieren.
Eine der bekanntesten und wichtigsten öffentlich zugänglichen Datenbanken ist der National Health and Nutrition Examination Survey (NHANES) mit Ernährungs- und Gesundheitsdaten von mehr als 130.000 Menschen. Dass Daten, die aus solchen Studien kommen nicht immer hundertprozentig verlässlich und selten validierbar sind, ist schon seit längerem bekannt[1]. Neben dem unbestrittenen Wert für Real World Evidence (RWE) erlaubt allerdings die Fülle solcher Datenbanken es auch gewissenlosen Akteuren, die Daten auf unzählige Arten zu testen, um nach zufälligen Korrelationen zu suchen, die wie statistische Signale aussehen, in Wirklichkeit aber nur Hintergrundrauschen sind. Zum Beispiel wurden von den Medien Berichte verbreitet, die anhand einer retrospektiven Studie von NHANES Daten einen Zusammenhang zwischen Depression und Vitamin-D-Spiegel bei Frauen unter 35 Jahren fanden[2].
Nunmehr haben zwei große Verlage, PLOS und Frontiers, damit begonnen, die überwiegende Mehrheit der auf öffentlichen Datensätzen basierenden Artikel automatisch abzulehnen, nachdem bekannt wurde, dass solche Datensätze auch genutzt werden, um bedeutungslose wissenschaftliche Arbeiten zu veröffentlichen[3]. Die Herausgeber der PLOS-Journals werden Arbeiten, die auf o.g. Datensätzen basieren, automatisch ablehnen, es sei denn, die Autoren haben zusätzliche Untersuchungen durchgeführt, die zeigen, dass ihre Ergebnisse robust sind. Andere Verlage folgen diesem Beispiel. Das Journal of Global Health gab im Juli bekannt, dass Autoren, die offene Datensätze verwenden – darunter die Global Burden of Disease-Studie und öffentlich zugängliche Daten der UK Biobank sowie NHANES –, nun eine umfangreiche Checkliste ausfüllen müssen.
Einige Wissenschaftler befürchten jedoch, dass die Regelung unnötige Hürden für echte Forschung, die der öffentlichen Gesundheit zugutekommen kann, schaffen könnte. Dienen doch solche öffentlich zugängliche Datensammlungen, zusammen mit kommerziell erhältlichen Real World Daten (RWD) der „Demokratisierung“ der Forschung, indem Wissenschaftler Zugang zu wichtigen Daten erhalten können, ohne in dem Elfenbeinturm einer anerkannten Universität mit eigenen Laboren oder großen statistischen epidemiologischen Abteilungen arbeiten zu müssen. Eine Beschränkung würde die Arbeit von unabhängigen Forschern oder Wissenschaftlern an Institutionen mit begrenzten Ressourcen erschweren.
Die Frage ist also, ob es tatsächlich im Wesentlichen um den Schutz der Qualität veröffentlichter Wissenschaft geht oder mehr um den Schutz der universitären Pfründe vor den Ergebnissen unabhängiger Forscher.
Neue Technologien schaffen eben oft unbegrenzte Möglichkeiten, und der angemessene Umgang mit Ihnen muss häufig erst erlernt werden. In diesem Fall geht es um den Peer Review in den Redaktionen der wissenschaftlichen Zeitschriften, aber auch um den verantwortungsvollen vernünftigen Konsum von Informationen durch die Leser.
„Die Verantwortung bleibt letztendlich beim Peer Review. Schließlich wird keine pauschale Regelung funktionieren, wenn die Redakteure ihre Arbeit vernachlässigen“[4].
[1] Ernährung: Sind alle Studien Käse? DocCheck 21.03.2025
[2] Ma J, Li K. Negative Association between Serum Vitamin D Levels and Depression in a Young Adult US Population: A Cross-Sectional Study of NHANES 2007-2018. Nutrients. 2023 Jun 29;15(13):2947. doi: 10.3390/nu15132947. PMID: 37447273; PMCID: PMC10346331.
[3] Suchak T, Aliu AE, Harrison C, Zwiggelaar R, Geifman N, Spick M. Explosion of formulaic research articles, including inappropriate study designs and false discoveries, based on the NHANES US national health database. PLoS Biol. 2025 May 8;23(5):e3003152. doi: 10.1371/journal.pbio.3003152. PMID: 40338847; PMCID: PMC12061153.
[4] Matt Spick, University of Surrey, Associate editor, Scientific Reports