FAZ 05.03.2026
14:27 Uhr

Paper Mills: Ein Spamfilter gegen den Forschungsbetrug


Minderwertige und gefälschte Studien aus Paper-Mills gefährden das Vertrauen in die Wissenschaft. Australische Forscher wollen dem Betrug mit einem Spamfilter beikommen.

Paper Mills: Ein Spamfilter gegen den Forschungsbetrug

Paper Mills sind die Schrottfabriken des wissenschaftlichen Publikationssystems. Die oft in China, Iran oder Indien angesiedelten Unternehmen überspülen die Wissenschaft mit minderwertigen oder gefälschten Studien, die sie gegen Geld, oft mehrere Tausend Dollar, ins Publikationssystem einschleusen. Eine Studie identifizierte kürzlich regelrechte Schleuser-Kartelle. Selten schaffen es die Fakes in Top-Journale, aber auch Publikationen in zweitklassigen Zeitschriften machen sich im akademischen Lebenslauf bezahlt. Forscher der australischen Queensland University of Technology stellen im „British Medical Journal“ nun einen KI-Filter vor, der dem Betrug Einhalt gebieten soll. Das Team um Adrian Barnett fütterte ein Sprachmodell mit 2200 zurückgezogenen Studien aus der Krebsforschung, die mit großer Wahrscheinlichkeit in Paper Mills entstanden sind. Entnommen waren sie der Datenbank von Retraction Watch, einem Projekt, das zurückgezogene Publikationen sammelt. Die Forscher gehen davon aus, dass gefälschte Studien leicht an Sprachmustern zu erkennen sind. Indus­triell gefertigte Papiere greifen oft auf Satzbausteine, fabrizierte Daten und manipulierte Bilder zurück. Es fehlt ihnen an argumentativer Schlüssigkeit, lexikalischer Vielfalt und inhaltlicher Kohärenz. Autorengruppen werden willkürlich zusammengestellt. Häufig wird auf andere Paper-Mill-Studien verwiesen. Bei einem Test mit erwiesen gefälschten und echten Studien kam der neue KI-Filter auf eine Trefferquote von mehr als neunzig Prozent. Die Forscher wendeten den Algorithmus daraufhin auf 2,6 Millionen Studien aus der Krebsforschung an. Knapp zehn Prozent oder 260.000 Studien stellten sich mit hoher Wahrscheinlichkeit als Fälschungen heraus. Mit großer Mehrheit (170.000) stammen die Fakes aus chinesischen Institutionen. Wenn die Zahlen stimmen, dann sind 36 Prozent der chinesischen Studien zur Krebsforschung gefälscht. Hohe Dunkelziffer Stimmen sie? Die Forscher halten das für sehr wahrscheinlich, konzedieren aber eine Restunsicherheit. Es sei auch nicht auszuschließen, dass die KI eigene verzerrende Muster bei der Fake-Detektion ausbilde. Drei Zeitschriften benutzen den Spamfilter nach Angaben der Forscher schon, um Gutachter auf verdächtige Studien hinzuweisen. Die endgültige Prüfung muss aber weiter von Menschen vorgenommen werden. Die Untersuchung bestätigte auch das dramatische Wachstum des Phänomens. Im Analysezeitraum zwischen 2000 und 2022 wuchs die Zahl der vermuteten Fälschungen von ein auf sechzehn Prozent. Die Fakes fanden sich in Tausenden Journalen, darunter auch solchen von großen Verlagen wie Springer Nature und Elsevier mit hohem Impact-Factor, dort allerdings seltener. Das Fälschungsproblem sei in der Krebsforschung viel größer als angenommen, resümiert Barnett. Er führt es auf den besonders starken Publikationsdruck in dem Forschungsgebiet zurück. Sein Team will den Filter nun auf weitere Forschungsfelder anwenden. Experten gehen davon aus, dass in den vergangenen zwanzig Jahren mehr als vierhunderttausend Paper-Mill-Studien in den Publikationskreislauf eingeführt wurden. Das Problem wurde einer breiteren Öffentlichkeit bekannt, als der Großverlag Wiley nach dem Aufkauf des ägyptischen Verlags Hindawi im Jahr 2021 auf mehrere Tausend verdächtige Studien stieß und neunzehn Journale einstellte. Diese Fälschungen verzerren den akademischen Wettbewerb, unterminieren das Vertrauen in die Wissenschaft und gefährden, wie in der Krebsforschung, Menschenleben. Eine Studie unter der Leitung von Bernhard Sabel schätzt die Anzahl der Schrottpapiere in der Biomedizin auf 5,8 Prozent. Wobei dieser Schätzwert weit über der Zahl der zurückgezogenen Papiere liegt. Es bleibt das Problem, dass die Aufdeckung von Forschungsbetrug in den Händen weniger Wissenschaftler liegt, die meist auf eigene Initiative tätig sind. Die Verlage haben die Lücke erkannt, es dauert jedoch oft sehr lang, bis Fälschungen zweifelsfrei identifiziert und aus den Datenbanken entfernt werden. Auch wo Menschen diese Arbeit übernehmen, ist es nicht sicher, dass eine Fälschung erkannt wird. Der neue Spamfilter kann die Aufdeckung beschleunigen. Es ist aber weiter mit einer hohen Dunkelziffer zu rechnen.