Sonntag, 11. September 2022

Algoeurhythmie.



Eine automatisiert generierte Formel, die keinen Sinn ergibt
aus spektrum.de, 11. 9, 2022
                                                                                                        
zuJochen Ebmeiers Realien

In den Untiefen der Fake-Mathematik

von Florian Freistetter

Ich habe in meiner wissenschaftlichen Karriere ein paar Dutzend Fachartikel publiziert, die meisten davon zu Astronomie, ein paar auch mit deutlich mathematischer Ausrich-tung. Einen Artikel aus der reinen Mathematik habe ich aber nie publiziert. Kürzlich hat mir jedoch ein nettes Online-Projekt ohne großen Aufwand zu so einem Artikel verhol-fen.

Es heißt »Mathgen« und erstellt automatisiert Texte, die nach professioneller Mathematik aussehen – allerdings kompletter Quatsch sind. Der Algorithmus bastelt Sätze und Formeln nach simplen Regeln zusammen und füllt den Artikel nach dem Zufallsprinzip mit typischen Phrasen, die man auch in echten Texten finden kann.

»Mein« Artikel trägt den überraschenden wie viel versprechenden Titel »On Existence« und auf Seite 2 findet sich gleich die erste Formel: siehe oben!

Das sieht definitiv wie Mathematik aus. Ohne entsprechendes Vorwissen könnte man glauben, man hätte es hier mit einem sehr komplizierten Thema zu tun. Und ich will nicht einmal ausschließen, dass dieser Wirrwarr aus Symbolen in einem bestimmten Kontext nicht vielleicht doch irgendwie sinnvoll sein könnte. In diesem Fall ist er es aber definitiv nicht. Und wer Ahnung von Mathematik hat, sieht auf den ersten Blick, dass der automatisch erstellte Artikel absolut nichts mit echter Wissenschaft zu tun hat.

Warum sollte man sich dann überhaupt mit solchen Fake-Texten beschäftigen? Nun, erstens macht es einfach Spaß zu sehen, was der Algorithmus alles produziert. Es ist überraschend, wie oft man darin auf Sätze und Phrasen trifft, die genau so auch in echter Forschungsliteratur stehen könnten (was nicht unbedingt für die sprachliche Qualität vieler Fachartikel spricht). Und zweitens kann man mit solchen Texten die seriösen von den unseriösen Journalen unterscheiden. Am wissenschaftlichen Publikationssystem lässt sich viel kritisieren, doch zumindest wird dort durch den Peer-Review-Prozess einigermaßen sichergestellt, dass nur seriös durchgeführte Forschung veröffentlicht wird. Die eingereichten Artikel werden vor der Publikation von Expertinnen und Experten so gut wie möglich geprüft; Fehler müssen ausgebessert werden; wenn das nicht möglich ist, wird die Arbeit abgelehnt.

Alles nur des Geldes wegen

Es gibt aber jede Menge »Raubverlage«, die bloß vorgeben, seriöse wissenschaftliche Fachzeitschriften herauszugeben. Deren Geschäftsmodell besteht darin, gegen eine Gebühr einfach alles zu veröffentlichen, was sie zugesendet bekommen. In der Wissenschaft weiß man darüber natürlich Bescheid, und niemand tut seiner Karriere etwas Gutes, wenn er dort publiziert. Wenn es hingegen nur darum geht, die Öffentlichkeit abseits der wissenschaftlichen Community durch scheinbare Forschung zu beeindrucken, kann man sich mit solchen Raubverlagen schnell eine auf den ersten Blick eindrucksvolle Publikationsliste zulegen. Ob ein Journal die eingereichten Artikel prüft oder nicht, kann man mit Fake-Texten wie jenen von Mathgen leicht herausfinden. Da reicht selbst ein kurzer Blick auf den Artikel, um festzustellen, dass es sich um Unsinn handelt. Wird der Text trotzdem akzeptiert, kann man getrost davon ausgehen, dass der Verlag bloß am Geld interessiert ist.

Doch es kann auch Spaß machen, echte von falscher Wissenschaft zu unterscheiden. Im Online-Spiel »arXiv vs snarXiv« muss man anhand der Titel von Artikeln herausfinden, ob man es mit einer echten Forschungsarbeit aus der theoretischen Physik zu tun hat (die in der realen Datenbank »arXiv« veröffentlicht wurde) oder mit einem Quatsch-Titel, der von einem Algorithmus produziert wurde. Wenn man dort zum Beispiel zwischen »Spin-charge Separation for the SU(3) Gauge Theory« und »On the Thermodynamics/QCD3-Correspondence« wählen muss, wird es spannend...


Nota. - Ich war so kühn, die Definition von Wissenschaft mit einem einfachen Hauptsatz zu erschöpfen: Wissenschaft ist öffentliches Wissen

Problematisch daran ist nicht die Bestimmung von Wissen. Das wäre von vorn bis hinten ein logisches Problem, und strittig wäre letzten Endes nur, welche Definition in welcher Hinsicht die jeweils passende ist. Doch Öffentlichkeit ist ein historisches Datum. Es hat sie nicht immer gegeben, und erst, als sie sich ausbildete, wurde Wissenschaft möglich.

Der Haken ist nun der, dass nicht jeder, der sich in einer Öffentlichkeit aufhält, ipso facto Zugang zum öffentlichen Wissen hat. Einblick nehmen darf er wohl, das kann ihm keiner verwehren. Aber ob er etwas davon versteht, ist sein persönliches Problem und nicht das der Öffentlichkeit. Durch fleißiges Lernen könnte er es beheben, und wenn er das vor den jeweiligen Instanzen glaubhaft machen kann, wird man ihn auch mitreden lassen. Ob er dann auch überzeugen wird, unterliegt der allgemeinen Kritik. Fast alle Neuerer der Wissenschaften sind zu Anfang in der Community durchgefallen, und nur, wer kämpft, wird sich dort auf die Dauer behaupten; und da muss jeder selbst für sorgen.

An diesem elementaren Sachverhalt hat der 'Strukturwandel der Öffentlichkeit' nichts geändert. Geändert, explosionsartig vermehrt haben sich die Mittel der Täuschung - Mittel, sich selber zu täuschen, und Mittel, andere zu täuschen. Das wäre nicht weiter beunruhigend, wenn sich nicht auch die Anreize, die andern zu täuschen, und die Verlockung, sich selber täuschen zu lassen, ihrerseits explosionsartig vermehrt hätten. 

Das ist aber das Problem der Öffentlichkeiten und nicht eins der Wissenschaften; die können wieder nur ratgebend zur Seite stehen. Das Medium dafür ist Kritik und immer wieder nur Kritik.
JE

Keine Kommentare:

Kommentar veröffentlichen

Noumena.*

                                        zu Wissenschaftslehre - die fast vollendete Vernunftkritik    Ein Begriff, der uns in die intelli...