Mehr Daten in der Chemie

Berichte über negative Ergebnisse würden Planung von chemischen Synthesen verbessern

Unzählige chemische Experimente sind in Datenbanken zugänglich. Dennoch sind diese Daten nicht gut genug, um mithilfe von künstlicher Intelligenz (KI) und maschinellem Lernen bei neuen Synthesen Produktausbeuten vorherzusagen, hat ein Forschungsteam um Frank Glorius von der Westfälischen Wilhelms-Universität Münster herausgefunden. Wie in Angewandte Chemie berichtet, liegt die schlechte Datenqualität vor allem auch an der Neigung der Wissenschaftler, fehlgeschlagene Experimente nicht zu veröffentlichen. Bei der Vorhersage von Molekülstrukturen und Materialeigenschaften leisten maschinelle Lernwerkzeuge bereits sehr viel. Geht es aber konkret um die Produktausbeute bei einer Synthese, liefern KI-basierte Modelle nur ungenaue Vorhersagen.

Symbolbild Chemie-Labor – Foto © bdyczewski, pixabay.com

Als Grund für das Scheitern identifizierte das Glorius-Team die Qualität der Daten, auf welche die KI zurückgreift. „Die Vorhersage von Reaktionsausbeuten, also der Reaktivität, ist viel herausfordernder als die Vorhersage von molekularen Eigenschaften. Ausgangsstoffe, Hilfsstoffe, Mengen, Bedingungen, Ausführung des Experiments – sie alle bestimmen die Ausbeute, was bedeutet, dass dieses Problem sehr datenintensiv wird,“ erklärt Glorius, Korrespondenzautor der Studie. Trotz der riesigen Menge an verfügbarer Literatur reichten die Daten also nicht aus, um Ausbeuten korrekt vorherzusagen.

Das Problem liege dabei häufig nicht an zu wenig berichteten Experimenten, sondern an einer Datenschieflage. Drei mögliche Ursachen identifizierten die Forschenden: Zum einen unterliegen die Ergebnisse von chemischen Synthesen grundsätzlich experimentellen Fehlern. Zweitens treffen Wissenschaftler bei ihrer Reaktionsplanung mehr oder weniger bewusst eine Vorauswahl, die auf persönlicher Erfahrung und Vertrauen in etablierte Verfahren beruht. Und drittens melden sie fehlgeschlagene Reaktionen weniger häufig als erfolgreiche – vermeintlich führen nur Reaktionen mit einem positiven Ergebnis zu einem wissenschaftlichen Fortschritt.

Um herauszufinden, welcher der drei Faktoren den größten Einfluss hat, veränderten Glorius und sein Team den Datensatz für vier gängige (und daher datenreiche) organische Reaktionen. So erhöhten sie künstlich den experimentellen Fehler, reduzierten die Daten auf eine noch kleinere Vorauswahl, oder sie nahmen aus dem Datensatz negative Ergebnisse heraus. Am wenigsten Einfluss auf das Modell hatte der experimentelle Fehler, sehr groß war dagegen der Einfluss der negativen Ergebnisse, heißt es in der Studie.

Wissenschaftler sollten also unbedingt ermutigt werden, fehlgeschlagene Ergebnisse ebenfalls zu berichten, schreibt das Team. Damit verbessere sich die Datenlage, und KI-basierte maschinelle Lernmodelle können die Arbeit beschleunigen und effizienter machen. „Maschinelles Lernen wird die Effizienz in der (molekularen) Chemie dramatisch verbessern. Chemiker kommen mit weniger Reaktionen aus, um ein bestimmtes Ziel zu erreichen wie zum Beispiel optimale Ausbeuten. Dadurch werden chemische Prozesse – und die Welt – nachhaltiger,“ bekräftigt Glorius.

Über den Autor

Frank Glorius hat eine ordentliche Professur für organische Chemie an der Westfälischen Wilhelms-Universität Münster inne. Der Forschungsschwerpunkt der Gruppe liegt auf der Entwicklung und Anwendung von neuen katalytischen Methoden im Bereich der organischen Chemie und dem Design von funktionellen Molekülen in vielfältigen Bereichen wie der Biologie und den Materialwissenschaften.

Janssen-Preis für Frank Glorius

Chemiker erhält Auszeichnung für herausragende Leistungen auf dem Gebiet der organischen Synthese – Prof. Frank Glorius erhält den Janssen-Preis für Kreativität in der organischen Synthese („Janssen Prize for Creativity in Organic Synthesis“). Die mit 20.000 Euro dotierte Auszeichnung würdigt international herausragende Leistungen auf dem Forschungsgebiet der organischen Synthese, die für die Entwicklung neuer Arzneimittel von besonderer Bedeutung sind. Frank Glorius ist ein international führender und besonders innovativer Wissenschaftler auf dem Gebiet der organischen Synthese und Katalyse, so die Begründung der Jury.

->Quelle: onlinelibrary.wiley.com/202212press