Image
Professor Fabian Jirasek in seinem Forschungslabor an der RPTU.
Owner
© RPTU, Thomas Koziel
Smart networks for sustainable processes
Fabian Jirasek uses artificial intelligence to predict the properties of pure substances and mixtures. The goal is to help the industry develop new active ingredients and chemicals more sustainably in the future.
Fabian Jirasek hilft der Industrie, neue Produktionsprozesse zu entwickeln, indem er Methoden des Maschinellen Lernens mit physikalischen Methoden kombiniert.

Auf der Suche nach neuen Stoffen: KI bringt die Industrie voran

Es sind unruhige Zeiten: Klimaerwärmung, steigende Energiepreise. Dazu kommt die Abhängigkeit von Rohstoffimporten. Unsere Industrien müssen auf diese Herausforderungen reagieren und ihre Produktionsweise ändern. Fabian Jirasek will ihnen dabei helfen – mit Maschinellem Lernen.

Die Thermodynamik befasst sich mit den Eigenschaften von Stoffen und Stoffmischungen. Deren "Verhalten" wird besonders von den Wechselwirkungen zwischen den Molekülen bestimmt. Das ist auch bei der Löslichkeit so, einer Eigenschaft, die angibt, wie gut sich Stoffe in einem bestimmten Lösungsmittel lösen lassen. Etwas unwissenschaftlich ausgedrückt: Wie sehr sich der Stoff und das Lösungsmittel mögen. Es gibt bei Molekülen so etwas wie „Sympathie“ und „Antipathie“. Wasser und Ameisensäure zum Beispiel mögen sich – sie sind beliebig ineinander löslich und mischen sich gerne. In Öl löst sich Wasser dagegen nur in ganz geringen Konzentrationen – die beiden bleiben lieber unter sich.

Stoffeigenschaften wie die Löslichkeit spielen bei ganz vielen Prozessen in Natur und Technik eine große Rolle. Von ihnen hängt zum Beispiel ab, wie sich Chemikalien in der Umwelt verteilen und in Gewässern, Sedimenten oder Organismen anreichern. „Auch bei industriellen Prozessen wie der Herstellung von Wirkstoffen, Farbstoffen oder Feinchemikalien kommt es auf die Stoffeigenschaften an“, so Fabian Jirasek, Leiter des Lehrstuhls für Thermodynamik am Fachbereich Maschinenbau und Verfahrenstechnik. Denn die Produkte liegen zunächst in Mischungen vor, die noch viele unerwünschte Komponenten enthalten: Unverbrauchte Rohstoffe, Verunreinigungen, Hilfsstoffe oder Katalysatoren. Daher braucht es den Prozess der Aufreinigung, um das eigentliche Endprodukt von allem anderen zu trennen.

Millionen und Abermillionen Möglichkeiten

Die industriellen Trennverfahren basieren fast alle auf den Wechselwirkungen der Moleküle. „Bei der Extraktion wird mit einem Extraktionsmittel zum Beispiel das eigentliche Produkt aus einer Mischung herausgezogen, während die unerwünschten Bestandteile zurückbleiben. Das klappt nur, wenn die Löslichkeit des Produkts im Extraktionsmittel deutlich größer ist als die der anderen Stoffe.“ Auch bei einem anderen Trennverfahren, der Destillation, hängt vieles davon ab, wie die Stoffe wechselwirken, ob sie sich mögen oder nicht, erklärt der Forscher. Dabei wird eine Mischung zum Sieden gebracht, dann verteilen sich die einzelnen Stoffe, aus denen die Mischung besteht, zwischen der Dampf- und der Flüssigphase. Bekanntes Beispiel: Das Schnapsbrennen. Hier reichert sich das flüchtigere Ethanol in der Dampfphase an und wird aufkonzentriert, während das Wasser eher in der Flüssigkeit bleibt. Bei welcher Temperatur die Mischung siedet und wie sehr sich die Stoffe in den einzelnen Phasen anreichern, all das beschreibt die Thermodynamik.

Die Kenntnis der Stoffeigenschaften ist also Grundvoraussetzung für effiziente Produktionsprozesse. „Jedoch gibt es derzeit über 100 Millionen bekannte Stoffe und noch viel mehr mögliche Mischungen“, stellt Jirasek fest. Hinzu kommt, dass die Eigenschaften von weiteren Faktoren abhängen, wie der Temperatur, dem Druck oder den Konzentrationen in einer Mischung. „Am liebsten würden wir alle Stoffe, Mischungen und Eigenschaften in Laborexperimenten untersuchen, aber das würde viel zu lange dauern.“ Schon die Ermittlung einer einzigen Eigenschaft einer einzigen Stoffmischung kann einen ganzen Tag in Anspruch nehmen. Und teuer ist die Sache auch: Solche Messungen kosten gerne mal mehrere Tausend Euro. „Unsere Möglichkeiten sind also begrenzt. Wir können immer nur einen Bruchteil der möglichen Stoffe und Mischungen in Experimenten untersuchen.“

Daher arbeitet Jirasek mit Künstlicher Intelligenz. Er lässt sie die Eigenschaften von Reinstoffen und Mischungen vorhersagen. Bei welchen Temperaturen sie sieden, wie löslich sie ineinander sind und vieles mehr. „Wenn wir verlässliche Vorhersagedaten haben, müssen wir auch nicht mehr alle in Frage kommenden Stoffe und Mischungen im Experiment untersuchen. Wir können eine Auswahl treffen und uns auf die beschränken, die laut KI am vielversprechendsten sind. Das spart Zeit und Geld.“

Hybrid ist besser als klassisch oder KI alleine

Ganz neu ist das nicht. Thermodynamische Vorhersagemethoden, die auf physikalischen Theorien basieren, gibt es schon lange. Und bei einfacheren Fällen funktionieren sie auch. Beispiel: Die Siedetemperatur eines Stoffes bei einem bestimmten Druck ist bekannt und soll nun bei einem anderen Druck vorhergesagt werden. Schwieriger wird es, wenn für einen Stoff oder eine Stoffmischung gar keine Messdaten vorliegen. Hierfür gibt es zwar sogenannte Gruppenbeitragsmethoden, die Moleküle vereinfachend in molekulare Bausteine zerlegen und so Vorhersagen auch für neue Moleküle treffen. Aber deren Genauigkeit lässt oft zu wünschen übrig. In vielen Fällen fehlen auch die richtigen Bausteine, um den Stoff oder die Mischung zu beschreiben.

Deswegen entwickelt Jirasek neuartige hybride Modelle, indem er Methoden aus dem Maschinelles Lernen (ML), einem Teilgebiet der KI, mit physikalischem Wissen kombiniert. Jirasek verfolgt dabei unterschiedliche Strategien. Bei einer werden ML-Modelle in ein physikalisches Modell „eingepflanzt“ und darauf trainiert, die Parameter des physikalischen Modells vorherzusagen. „Diese Strategie hat den Vorteil, dass die Industrie mit den physikalischen Modellen bereits vertraut ist. Gleichzeitig können wir den Anwendungsbereich der Modelle dank KI vergrößern, zum Beispiel Vorhersagen für ganz neue Stoffklassen ermöglichen. Und dabei sogar die Qualität der Ergebnisse deutlich verbessern."

Noch spannender findet Jirasek seine zweite „Hybridisierungsstrategie“, bei der es gerade umgekehrt läuft: Hier wird das physikalische Wissen in die Architektur von künstlichen neuronalen Netzen implantiert. Neuronale Netze lösen Probleme ähnlich wie es unser Gehirn tut. Sie werden mit Daten trainiert, lernen damit und werden mit der Zeit immer besser darin, bestimmte Aufgaben zu lösen. Der Aufbau eines solchen Netzes: Es gibt eine Input-Schicht, die die Daten aufnimmt, und eine Output-Schicht, die das Ergebnis ausspuckt. Und dazwischen mehrere miteinander verbundene Schichten, die die eingegebenen Daten verarbeiten.

Die KI hat sich an die Regeln zu halten

„Die Netze sind so flexibel, dass sie im Grunde das Verhalten beliebiger Stoffe und Mischungen beschreiben können“, sagt Jirasek. „Dieser Vorteil ist aber zugleich auch ihr größter Nachteil. Wegen ihrer Flexibilität geben die Netze gerne mal unsinnige oder unphysikalische Vorhersagen aus." Zum Beispiel, dass die Siedetemperatur eines Reinstoffs bei zunehmendem Druck sinkt - in Wahrheit ist es umgekehrt. Auch bei der Vorhersage des Verhaltens von Mischungen haben neuronale Netze Probleme, zum Beispiel mit der sogenannten Permutationsinvarianz. Für uns Menschen ist klar, dass eine Mischung „Ethanol + Wasser“ das gleiche ist wie eine Mischung „Wasser + Ethanol“, solange wir nichts am Mischungsverhältnis ändern. Neuronale Netze sagen für die beiden Fälle aber ganz unterschiedliche Eigenschaften vorher, je nachdem in welcher Reihenfolge sie den Input bekommen, ob zuerst den Input „Wasser“ oder zuerst den Input „Ethanol“.

Deswegen zwingt Jirasek die neuronalen Netze, tatsächlich nur physikalisch sinnvolle Vorhersagen über das Verhalten und die Eigenschaften von Stoffen und Mischungen zu treffen. Dazu baut er detailliertes Wissen zu physikalischen Gesetzen und Randbedingungen in die Netzwerkarchitektur ein. Zum Beispiel, dass die Reihenfolge der Stoffe einer Mischung keinen Einfluss aufs Ergebnis haben darf. So werden die neuronalen Netze sozusagen diszipliniert.

Als Input bekommen Jiraseks Netze die Molekülstruktur der Stoffe oder Stoffmischungen sowie Zustandsgrößen wie Temperatur, Druck, Konzentration. Die Molekülstruktur lässt sich auf unterschiedliche Art darstellen, zwei Darstellungsformen sind besonders interessant. Zum einen molekulare Graphen, in denen die gesamte Information zur Molekülstruktur steckt. Sie bestehen aus einer Reihe von Knoten und Kanten, die die Knoten miteinander verbinden. Bei Molekülen sind die Knoten die Atome und die Kanten die Bindungen zwischen den Atomen. Knoten und Kanten haben jeweils bestimmte Eigenschaften, zum Beispiel repräsentiert jeder Knoten eine bestimmte Atomart und eine Kante kann eine Einfach-, Doppel- oder Dreifachbindung sein.

Atomare Nachbarschaftsbeziehungen

Die Graphen dienen speziellen neuronalen Netzen, den Graph Neural Networks (GNNs), als Input. Bei GNNs verläuft die Verarbeitung über mehrere Schichten, sogenannte Graph Convolutional Layers. Die Information wird dabei von einem Knoten, also einem Atom, zum nächsten geschickt, um alle Knoten über ihre „Nachbarschaften“ zu informieren. „Ein Molekül ist ja mehr als die Summe seiner Atome“, so Jirasek. „Es ist wichtig, welches Atom neben welchem liegt und wie diese jeweils verbunden sind. Im Training lernt das Modell, wie sich diese Nachbarschaften auf unterschiedliche Stoffeigenschaften auswirken. Zum Beispiel auf die Löslichkeit.“ 

Die Molekülstruktur lässt sich auch als Zeichenkette ins neuronale Netz einspeisen. Jirasek benutzt dafür SMILES (Simplified Molecular Input Line Entry System). Hier ist jedes Molekül in Form eines – je nach Komplexität des Moleküls kurzen oder langen – Textstrings dargestellt. Zum Einsatz kommt dabei ein Sprachmodell, das so ähnlich funktioniert wie ChatGPT, aber nicht die Semantik von Wörtern lernt, sondern was bestimmte Strukturen im Molekül für die Stoffeigenschaften bedeuten. Beide Netzwerk-Varianten funktionieren sehr gut. Sie lernen, den Zusammenhang zwischen der Struktur des Moleküls und seinen Eigenschaften zu erkennen. So können sie nach dem Training für beliebige Moleküle Vorhersagen für bisher nicht gemessene Eigenschaften treffen.

Ein Durchbruch gelang Jirasek und seinem Team mit dem hybriden Modell HANNA (Hard-Constraint Neural Network for Consistent Activity Coefficient Prediction). Es ist eine Weltneuheit: Das erste neuronale Netz, das Aktivitätskoeffizienten vorhersagen kann und dabei garantiert alle Regeln der Physik befolgt. Hinter dem Fachbegriff Aktivitätskoeffizient verbirgt sich nichts anderes als ein Maß dafür, wie wohl sich ein Stoff in einer Mischung fühlt. Eine Schlüsselgröße in der Thermodynamik von Mischungen, die direkt mit messbaren Stoffeigenschaften wie der Löslichkeit zusammenhängt. Die Vorhersagen von HANNA sind dabei genauer als die aller bisherigen Modelle, stellt Jirasek fest.

Neue Stoffe für schwere Zeiten

Hybride Modelle liefern also verlässlichere und qualitativ bessere Vorhersagen als reine ML-Methoden. Was aber nicht heißt, dass die KI irgendwann Labortests komplett ersetzt. „Experimente bleiben absolut wichtig, denn wir brauchen ja zuverlässige Daten, um gute Modelle zu trainieren. Daran ändert auch die KI nichts. Sie hilft uns aber, das Beste aus den Daten zu machen."

Welche Bedeutung seine Forschung hat, erklärt Jirasek so: Es gibt die Klimaerwärmung und steigende Energiepreise. Es gibt Abhängigkeiten von Rohstoffimporten aus autokratischen und politisch instabilen Ländern, bei zunehmenden globalen politische Spannungen. „Daher ist es höchste Zeit für die Transformation unserer wichtigen Industrien, etwa Chemie und Pharma. Wir brauchen bessere Prozesse, die energieeffizienter sind und auf erneuerbaren Rohstoffen basieren. Dafür müssen wir auch neue Stoffe und Mischungen in Betracht ziehen - und das geht nur, wenn wir die Stoffeigenschaften kennen.“ Da sich diese nicht alle einzeln untersuchen lassen, sind zuverlässige Vorhersagemethoden wichtiger denn je. Sie helfen den Industrien, die kommenden großen Herausforderungen zu bewältigen.

212
Fabian Jirasek ist Professor für Thermodynamik an der RPTU.
Prof. Dr.
Fabian
Jirasek
Professor für Thermodynamik
„Ich möchte helfen, unsere Industrie unabhängiger, nachhaltiger und zukunftsfähiger zu machen – mit Hilfe der Thermodynamik und Künstlicher Intelligenz"
Prof. Dr. Fabian Jirasek leitet den Lehrstuhl für Thermodynamik und die Emmy-Noether-Nachwuchsgruppe "Hybrid Thermodynamic Models" der Deutschen Forschungsgemeinschaft. Seine Forschungsthemen reichen von der Vorhersage von Stoffeigenschaften über Design und Optimierung von Produktionsprozessen bis hin zur Fehlererkennung in chemischen Anlagen. Sein Fokus liegt dabei jeweils auf der Entwicklung hybrider Modelle durch Integration von Machine-Learning Methoden mit physikalischem Wissen.
RESEARCHER PROFILE ON RPTU.DE

Du willst tiefer ins Thema eintauchen?

Aufgeschlagenes Buch mit Brille

Dann stöbere gerne in der Auswahl an wissenschaftlichen Publikationen:

F. Jirasek, H. Hasse: Combining Machine Learning with Physical Knowledge in Thermodynamic Modeling of Fluid Mixtures. Annual Review of Chemical and Biomolecular Engineering 14 (2023) 31-51.
>> ZUM PAPER

T. Specht, M. Nagda, S. Fellenz, S. Mandt, H. Hasse, F. Jirasek: HANNA: Hard-constraint Neural Network for Consistent Activity Coefficient Prediction. Chemical Science 15 (2024) 19777-19786.
>> ZUR VERÖFFENTLICHUNG

N. Hayer, T. Wendel, S. Mandt, H. Hasse, F. Jirasek: Advancing Thermodynamic Group-contribution Methods by Machine Learning: UNIFAC 2.0. Chemical Engineering Journal 504 (2025) 158667.
>> ZUM ARTIKEL

//
by Andreas Lorenz-Meyer
Andreas Lorenz-Meyer is a freelance journalist und lives in the Palatinate. He writes for specialised newspapers, the magazines of universities and research institutions as well as daily newspapers in Germany and Switzerland. His main topics in the field of science include artificial intelligence, biology and renewable energies. Further subject areas: Energy industry and the hotel and tourism industry.

These topics might also interest you: