ChatGPT kann Texte erzeugen, ein neues KI-Modell überträgt dieses Prinzip auf Proteine. Trainiert mit Milliarden von Protein-Kombinationen können Forscher damit völlig neue Sequenzen, Strukturen und Funktionen schaffen, die so in der Natur nicht vorkommen.

Von ChatGPT zur Protein-KI: Revolution in der Biotechnik

Die aktuellen KI-Modelle sind exzellente Muster-Erkenner, darin liegt eine fast schon magische Superkraft, die sich auf sehr viele Bereiche übertragen lässt. Lange vor dem Aufkommen von Text-Erzeugern wie ChatGPT haben Forscher das Potenzial der Werkzeuge für die Untersuchung von Proteinen erkannt. Jetzt wurde in diesem Bereich ein neuer Durchbruch erreicht.Wie eine Forschergruppe vermeldet, ist es gelungen, ein KI-Modell zu trainieren, dass neue Proteine, die nicht natürlich vorkommen, von Grund auf neu "schreiben" kann. Wie in der Vorveröffentlichung in der bioRxiv-Datenbank zu lesen ist, wurde das Modell "ESM3" mit 2,78 Milliarden Proteine trainiert. Zu jedem dieser Proteine wurden Informationen wie die Sequenz der Aminosäuren, die dreidimensionale Struktur und die Funktion erfasst. Insgesamt komme man so auf 98 Milliarden Parameter.In einem ersten Test wurden dann zufällige Teile der bekannten Proteine verdeckt und ESM3 mit der Aufgabe betraut, diese zu ergänzen - mit großem Erfolg. Wirklich beeindruckt zeigen sich die Forscher aber laut ihrer Beschreibung in einem Statement von der Fähigkeit des Modells, Proteine ganz neu zu schreiben.Dafür nahmen sich die Forscher eine besondere Form der natürlich vorkommenden Proteine vor, die grün fluoreszierendes Protein (GFP) - deren Entdeckung hatte die Biowissenschaften revolutioniert und waren 2008 mit einem Nobelpreis bedacht worden. In dem Experiment brachte ESM3 ein neues GFP hervor, das nur 58 % seiner Sequenz mit natürlich vorkommenden fluoreszierenden Proteinen gemeinsam hat."Ausgehend von der Rate der Vielfalt der GFPs, die in der Natur vorkommen, schätzen wir, dass diese Generation eines neuen fluoreszierenden Proteins aus der Simulation über 500 Millionen Jahren Evolution entspricht", so die Forscher. Die Gruppe sieht in ESM3 einen ersten Ansatz, Biologie wirklich "programmierbar" zu machen.