ChatGPT für Biologie: KI-Modell kann völlig neue Proteine "schreiben"

ChatGPT kann Texte erzeugen, ein neues KI-Modell überträgt dieses Prinzip auf Proteine. Trainiert mit Milliarden von Protein-Kombinationen können Forscher damit völlig neue Sequenzen, Strukturen und Funktionen schaffen, die so in der Natur nicht vorkommen.
Virus, Coronavirus, Corona, Covid-19, Coronakrise, SARS-CoV-2, Forscher, Pandemie, BioWare, Corona-Virus, Biologie, Zelle, Covid, Covid-2019, Covid19, Krank, Erkrankung, Pandemic, Biohacking, Viruszelle, Covid-19-Tracker, Grippe, SARS

Von ChatGPT zur Protein-KI: Revolution in der Biotechnik

Die aktuellen KI-Modelle sind exzellente Muster-Erkenner, darin liegt eine fast schon magische Superkraft, die sich auf sehr viele Bereiche übertragen lässt. Lange vor dem Aufkommen von Text-Erzeugern wie ChatGPT haben Forscher das Potenzial der Werkzeuge für die Untersuchung von Proteinen erkannt. Jetzt wurde in diesem Bereich ein neuer Durchbruch erreicht.

Wie eine Forschergruppe vermeldet, ist es gelungen, ein KI-Modell zu trainieren, dass neue Proteine, die nicht natürlich vorkommen, von Grund auf neu "schreiben" kann. Wie in der Vorveröffentlichung in der bioRxiv-Datenbank zu lesen ist, wurde das Modell "ESM3" mit 2,78 Milliarden Proteine trainiert. Zu jedem dieser Proteine wurden Informationen wie die Sequenz der Aminosäuren, die dreidimensionale Struktur und die Funktion erfasst. Insgesamt komme man so auf 98 Milliarden Parameter. ESM3: ChatGPT für BiologieDas neue, durch ESM3 erzeugte, grün fluoreszierende Protein In einem ersten Test wurden dann zufällige Teile der bekannten Proteine verdeckt und ESM3 mit der Aufgabe betraut, diese zu ergänzen - mit großem Erfolg. Wirklich beeindruckt zeigen sich die Forscher aber laut ihrer Beschreibung in einem Statement von der Fähigkeit des Modells, Proteine ganz neu zu schreiben.

Dafür nahmen sich die Forscher eine besondere Form der natürlich vorkommenden Proteine vor, die grün fluoreszierendes Protein (GFP) - deren Entdeckung hatte die Biowissenschaften revolutioniert und waren 2008 mit einem Nobelpreis bedacht worden. In dem Experiment brachte ESM3 ein neues GFP hervor, das nur 58 % seiner Sequenz mit natürlich vorkommenden fluoreszierenden Proteinen gemeinsam hat.

"Ausgehend von der Rate der Vielfalt der GFPs, die in der Natur vorkommen, schätzen wir, dass diese Generation eines neuen fluoreszierenden Proteins aus der Simulation über 500 Millionen Jahren Evolution entspricht", so die Forscher. Die Gruppe sieht in ESM3 einen ersten Ansatz, Biologie wirklich "programmierbar" zu machen.

Zusammenfassung
  • KI-Modell ESM3 trainiert mit 2,78 Milliarden Proteinen
  • Neue Proteine können von Grund auf neu geschrieben werden
  • ESM3 erfasst Sequenzen, Strukturen und Funktionen der Proteine
  • KI-Modell ergänzt erfolgreich verdeckte Teile bekannter Proteine
  • Forscher beeindruckt von der Neuschreibfähigkeit des Modells
  • Neues GFP hat nur 58 % Gemeinsamkeiten mit natürlichen Proteinen
  • Neues Protein entspricht "über 500 Millionen Jahren Evolution"

Siehe auch:
Jetzt einen Kommentar schreiben


Alle Kommentare zu dieser News anzeigen
Tipp einsenden
❤ WinFuture unterstützen
Sie wollen online einkaufen? Dann nutzen Sie bitte einen der folgenden Links, um WinFuture zu unterstützen: Vielen Dank!