MIT entwickelt FrameDiff, ein KI-gesteuertes Tool, das neue Proteinstrukturen kreiert, um die Arzneimittelentwicklung und Gentherapie zu verbessern.MIT entwickelt FrameDiff, ein KI-gesteuertes Tool, das neue Proteinstrukturen kreiert, um die Arzneimittelentwicklung und Gentherapie zu verbessern.

Entwickler aus dem MIT schaffen “FrameDiff”, ein Werkzeug zur Beschleunigung der Arzneimittelentwicklung und Verbesserung der Gentherapie

In der Biologie ist DNA der Meisterwebstuhl, der Proteine kodiert. Diese sind für die vielen biologischen Funktionen verantwortlich, die das Leben im menschlichen Körper erhalten. Aber unser Körper ist wie ein fein abgestimmtes Instrument, das seine Harmonie verlieren kann. Wir sind ständig mit einer sich verändernden und unerbittlichen natürlichen Welt konfrontiert: Krankheitserreger, Viren, Krankheiten und Krebs.

Stell dir vor, wir könnten den Prozess der Herstellung von Impfstoffen oder Medikamenten für neu auftretende Krankheitserreger beschleunigen. Was, wenn wir eine Gentechtechnologie hätten, die automatisch Proteine produziert, um DNA-Fehler zu korrigieren, die Krebs verursachen?

Um unsere Fähigkeiten in der Protein-Engineering zu erweitern, haben Forscher des MIT CSAIL “FrameDiff” entwickelt, ein Werkzeug zur Erstellung neuer Proteinstrukturen. Mit “FrameDiff” können unabhängig von vorhandenen Designs völlig neue Proteine entstehen.

Jason Yim, ein Doktorand des MIT CSAIL, sagt: “In der Natur ist das Design von Proteinen ein langsamer Prozess, der Millionen von Jahren dauert. Unsere Technik zielt darauf ab, eine Antwort auf menschengemachte Probleme zu liefern, die viel schneller als die Natur evolvieren.”

MIT: Die Komplexität von FrameDiff

Proteine haben komplexe Strukturen, die aus vielen Atomen bestehen, die durch chemische Bindungen verbunden sind. Die wichtigsten Atome, die die 3D-Form des Proteins bestimmen, werden als “Rückgrat” bezeichnet. Jedes Triplet von Atomen entlang des Rückgrats teilt das gleiche Muster von Bindungen und Atomtypen.

Diese Muster können genutzt werden, um Maschinenlernalgorithmen zu entwickeln. Dabei kommen die “Frames” ins Spiel: Diese Triplets können mathematisch als starre Körper, sogenannte “Frames”, modelliert werden, die eine Position und Rotation in 3D haben.

Die Aufgabe besteht dann darin, einen Maschinenlernalgorithmus zu entwickeln, der lernt, wie man jedes Frame bewegt, um ein Protein-Rückgrat zu konstruieren. Indem er lernt, bestehende Proteine zu konstruieren, wird der Algorithmus hoffentlich verallgemeinern und in der Lage sein, neue Proteine zu erschaffen, die in der Natur noch nie gesehen wurden.

Diffusion: Die subtile Kunst

2021 stellte DeepMind AlphaFold2 vor, einen Algorithmus zur Vorhersage von 3D-Proteinstrukturen aus ihren Sequenzen. Beim Erzeugen synthetischer Proteine gibt es zwei wesentliche Schritte: Generation und Vorhersage. Die Idee der Frames wurde weiterentwickelt, indem Frames in Diffusionsmodelle eingebaut wurden, eine Technik der generativen KI, die in der Bildgenerierung sehr beliebt geworden ist.

In Zusammenarbeit mit dem Institute for Protein Design an der University of Washington wird die SE(3) Diffusion bereits verwendet, um neue Proteine zu erstellen und experimentell zu validieren. Sie kombinierten die SE(3) Diffusion mit RosettaFold2, einem Tool zur Vorhersage der Proteinstruktur, was zu “RFdiffusion” führte. Dieses neue Tool brachte die Protein-Designer näher an die Lösung wichtiger Probleme in der Biotechnologie heran.

Die zukünftigen Anstrengungen für FrameDiff beinhalten die Verbesserung der Allgemeingültigkeit für Probleme, die mehrere Anforderungen für Biologika wie Medikamente kombinieren. Sergey Ovchinnikov, ein Computerbiologe der Harvard University, sagt: “Die Möglichkeit, schnell Strukturen zu generieren, die sich auf große Längen erstrecken, eröffnet sich, wenn man ein vortrainiertes Strukturvorhersagemodell [in FrameDiff] verwirft.”

Das Team besteht aus Jason Yim, Brian Trippe, Valentin De Bortoli, Emile Mathieu und Arnaud Doucet. Die Arbeit wurde teilweise vom MIT Abdul Latif Jameel Clinic for Machine Learning in Health, EPSRC grants und einer Prosperity Partnership zwischen Microsoft Research und der Cambridge University unterstützt. Die Forschung wird auf der Internationalen Konferenz für Maschinelles Lernen im Juli vorgestellt.

Quelle: MIT-News