Crean Inteligencia Artificial capaz de inventar proteínas que no existen en la naturaleza
El ESM3 es un modelo de inteligencia artificial (IA) desarrollado por científicos que trabajaron en Meta y ahora están en la empresa EvolutionaryScale.
Este modelo tiene la capacidad de crear proteínas completamente nuevas que no existen en la naturaleza. A diferencia de cómo ChatGPT predice el siguiente término en una secuencia de texto, el ESM3 “escribe” proteínas nuevas desde cero, utilizando datos sobre proteínas conocidas para generar nuevas secuencias.
El modelo ESM3 se basa en una metodología similar a la de los modelos de lenguaje como GPT-4, el cual impulsa el chatbot ChatGPT. Para entrenar ESM3, los investigadores utilizaron información de billones de proteínas, incluyendo su secuencia, estructura y función. Al ocultar partes de esta información y pedir al modelo que predijera los datos faltantes, los científicos lograron desarrollar un modelo capaz de generar proteínas con funciones específicas.
El ESM3 no solo predice proteínas existentes, sino que también puede crear nuevas proteínas con funciones específicas. En un estudio reciente, el modelo generó una proteína fluorescente que solo comparte un pequeño porcentaje de su secuencia con proteínas fluorescentes naturales. Esta proteína nueva, llamada “esmGPF”, emite luz verde y tiene aplicaciones significativas en investigación biológica. Los investigadores utilizaron el modelo para generar 96 proteínas potencialmente fluorescentes y seleccionaron la que menos coincidía con las proteínas fluorescentes naturales.
El desarrollo de esta proteína nueva demuestra el potencial de ESM3 para acelerar la búsqueda de estructuras proteicas, que tradicionalmente requiere técnicas costosas y lentas como la cristalografía de rayos X. La capacidad de ESM3 para generar proteínas en minutos que podrían tomar millones de años de evolución es un avance notable en la biología sintética.
Actualmente, EvolutionaryScale ha lanzado una versión pequeña del modelo bajo una licencia no comercial, y planea poner a disposición de los investigadores comerciales una versión más grande del modelo. La tecnología tiene aplicaciones potenciales en descubrimiento de fármacos y diseño de nuevos químicos para la degradación de plásticos, entre otros campos.