Las empresas de descubrimiento de fármacos están personalizando ChatGPT: así es como

Los grandes modelos de lenguaje están ayudando a los científicos a conversar con la inteligencia artificial e incluso a generar posibles objetivos farmacológicos.

Gran parte del mundo se ha quedado paralizado en los últimos meses por la aparición de motores de generación de texto como ChatGPT de OpenAI, algoritmos de inteligencia artificial (IA) capaces de producir texto que parece escrito por un humano. Mientras que las empresas de tecnología como Microsoft y Google se centran en el uso de dichos motores como una forma de mejorar la búsqueda y a otros les preocupa que puedan causar una ola de ensayos plagiados, noticias falsas y mala poesía, las empresas de biotecnología están analizando estos algoritmos para reforzar sus negocios, como un método para contribuir al descubrimiento de fármacos en una variedad de formas.

Las empresas están adoptando modelos de lenguaje extenso para ayudar al descubrimiento de fármacos.
Crédito: REUTERS / Alamy Stock Photo

Las empresas de biotecnología que ya confían en la IA en su búsqueda de nuevos medicamentos pueden recurrir a la generación de texto como una forma sencilla e intuitiva de interactuar con algunas de sus otras herramientas de IA y aprendizaje automático. Andrew Beam, epidemiólogo de la Escuela de Salud Pública TH Chan de Harvard y director de aprendizaje automático en Generate Biomedicines, llama a ChatGPT “una interfaz realmente interesante” que permite a los usuarios trabajar más fácilmente con otras formas de IA que sus interfaces actuales.

Por ejemplo, Insilico Medicine de Nueva York y Hong Kong, una empresa creada para buscar posibles objetivos farmacológicos con su plataforma impulsada por IA, ahora utiliza ChatGPT como una nueva forma de interactuar con su plataforma de descubrimiento de objetivos, lo que aumenta las relaciones y la integración. proporcionada por los gráficos de conocimiento, anteriormente el método principal para integrar datos. Petrina Kamya, química computacional que es jefa de plataformas de IA y presidenta de Insilico Medicine en Montreal, dice que pueden hablar con su propio sistema de descubrimiento gracias a ChatGPT: “En lugar de hacer clic y hacer clic y hacer clic, solo haces una pregunta y compone este texto que lees y entiendes.”

Más allá de adoptar los chatbots para ayudar a producir materiales escritos, como documentos, patentes o solicitudes de subvenciones, otros pueden reutilizarlos específicamente para el descubrimiento de fármacos, como una especie de motor de búsqueda avanzado específicamente orientado a la ciencia biológica. “Podemos tener uno más específico, por ejemplo, Bio ChatGPT o Med ChatGPT”, dice Lurong Pan, químico computacional de la Universidad de Alabama, Birmingham y fundador y director ejecutivo de Ainnocence, una biotecnología con una plataforma para ayudar al descubrimiento de fármacos. “Puede cambiar la forma en que la gente busca”. Por ejemplo, Google y DeepMind lanzaron a principios de este año Med-PaLM, un chatbot diseñado para brindar respuestas a preguntas médicas.

Todos estos chatbots se basan en modelos de lenguaje grande (LLM), algoritmos entrenados en millones de ejemplos de texto recopilados de Internet. Los LLM son un tipo de IA generativa: algoritmos capaces de crear datos que no existían anteriormente. Para el texto, los LLM aprenden las relaciones estadísticas entre las palabras. Luego, ante una indicación como una pregunta, generan texto prediciendo qué palabra es más probable que siga a la palabra anterior. Los resultados parecen notablemente naturales, aunque los chatbots a menudo hacen declaraciones contrarias a la realidad, esencialmente hechos ‘alucinantes’. ChatGPT se basa en un LLM llamado Generative Pre-trained Transformer, Med-PaLM se basa en Pathways Language Model de Google y Bard, un chatbot más generalizado que Google está incorporando a su motor de búsqueda, se basa en Language Model for Dialogue Applications (LaMDA).

Estos LLM ya están demostrando ser útiles para los cazadores de drogas, dice Kamya. Anteriormente, los usuarios de la plataforma de Insilico podían ver un gráfico de conocimiento, una representación visual de los genes vinculados a una enfermedad en particular y las sustancias que se sabe que interactúan con esos genes. Esa fue información útil, pero la forma en que los investigadores trabajaron con ella fue limitada. Ahora, con la adición de una función de chat, Kamya dice que los datos se han vuelto mucho más accesibles. “Poder tener una conversación con la herramienta es muy enriquecedor. Lo hace más interesante y divertido si puede consultar nuestros gráficos de conocimiento biomédico de la manera que desee”, dice.

Si un científico quiere investigar la psoriasis, por ejemplo, la función de chat puede ver el gráfico de conocimiento de esa enfermedad. Proporcionará una descripción de texto que incluye las principales vías de señalización y los genes implicados en la psoriasis y los compuestos que se sabe que interactúan con ellos. Luego, el usuario puede hacer cualquier pregunta, por ejemplo, “¿Cuántos genes hay en este gráfico?” — y obtenga una respuesta instantánea, o busque asociaciones entre genes y enfermedades específicas, como el sarcoma. La plataforma Insilico, llamada PandaOmics, mostrará que el principal gen diana para el sarcoma es PLK1. El usuario podría interrogar más, solicitando enlaces a vías específicas, por ejemplo, apoptosis, y obtener una respuesta inmediata.

ChatGPT produce la salida conversacional. Luego, Insilico valida lo que sale en el chat con programas de IA predictivos adicionales entrenados en sus propios datos, recopilados durante muchos años. Como resultado, “nuestro resultado es extremadamente preciso”, dice Alex Zhavoronkov, fundador y director ejecutivo de la empresa. Zhavoronkov, que no es un hablante nativo de inglés, también usa ChatGPT para ayudarlo a mejorar su gramática al escribir artículos, y recientemente generó controversia al incluir a ChatGPT como coautor de un artículo de revista.

Los científicos también encuentran útiles los LLM para vincular datos y representarlos de diferentes maneras. Exscientia, una tecnología farmacéutica con sede en Oxford, Reino Unido, ha estado experimentando con LLM para traducir declaraciones en inglés ordinario en afirmaciones mecanicistas cuidadosamente estructuradas que ayuden a generar sus gráficos de conocimiento, dice Garry Pairaudeau, director de tecnología de la compañía.

Los LLM todavía están evolucionando, y los desarrolladores agregan funciones a un ritmo vertiginoso. El ChatGPT lanzado en diciembre se basó en la versión 3.5 de GPT de OpenAI. Una actualización, GPT-4, fue lanzada a mediados de marzo y supera ampliamente a su predecesora. A fines de marzo, ChatGPT agregó un llamado complemento de recuperación que podría resultar particularmente útil para el descubrimiento de fármacos. Es un módulo que permite que el software busque documentos personales o de la empresa, y Dan Neil, director de tecnología de BenevolentAI, una biotecnología impulsada por IA en Londres, está entusiasmado con eso como una forma de personalizar la función de chat sobre la base de la datos propios de la empresa. “Si tuviera un ensayo especializado que escribió y describió en documentos internos de la empresa, puede decir: ‘Oye, al revisar estos resultados que obtuvimos internamente, ¿cómo actualiza esto tu pensamiento? ¿Puedes encontrar o imaginar otros enfoques nuevos en las ciencias de la vida que realmente aprovechen esta información que encontramos?’”, dice.

A pesar de su nombre, los modelos de lenguaje no necesitan ser entrenados en inglés u otros idiomas humanos. Las mismas técnicas de derivación de asociaciones estadísticas se pueden aplicar al ‘lenguaje’ del ADN o las secuencias de proteínas. Luego, en lugar de una nueva oración, pueden generar nuevas proteínas que podrían convertirse en buenos objetivos farmacológicos. “Es la misma idea”, dice Beam, “pero le mostramos datos biológicos en lugar de texto de Internet”.

A algunas personas les preocupa que entrenar sistemas de IA para diseñar moléculas con una alta probabilidad de alcanzar sus objetivos requiera grandes volúmenes de datos, etiquetados a mano por humanos. Y tales colecciones no siempre están disponibles porque las empresas que producen esta información regularmente no siempre están dispuestas a compartirla. Pero los mismos métodos que permiten a ChatGPT escribir oraciones podrían proporcionar la solución perfecta para el diseño de nuevas moléculas, dice Pan. Un modelo de lenguaje provisto de abundantes datos sin etiquetar, como los casi 250 millones de secuencias de proteínas contenidas en la base de datos UniProt, podría derivar las relaciones correctas entre los componentes básicos moleculares por sí solo.

Bioxcel Therapeutics, una compañía que usa IA para identificar y reutilizar medicamentos que fueron archivados en ensayos de fase 2 o 3, o incluso después de la aprobación, está considerando LLM para elegir ganadores potenciales de las diferentes bases de datos. Pero los LLM solo serán valiosos, dice Frank Yocca, neurocientífico y CSO de la compañía, si encajan en el conjunto de herramientas de IA de Bioxcel. “En este momento no es muy preciso en términos de lo que recibes”, advierte. “Pero estamos en las etapas iniciales de esto”.

Una forma de garantizar que los resultados sean precisos y evitar las alucinaciones de la IA es lo que Neil llama “emergencia de evidencia”. Cuando un LLM produce lo que pretende ser un hecho, su empresa ha agregado un algoritmo para proporcionar citas y referencias para respaldar eso. Su sistema utiliza la búsqueda semántica, una forma de evaluar el significado de las palabras, para extraer oraciones de artículos y textos de biología que respaldan una afirmación. El sistema selecciona algunas oraciones relevantes de los millones de documentos a su disposición y se las presenta a un experto humano, quien luego puede observar este pequeño subconjunto de datos para juzgar si el supuesto hecho parece cierto.

Yocca dice que las personas pueden dejarse seducir por la última tecnología y perder de vista si realmente les ayuda a lograr sus objetivos. “Puedes consumirte un poco simplemente haciendo que la máquina haga lo que querías hacer y no necesariamente darte una respuesta funcional”, dice. “Tratamos de evitar eso”.

No todo el mundo se sube al carro de ChatGPT. “Básicamente, ya tenemos todas las herramientas para generar lo que queremos y ya estamos explorando mucha información, y no estamos tratando de expandirnos más por ahora”, dice Joao Magalhaes, jefe de investigación en inmunología de Enterome en París. Por un lado, le preocupa que proporcionar información del paciente para capacitar al LLM pueda comprometer la privacidad.

Sin embargo, no es reacio a adoptar nuevas técnicas de IA. Por ejemplo, la empresa utiliza AlphaFold, un sistema de IA desarrollado por DeepMind que analiza las secuencias de aminoácidos y las utiliza para predecir la estructura tridimensional de una proteína, incluidas muchas que antes se desconocían. “Fue una gran mejora para nosotros”, dice Magalhaes. Estará atento a ChatGPT y, si parece que podría ser útil, la empresa considerará adoptarlo.

Beam señala que otros tipos de IA generativa, como los modelos de difusión que pueden crear imágenes a partir de ruido aleatorio, ya se han abierto camino en la biología. Debido a que esos modelos pueden crear nuevas imágenes de estructuras de proteínas, “podría decirse que son una línea más directa para el descubrimiento y desarrollo de fármacos”, dice Beam.

Por lo menos, dice, el surgimiento de ChatGPT ha creado una conciencia generalizada sobre el potencial de la IA generativa y ha alentado a los biotecnólogos a observar más de cerca. “Lo que ChatGPT ha hecho que todos se den cuenta es el poder de los modelos generativos”, dice Beam.

2023-04-24 02:00:00
#Las #empresas #descubrimiento #fármacos #están #personalizando #ChatGPT #así #como,

Las empresas de descubrimiento de fármacos están personalizando ChatGPT: así es como

Share this:

Nuestra galaxia, la Vía Láctea, tiene todas las posibilidades de dar lugar a un cuásar, que ha recibido pruebas convincentes.

Conoce a los observadores de superdeportivos | Tiempos financieros

You may also like

Leave a Comment Cancel Reply