Basecamp Research presenta Trillion Gene Atlas para escalar la terapia diseñada por IA

Basecamp Research presenta Trillion Gene Atlas para escalar la terapia diseñada por IA

PR Newswire

  • El atlas multiplicará por 100 la diversidad genética evolutiva conocida, recopilará datos genómicos nuevos de más de 100 millones de especies nuevas en miles de sitios de todo el mundo.
  • Al asociarse con Anthropic, Ultima Genomics y PacBio, y gracias a la infraestructura de IA de NVIDIA, Basecamp Research tiene como objetivo comprimir más de dos décadas de recopilación y análisis de datos biológicos en menos de dos años.
  • La capacitación de los modelos EDEN dio a conocer nuevas leyes de escala: a medida que los conjuntos de datos biológicos aumentan y se enriquecen, las capacidades de IA se disparan, lo que abre oportunidades a sistemas que pueden diseñar nuevos medicamentos para todas las enfermedades y tipos de tratamiento.

AUSTIN, Texas y SAN JOSÉ, California, 19 de marzo de 2026 /PRNewswire/ — El día de hoy, Basecamp Research, laboratorio de IA de vanguardia de diseño biológico, anunció el lanzamiento de Trillion Gene Atlas, una iniciativa científica histórica para generar y modelar datos biológicos a escala de billones de genes. Trillion Gene Atlas se lanzó en colaboración con Anthropic, Ultima Genomics y PacBio, está impulsado por la infraestructura de IA de NVIDIA y tiene como objetivo ampliar 100 veces la diversidad genética evolutiva conocida mediante la recopilación de datos genómicos de más de 100 millones de especies en miles de sitios en todo el mundo.

Esta recopilación es posible gracias a la creciente red de socios de biodiversidad de Basecamp Research a nivel mundial. Su objetivo más importante es brindar los vastos y diversos datos de capacitación necesarios para que los sistemas de IA aprendan de la evolución para diseñar nuevos medicamentos a demanda.

«Los modelos biológicos de IA actuales están entrenados en una pequeña parte de la vida en la Tierra», afirmó Glen Gowers, cofundador y director ejecutivo de Basecamp Research, en una entrevista en SXSW, Austin. «Trillion Gene Atlas amplía el universo genético conocido en varios órdenes de magnitud y va mucho más allá de lo disponible en las bases de datos públicas. Los modelos de capacitación a esta escala establecen un nuevo paradigma para el diseño terapéutico programable».

La iniciativa, que está a la escala del Proyecto Genoma Humano, se dio a conocer durante el Health Track en SXSW y la conferencia NVIDIA GTC en San José.

Abordar los obstáculos sobre datos biológicos

Con enormes aumentos en el tamaño del modelo y potencia informática, los datos diversos son un facilitador fundamental para el progreso en el desarrollo de fármacos con IA y pruebas de rendimiento en condiciones reales. Todos los modelos base actuales basados en secuencias dependen de variantes de los mismos repositorios públicos y el 80 % de ellos se ha entrenado con una base de datos pública que contiene menos de 250 millones de secuencias.

Los modelos de base EDEN de Basecamp Research, lanzados en enero, rodean el «muro de visualización de datos» evolutivo de la industria al capacitarse completamente en BaseData™, una base de datos genómica patentada que actualmente es más de 10 veces más grande que todos los recursos públicos combinados. Al aprender de un número sin precedentes de 10 mil millones de genes nuevos para la ciencia en 1 millón de especies recién descubiertas, EDEN aprovechó nuevas leyes de escala críticas para la IA en biología.

Esta expansión masiva en la diversidad de conjuntos de datos llevó a EDEN más allá de la simple predicción, lo que lo convierte en el primer modelo capaz de diseñar diversas terapias de manera directa a partir de la mención de una enfermedad. En la validación en laboratorio húmedo, demostró actividad «zero-shot» (aprendizaje profundo) en células T humanas primarias sin que fuera necesario disponer de datos clínicos ni de origen humano. El modelo ha generado datos exitosos en múltiples modalidades fronterizas, en particular la pionera inserción de genes programables por IA (aiPGI) para insertar genes sanos y el diseño de péptidos antimicrobianos dirigidos con una tasa de aciertos del 97 % contra patógenos prioritarios.

Trillion Gene Atlas se basa en este enfoque al expandir en gran medida la amplitud y profundidad contextual de los datos genómicos en el conocido «Internet de la biología» adecuado para la capacitación en IA.

«Los modelos más grandes por sí solos no son suficientes», agregó Phil Lorenz, director de tecnología de Basecamp Research. «EDEN demostró que el rendimiento en IA biológica sigue trayectorias de escalado mucho más pronunciadas con datos de mayor calidad y totalmente contextualizados. Trillion Gene Atlas amplía ese principio 100 veces».

Alianzas mundiales para la biodiversidad

Durante los últimos seis años, Basecamp Research ha creado una red de colaboradores científicos en 31 países, estableciendo una línea de genómica evolutiva escalable diseñada específicamente para la capacitación de la IA. Al ser pionera en una combinación de nuevos marcos regulatorios y económicos y tecnologías de secuenciación de ADN totalmente fuera de la red, la empresa recopila datos genómicos de alta calidad de ecosistemas más allá del alcance de los laboratorios tradicionales.

Estas alianzas se basan en el intercambio de conocimientos, el desarrollo de capacidades locales, acuerdos equitativos de acceso y distribución de beneficios alineados con las nuevas regulaciones de información de secuencias digitales. Este marco permite una recopilación de datos genómicos responsable, a gran escala y de alta calidad, a la vez que se invierte en infraestructura científica y capacitación dentro de las regiones asociadas.

Como parte del lanzamiento del atlas, Basecamp anuncia nuevas alianzas en Chile, Argentina y una colaboración extendida en la Antártida, lo que amplía aún más su red mundial de biodiversidad.

Escalar la generación de datos y la informática con Ultima Genomics, PacBio y NVIDIA

Trillion Gene Atlas está habilitado por los avances en la secuenciación de lectura corta y larga de rendimiento ultraalto y la informática acelerada. Basecamp se ha asociado con Ultima Genomics y PacBio para ofrecer secuenciación a escala industrial, incluidas lecturas largas ricas en datos y de alta precisión.

Ultima es un desarrollador de sistemas de secuenciación de próxima generación (NGS) de ultra alto rendimiento. El último sistema de secuenciación de Ultima, la serie UG200, avanza en la arquitectura de secuenciación basada en obleas única de la empresa para permitir la secuenciación de alto rendimiento, de genoma completo y multiómica a escala industrial a un precio bajo para permitir iniciativas como Trillion Atlas.

«La biología ha carecido fundamentalmente de datos en comparación con otros campos como el lenguaje o la visión por computadora, ya que los investigadores han carecido de las herramientas necesarias para generar datos a escala», declaró Gilad Almogy, fundador y director ejecutivo de Ultima Genomics. «Creemos firmemente que la IA tendrá un impacto inmenso en nuestra comprensión de la biología y la salud humana, y la serie UG200 se diseñó desde cero para permitir los conjuntos de datos masivos necesarios para que BioAI cumpla esta promesa. Nos complace que nuestra tecnología pueda permitir que Basecamp consolide su visión y avance en iniciativas innovadoras como Trillion Gene Atlas».

«La secuenciación HiFi de PacBio ofrece lecturas largas de alta precisión que conservan el contexto genómico completo y permiten la resolución de subespecies e incluso cepas en muestras complejas», señaló Christian Henry, presidente y director ejecutivo de PacBio. «Los datos de HiFi ofrecen la base confiable y rica en información que los modelos biológicos de IA necesitan para aprender de la naturaleza a escala e iniciativas potentes como Trillion Gene Atlas».

Trillion Gene Atlas funcionará con la infraestructura informática acelerada de NVIDIA para procesar grandes cantidades de datos genéticos a escala de petabase. Como parte de este esfuerzo, Basecamp planea aprovechar NVIDIA Parabricks para acelerar considerablemente el ensamblaje metagenómico. Esta colaboración se centra tanto en la ingeniería avanzada como en el desarrollo de nuevos métodos algorítmicos para optimizar la reconstrucción de muestras ambientales complejas. Gracias a esta aceleración, se espera que el procesamiento de cuatrillones de pares de bases de ADN, una tarea que anteriormente habría llevado más de 20 años, tarde menos de dos años en completarse.

Mediante el procesamiento de datos en paralelo, la anotación automatizada y la capacitación de modelos a gran escala, los socios esperan reducir una tarea que anteriormente habría requerido más de 20 años de tiempo de procesamiento a menos de dos años. Esta reducción de tiempo en la secuenciación, ensamblaje, anotación y capacitación de modelos tiene como objetivo ampliar el rendimiento y el alcance de los modelos de fundamentos biológicos en todo el desarrollo terapéutico.

Creación de un flujo de trabajo de diseño terapéutico genético de extremo a extremo

Anthropic se une como parte de su esfuerzo más amplio para agregar nuevas capacidades para las ciencias biológicas: conectar a Claude con plataformas más científicas. Al trabajar con el equipo de Claude for Life Sciences, el objetivo es aprovechar Trillion Gene Atlas y EDEN para hacer de Claude un socio de investigación aún más productivo para científicos y médicos, y apoyar a las organizaciones que aportan nuevos avances científicos al público.

Al combinar las capacidades de razonamiento avanzado de Claude, las capacidades de diseño terapéutico de EDEN y las bibliotecas CUDA-X de NVIDIA para procesar datos no estructurados, la iniciativa tiene como objetivo crear un flujo de trabajo integrado para interpretar datos clínicos complejos y transformarlos directamente en diseño terapéutico.Trillion Gene Atlas se basa en tres pilares: secuenciación de ADN a gran escala, asociaciones de suministro de datos a nivel mundial e informática avanzada. Junto con los sistemas de IA capaces de razonar con datos complejos, estos fundamentos pueden ayudar a convertir grandes conjuntos de datos en descubrimientos terapéuticos. Al aumentar los datos evolutivos disponibles para la IA en otras 100 veces, Basecamp Research tiene como objetivo hacer que el diseño de medicamentos sea más rápido y sistemático, que ampliarán los avances anteriores de EDEN en campos como la terapia génica y la lucha contra las bacterias resistentes a los antibióticos.

View original content:https://www.prnewswire.com/mx/comunicados-de-prensa/basecamp-research-presenta-trillion-gene-atlas-para-escalar-la-terapia-disenada-por-ia-302719441.html

FUENTE Basecamp Research

contador

Publicidad