Comentario contribuido por Mladen Lazarevic, Seven Bridges
3 de febrero de 2023 | Los investigadores recurren a la computación bioinformática para analizar grandes conjuntos de datos y abordar problemas que van desde soluciones de medicina de precisión en oncología hasta nuevas terapias con medicamentos. Esto es especialmente cierto en el caso de los datos genómicos y el análisis bioinformático.
Mientras que aquellos en las ciencias de la vida aprecian la importancia de frenar las emisiones de gases de efecto invernadero y el impacto apremiante del calentamiento global, los pasos prácticos para volverse ecológicos aún tienen que impregnar todas las facetas de la investigación de computación en la nube. Como tal, el estado actual de las cosas en la computación bioinformática no es particularmente verde.
La escala de los conjuntos de datos analizados en bioinformática exige grandes centros de procesamiento para analizar los datos. Históricamente, no hubo impulso para ser ecológico en la investigación, por lo que se priorizó la eficiencia y la precisión, sin minimizar las emisiones de carbono. Sin embargo, un estudio reciente cuantificó el alcance de la huella de carbono en bioinformática, aludiendo a los beneficios de las opciones de computación en la nube para el análisis bioinformático (bioRxiv, DOI: 10.1101/2021.03.08.434372).
Aunque la mayoría de los centros de procesamiento de bioinformática no son carbono neto cero, algunos han avanzado en esa dirección. Por ejemplo, Google, Amazon y Microsoft tienen iniciativas para volverse más ecológicos en sus esfuerzos informáticos. En algunos casos, las empresas compensarán las emisiones de carbono plantando árboles o utilizando otros métodos. Sin embargo, la mayoría aún no son carbono neto cero, sino que están en una trayectoria hacia la neutralidad de carbono.
Varios factores impulsan este impulso hacia opciones de análisis de bioinformática neutras en carbono, como la computación en la nube. Por un lado, está el lado filantrópico. Las empresas deben hacer su parte para reducir las emisiones. El factor lógico de abordar el calentamiento global desde un punto de vista pragmático (necesitamos un planeta habitable para realizar análisis bioinformáticos) también juega un papel. Sin embargo, un tercer factor y no tan comúnmente considerado debería impulsar este impulso: la economía. Las empresas son negocios con fines de lucro, y las opciones de análisis bioinformático más ecológicas pueden beneficiar a las empresas en términos de resultados.
Un beneficio significativo de volverse ecológico es ser más ecológico: las empresas pueden ahorrar dinero a largo plazo recurriendo a opciones más respetuosas con el carbono para su análisis bioinformático. Por ejemplo, recurrir a la computación en la nube para la bioinformática puede reducir los costos, ya que las empresas no necesitan analizar internamente, sino que pueden subcontratar a un tercero para mantener el repositorio de datos y la infraestructura de computación en la nube. Además, contar con soluciones en la nube para bioinformática puede hacer que los datos sean más fácilmente accesibles para los colaboradores para realizar análisis. Por supuesto, mantener los datos en la fuente de la nube sigue siendo un costo, pero en última instancia es una opción más económica para las empresas.
Luego está la mayor eficiencia que ofrece la computación en la nube a considerar. Se ha observado durante años que algunos centros de datos desperdician el 90% de la energía extraen de una red haciendo funcionar los sistemas a toda velocidad, independientemente de la demanda. Las opciones de computación en la nube, por lo tanto, ofrecen una solución más eficaz, ya que ejecutan el análisis bajo demanda, no de forma rutinaria.
Pero no es solo la solidez financiera de la computación en la nube lo que hace que valga la pena para las empresas: la computación en la nube para la bioinformática puede brindar mejores resultados cuando se combina con un proveedor externo para el análisis bioinformático. Con la computación en la nube, el tercero actualiza regularmente las nuevas herramientas, lo que garantiza que el análisis se ejecute con la tecnología más actualizada y precisa. Idealmente, cada iteración de las herramientas mejora los resultados. De lo contrario, no se implementaría; por lo tanto, ejecutar datos en versiones mejoradas significa un mejor análisis.
Además, la computación en la nube permite la colaboración al eludir algunos de los silos que normalmente se encuentran en los esfuerzos de investigación. Por ejemplo, los investigadores de varios proyectos pueden usar todos los mismos datos a través de la nube en lugar de buscar datos bioinformáticos almacenados en un departamento u otro. En última instancia, esto equivale a acortar la línea de tiempo de la investigación, lo que significa que las soluciones de medicina de precisión llegan más rápido a quienes las necesitan.
Topes de velocidad en el camino de la computación verde
A pesar de los claros beneficios de cambiar a opciones de computación en la nube más ecológicas y neutras en carbono, varios factores se interponen en el camino, o al menos frenan, el salto de las empresas. Pero todos pueden reducirse a alguna variación de esto: dolores de crecimiento.
Las empresas deben invertir tiempo, mano de obra y paciencia para lidiar con la frustración de mover datos de un centro a la nube. Eso significa navegar por nuevas tecnologías y un esfuerzo adicional cuando el método actual es menos ecológico. Esa puede ser una batalla cuesta arriba y potencialmente no vale la pena luchar si una empresa solo mira a corto plazo. Sin embargo, en una línea de tiempo lo suficientemente larga (y no muy larga), el movimiento vale la pena.
Si opta por una actualización de la herramienta, otro obstáculo a tener en cuenta y que vale la pena considerar es este: la reproducibilidad de los datos. Aunque este no es un problema común, vale la pena revisarlo. Los experimentos y análisis realizados en iteraciones anteriores de herramientas pueden arrojar resultados diferentes, aunque la tecnología mejorada puede ser más precisa y más respetuosa con el carbono. En raras ocasiones, esto puede llegar a un punto crítico con respecto a las aprobaciones de la Administración de Drogas y Alimentos de los EE. UU. y los problemas de cumplimiento que puedan surgir. Por ejemplo, una empresa puede necesitar volver a presentar para aprobación si los métodos cambian más allá del alcance de la autorización otorgada inicialmente. Eso podría resultar un dolor de cabeza en términos de tiempo y dinero para pasar por el proceso de aprobación nuevamente. Por supuesto, las empresas pueden utilizar las herramientas originales en la nube para sortear este problema potencial.
El futuro es verde y está en la(s) nube(s)
A pesar de los desafíos, el campo tiende hacia opciones más ecológicas para la computación en la nube bioinformática. Los socios han notado esta tendencia, y algunos ya ofrecen sistemas para aliviar los crecientes dolores de volverse ecológicos y basados en la nube. Por ejemplo, algunas empresas comercializan soporte llave en mano para ayudar a las empresas a mover sus datos a opciones de computación en la nube, especialmente en bioinformática, donde los conjuntos de datos son sustanciales.
Además de los recursos disponibles para ayudar a las empresas a dar el paso, hay beneficios inmediatos de hacer el cambio que impulsa a las empresas a volverse ecológicas. Por ejemplo, hacer que otra empresa se encargue de actualizar las herramientas elimina la carga y reduce algunos de esos dolores de crecimiento. Esto permite a las empresas centrar su energía en la investigación, no en el mantenimiento. Y, por supuesto, al final, muchas empresas tienen el ojo puesto en el premio: lograr que el análisis bioinformático se realice de manera más rápida y efectiva para que los tratamientos y las terapias puedan llegar al mercado y ayudar a las personas. Después de todo, el objetivo final es impulsar soluciones de medicina de precisión.
Volverse ecológico y basado en la nube es otra ventaja que compensa esos dolores de crecimiento: democratizar el acceso a los datos. Las empresas pueden colaborar de manera más efectiva en toda la organización al eliminar los silos a través de las opciones de computación en la nube para su investigación bioinformática. Como resultado, deberían disfrutar de un intercambio de datos más equitativo y plazos potencialmente más cortos.
Pero todo se reduce a esto: solo tenemos un planeta, y la computación es un aspecto necesario de nuestro trabajo aquí, por lo que debemos hacer nuestra parte en bioinformática para preservarlo.
Mladen Lazarevic es director asociado de bioinformática en Seven Bridges, con varios años de experiencia en análisis de datos bioinformáticos, gestión de equipos y departamentos, programación, métodos de ciencia de datos y procesamiento de señales. Además, tiene experiencia en áreas multiómicas, bioinformática del cáncer, inmunología, llamadas SNV, ensamblaje de genomas y desarrollo e implementación de tuberías NGS de manera optimizada y escalable en Amazon Web Services y la infraestructura de Google. Puede comunicarse con él en [email protected]