Acelerando los descubrimientos científicos a través de plataformas de análisis de datos

En esta entrevista, hablamos con Victor Wong, director científico de Core Life Analytics, sobre su StratoMineRTM producto y cómo está ayudando a los investigadores a procesar rápidamente sus datos.

Contenidos ocultar

¿Podría presentarse y contarnos sobre su viaje a Core Life Analytics?

Mi nombre es Victor y comencé mi carrera científica en la Universidad de Toronto, donde hice mi doctorado en Fisiología. Entonces mi atención se centró en los trastornos metabólicos, con énfasis en los objetivos farmacológicos y el descubrimiento de fármacos. Luego trabajé como posdoctorado en neurociencia en UC Davis and Weill Cornell Medical Center. En esta última institución, estuve expuesto a imágenes de alto rendimiento y alto contenido, utilizando pantallas compuestas para el descubrimiento de fármacos.

Mi ingenuidad inicialmente me dio la falsa impresión de que la automatización aceleraría significativamente mis proyectos y publicaciones, pero ese simplemente no fue el caso. El análisis de datos fue el mayor desafío; la cantidad de datos provenientes de mis proyectos estaba más allá de mi conocimiento para saber por dónde empezar. Traté de captar algo de dominio de la programación, pero nunca nada fue robusto o reproducible.

Me uní a Core Life Analytics simplemente porque son la solución al problema de datos que tenía. Además, nuestras filosofías científicas se alinean increíblemente bien: proporcionar herramientas de análisis de datos sólidas y transparentes que permitan a los científicos analizar sus datos rápidamente y pintar una imagen holística de sus experimentos. Además, y más importante, educar a los científicos sobre las buenas prácticas en ciencia de datos.

¿Cuáles son los objetivos principales de Core Life Analytics y cómo encaja en el campo más amplio de las ciencias biológicas y de la vida?

En Core Life Analytics, tenemos la misión de democratizar la ciencia de datos: ayudamos a los biólogos a analizar sus datos fenotípicos complejos de forma independiente.

La detección de alto contenido o fenotípica es una herramienta poderosa para el descubrimiento de fármacos. Usando microscopios avanzados y software de análisis de imágenes, los científicos pueden traducir imágenes microscópicas a cientos o miles de medidas de la morfología de una célula, como el tamaño, la intensidad y la forma. Estas supuestas características describen y cuantifican el fenotipo de una célula, lo que permite a los investigadores evaluar cuidadosamente el efecto de un compuesto.

Técnicas como estas encajan en un movimiento hacia enfoques más basados ​​en datos: en lugar de centrarse en las mediciones que sabe que están involucradas en los procesos que estudia, mídalas todas y use estadísticas para determinar qué es interesante.

Análisis de datos en la ciencia

Haber de imagen: Gorodenkoff/Shutterstock.com

El auge del análisis de datos y la bioinformática prevalece en todas las áreas de las ciencias biológicas y de la vida, pero muchos aún enfrentan desafíos para integrarlo en su flujo de trabajo. ¿Cuáles son las principales barreras que limitan el uso de software avanzado de análisis de datos en estos sectores?

La mayoría de los científicos luchan por hacer uso de estos conjuntos de datos. Nuestros fundadores, David Egan y Wienand Omta, fueron testigos de esto de primera mano en el UMC Utrecht Cell Screening Core; sus clientes tenían que aprender ciencia de datos y habilidades de codificación para analizar sus datos o pedirle a un científico de datos que lo hiciera por ellos. En ambos casos, los datos se subutilizan. A menudo, solo se analizan un puñado de medidas conocidas, dejando atrás cientos o miles de medidas potencialmente útiles.

¿Por qué los biólogos deberían esforzarse por utilizar plataformas avanzadas de análisis de datos y cómo puede ayudar esto a catalizar la innovación en sectores como el descubrimiento de fármacos?

Brindar a los biólogos las herramientas para realizar sus análisis de forma independiente mejora en gran medida la velocidad con la que se realizan los descubrimientos. En primer lugar, los biólogos ya no necesitan esperar a los científicos de datos ocupados ni aprender a codificar, sino que simplemente pueden ejecutar sus datos a través de la plataforma de análisis.

En segundo lugar, esto permite que la persona que mejor conoce los experimentos, que los diseñó y ejecutó, explore los datos y tome decisiones para futuros experimentos en consecuencia. Esto no solo es importante para el análisis final de un experimento; ser capaz de ejecutar rápidamente estos análisis en las primeras etapas experimentales de un estudio ayuda a evaluar la calidad de su modelo o ensayo e identificar problemas desde el principio.

No se olvide de los científicos de datos; cuando los biólogos realizan ellos mismos estos análisis relativamente rutinarios, tienen tiempo para las cosas más emocionantes, como la IA avanzada y la multiómica.

StratoMineRTM es el producto principal de Core Life Analytics que tiene como objetivo ayudar a los investigadores a procesar rápidamente sus datos. ¿Podría hablar sobre los antecedentes detrás de este producto y cómo los usuarios pueden integrarlo en su flujo de trabajo?

Cuando David Egan y Wienand Omta se dieron cuenta en la UMC Utrecht de que la necesidad de herramientas de análisis de datos accesibles era generalizada, decidieron desarrollar algo que pudiera ser utilizado por cualquier biólogo que se ocupara de este tipo de datos. Independientemente del hardware o software que utilicen o de sus habilidades en ciencia de datos. Simplemente cargue sus datos numéricos y StratoMineR lo guiará a través de un flujo de trabajo de mejores prácticas para datos fenotípicos.

Comenzando con los pasos más básicos, como encontrar características relevantes, realizar controles de calidad y normalizar y escalar sus datos, hasta pasos más avanzados, como la reducción de datos, para finalmente comparar y agrupar fenotipos para determinar el mecanismo de acción de un compuesto.

¿Cómo funciona StratoMineR?TM comparar con las plataformas existentes actualmente disponibles? ¿Hay algún componente que los usuarios finales encontrarían especialmente interesante?

Lo que diferencia nuestro enfoque de otras herramientas es que es intuitivo y ayuda a tomar decisiones. El flujo de trabajo guiado de StratoMineR garantiza que no se pierda ningún paso y ofrece sugerencias utilizando IA siempre que sea posible. De esta manera, cualquier biólogo puede seguir un flujo de trabajo de análisis de mejores prácticas para datos multiparamétricos, comprenderlo y explorarlo. Y empiece a hacerlo desde el principio de la fase experimental de un proyecto.

Core Life Analytics asistió recientemente a ELRIG Drug Discovery, la reunión más grande de Europa que reúne a profesionales industriales de las ciencias de la vida. ¿Cuáles son los beneficios de asistir a tales eventos para discutir y demostrar productos en persona?

ELRIG Drug Discovery fue una gran reunión con un excelente programa científico. Siempre disfrutamos de reuniones como estas, ya que son una oportunidad perfecta para mantenerse al día con los últimos desarrollos en el campo. Lo que es más importante, podemos hablar con científicos de diferentes orígenes y conocer sus perspectivas y desafíos.

Se están logrando muchos avances en las tecnologías de ciencia de datos, y todas las industrias están cosechando los beneficios. ¿Cómo espera que cambie la relación entre la ciencia de datos y el sector de las ciencias de la vida en los próximos diez años?

Como se mencionó anteriormente, el interés en el descubrimiento de fármacos basado en datos está creciendo. Un gran ejemplo de esto es el Consorcio JUMP-CP, que ha generado una base de datos de datos fenotípicos de células que responden a 140.000 perturbaciones genéticas y moléculas pequeñas diferentes.

El potencial de este recurso público es obvio, pero plantea la pregunta: ¿cómo pueden los investigadores fuera del consorcio aprovechar un conjunto de datos grande y complejo? Esto y la complejidad cada vez mayor de los datos resaltan aún más la necesidad de herramientas accesibles. Ya vemos que las herramientas de análisis basadas en IA se están volviendo cada vez más comunes, están surgiendo Machine Learning (ML) y Deep Learning (DL), y las discusiones sobre integraciones más avanzadas, como multi-ómicas, están en curso, convirtiéndose en un nuevo área de investigación.

Sector de descubrimiento de fármacos

Haber de imagen: paulista/Shutterstock.com

¿Cómo son los próximos años para Core Life Analytics? ¿Hay alguna innovación por la que te esfuerces?

En los próximos años, esperamos abordar algunos otros cuellos de botella en la proyección de alto contenido. Una de nuestras ambiciones es, además de los datos numéricos, trasladar las imágenes a la nube. Esto resolverá los problemas de almacenamiento de muchas personas y nos permitirá utilizar computación en la nube masivamente paralela para el análisis de imágenes, lo que reducirá drásticamente el tiempo de análisis.

¿Adónde pueden acudir nuestros lectores para estar al día de las actividades de la empresa?

Pueden seguirnos en LinkedIn o visite nuestro sitio web.

Proporcione enlaces a cualquier material que pueda ser relevante para nuestra audiencia.

El 15 de noviembre, organizaremos un seminario web: ¡Prepárate para JUMP-CP!

Puede encontrar más información sobre el Consorcio JUMP-CP en su sitio web.

Puede encontrar más información sobre StratoMineR para datos de alto contenido en nuestro folleto.

Sobre Víctor Wong

Como CSO, las responsabilidades de Victor Wong son establecer y comunicar la validez científica y la utilidad de los productos de investigación desarrollados por Core Life Analytics. Interactúa con comunidades científicas y de clientes en relación con las capacidades y los hallazgos científicos de nuestra empresa. También se las arregla con otros CxO para la gestión general de los productos y el equipo. Víctor Wang

Víctor Wang recibió su Ph.D. en la Universidad de Toronto. Fue becario de investigación del Instituto Canadiense de Salud y recibió varias becas durante su formación posdoctoral en el Instituto Burke de Medicina de Weill Cornell. Su motivación científica está impulsada por su discapacidad; es profundamente sordo y, desde entonces, su viaje científico lo llevó a través de una serie de campos terapéuticos, con un enfoque en el descubrimiento de fármacos y objetivos para encontrar tratamientos novedosos para una serie de enfermedades que abarcan el metabolismo, la oncología, la neurodegeneración y la pérdida auditiva.

Fuente del artículo

Deja un comentario