El explorador personalizado de redes de cáncer (PeCaX) como herramienta de análisis visual para respaldar los tableros de tumores moleculares | BMC Bioinformática

Resumen técnico

PeCaX es una aplicación local orientada a servicios y se creó utilizando el marco NuxtJS para su front-end basado en web e integra varios otros servicios locales desarrollados por nosotros a través de las API REST (ver Fig. 1). Fue desarrollado en estrecha colaboración con las personas responsables de la gestión de casos de MTB, el análisis científico, la preparación de casos y la presentación en el Hospital Universitario de Tübingen para garantizar una interfaz de usuario fácil de usar. Admite el uso concurrente y funciona en cualquier navegador web moderno, independientemente del sistema operativo. Su diseño como servicio web permite el acceso desde navegadores que no se ejecutan en la misma máquina que el servicio. Los datos confidenciales solo se procesan en la máquina en la que está instalado PeCaX, no en las máquinas que acceden a ellos con la GUI. Es fácil de implementar a través de contenedores docker prediseñados y se integra fácilmente mediante docker compose. Los contenedores acoplables individuales y la comunicación a través de las API REST permiten actualizar los servicios de forma individual sin necesidad de configurarlo todo desde el principio.

Anotación de variante clínica

PeCaX se basa en archivos VCF para obtener información sobre SNV y archivos TSV para obtener información CNV opcional. Los ejemplos están disponibles en el archivo adicional 1: Secc. 2.1.1. La extensión del nombre de archivo (.vcf, .tsv) verifica la validez de los archivos que se cargarán. Si un archivo cargado contiene errores semánticos o sintácticos, el proceso de análisis se cancela y se notifica al usuario que el archivo de entrada está dañado.

PeCaX integra ClinVAP [8] crear un informe de caso mediante el procesamiento de variantes utilizando anotaciones funcionales y clínicas de las aberraciones genómicas observadas en un paciente. ClinVAP emplea Predictor de efecto de variante de conjunto (VEP) [11] para obtener efectos funcionales de las variantes observadas y filtrarlos en función de la severidad de las predicciones.

También realiza anotaciones clínicas que revelan los genes impulsores, los objetivos procesables y los enriquece con sus asociaciones terapéuticas conocidas utilizando una base de conocimiento integrada de bases de datos disponibles públicamente (p. ej., COSMIC [12]CGI [13]) [8]. Además, proporciona una opción para filtrar los resultados según el tipo de diagnóstico dado como código ICD10, lo que se logró al obtener los enlaces gen-enfermedad de las bases de datos de fondo y mapear esas enfermedades con sus códigos ICD10 correspondientes. El mapeo entre los nombres de enfermedades de las bases de datos y de ICD10 se realiza haciendo coincidir sus características relacionadas con la enfermedad, como sistema, órgano, tipo de histología. Tan pronto como finaliza la anotación, los archivos de variantes se eliminan y PeCaX recibe el informe resultante como un archivo JSON con información estructurada en cinco categorías: genes controladores conocidos, medicamentos dirigidos a las variantes, terapias dirigidas a los genes afectados, medicamentos contra el cáncer dirigidos a los genes mutados, y medicamentos con efectos adversos conocidos (Archivo adicional 1: Secc. 2.3.1).

Generación de red

El cáncer es una enfermedad compleja y heterogénea típicamente causada por alteraciones genómicas. Incluso una sola mutación puede modular la compleja red de interacción de genes para causar fenotipos de cáncer. Dado que estas mutaciones pueden ocurrir en genes arbitrarios, es útil comprender el papel de los genes alterados en su contexto fisiológico, es decir, dentro del contexto de sus redes reguladoras. Al examinar la vecindad de la red de un gen alterado, se pueden identificar nuevos enfoques de tratamiento potenciales para pacientes sin otras opciones de tratamiento (p. ej., a través de terapias dirigidas). Examinar la interacción de las interacciones gen-fármaco mediante redes proporciona información sobre el efecto de una intervención, por ejemplo, para un paciente resistente a un fármaco. Si el gen alterado no es un objetivo farmacológico o no puede serlo debido a la resistencia a los medicamentos o la intolerancia del paciente, los genes que se encuentran aguas arriba o aguas abajo del mismo podrían ser objetivos farmacológicos adecuados.

Así, PeCaX envía la lista de genes de cada categoría a SBML4j [9] que es un servicio para la persistencia de modelos biológicos y vías en formato SBML en una base de datos de gráficos (Archivo adicional 1: Secc. 2.2). Su base de datos de gráficos se utiliza para extraer información sobre el contexto de la red local de cada gen candidato. Basado en vías relacionadas con el cáncer de KEGG [14], PeCaX puede así inferir qué genes relacionados están aguas arriba y aguas abajo de un gen candidato con respecto a la regulación y señalización de genes. Además, SBML4j brinda información sobre fármacos asociados con cualquiera de los genes candidatos, así como genes ascendentes y descendentes.

Interfaz gráfica de usuario interactiva

PeCaX proporciona una interfaz gráfica de usuario simple para cargar variantes y mostrar los resultados. El informe generado por ClinVAP se muestra en forma tabular interactiva junto a las redes generadas por SBML4j.

Para un análisis más fácil de las redes, se visualizan como gráficos de red usando BioGraphVisart [10]. El objetivo del análisis de red es no solo ver el componente individual, sino también el cruce del vecindario local con vías conocidas y las opciones cercanas para la intervención terapéutica (genes susceptibles de tratamiento). BioGraphVisart es una herramienta basada en web escrita en Javascript. Automatiza el diseño del gráfico de red, el etiquetado de nodos (genes, fármacos) y bordes (interacciones), el estilo de borde para diferentes tipos de interacción, la coloración de nodos según atributos de nodos fácilmente modificables y la generación de leyendas. Además, los genes y proteínas humanos se pueden agrupar con respecto a vías predefinidas de KEGG.

Gestión de datos

El usuario tiene que dar un nombre de proyecto antes de iniciar el análisis. Este nombre se utiliza para crear una colección en la base de datos local (ArangoDB) utilizada para la gestión de datos. Por eso, el usuario puede realizar múltiples análisis reunidos en una colección, por ejemplo, diferentes pacientes presentados en una sesión de MTB. Al iniciar un análisis, los datos cargados y los parámetros establecidos se envían a través de la API REST al contenedor ClinVAP y se genera una identificación de trabajo única para almacenar los parámetros. Los datos cargados solo se almacenan durante la anotación clínica y luego se eliminan. Los resultados del análisis, así como las identificaciones de las redes generadas con SBML4j, se almacenan en relación con la identificación del trabajo. Las propias redes se almacenan en la base de datos de la red.

Fuente del artículo

Deja un comentario