scAllele: una herramienta versátil para la detección y el análisis de variantes en scRNA-seq

Los datos de secuenciación de ARN de una sola célula (scRNA-seq) contienen información valiosa a nivel de genes, transcritos y nucleótidos. La mayoría de los análisis de scRNA-seq se han centrado en los perfiles de expresión génica, y sigue siendo un desafío extraer variantes de nucleótidos e información específica de isoformas. Investigadores en Universidad de California en Los Ángeles han desarrollado scAllele, un enfoque integrador que detecta variantes de un solo nucleótido, inserciones, deleciones y su enlace alelo con patrones de empalme en scRNA-seq. Los investigadores demuestran que scAllele logra un mejor rendimiento en la identificación de variantes de nucleótidos que otras herramientas de uso común. Además, las llamadas de variantes específicas de lectura de scAllele permiten el análisis de empalme específico de alelos, una característica única que no ofrecen otros métodos. Aplicado a un conjunto de datos de scRNA-seq de cáncer de pulmón, scAllele identificó variantes con un fuerte vínculo alelo con el empalme alternativo, algunas de las cuales son específicas del cáncer y enriquecidas en vías relevantes para el cáncer. scAllele representa una herramienta versátil para descubrir información multicapa y conocimientos biológicos previamente no identificados a partir de datos scRNA-seq.

Esquema del algoritmo

(A) Ilustración del algoritmo principal de scAllele para llamadas variantes. Las lecturas y la secuencia genómica de referencia que se superponen a un RC se descomponen en k-mers y se vuelven a ensamblar en un gráfico de Bruijn. El gráfico que se muestra aquí es una versión compacta. Las burbujas en el gráfico indican un desajuste de secuencia, es decir, una variante. Para cada lectura, scAllele obtiene una ruta para la secuencia de lectura original e infiere el alelo de cada variante (incluidos los intrones). (B) Las variantes (recuadro verde en A) identificadas a partir del gráfico se puntúan mediante un GLM. El GLM se entrenó con diferentes funciones (recuadro verde) para asignar una puntuación de confianza a las variantes. Ver Materiales y Métodos para más detalles. (C) Para identificar el empalme específico de alelos (es decir, la vinculación de variantes), scAllele realiza un cálculo de información mutua (MI) entre las variantes de nucleótidos (SNV y microindels) y las partes intrónicas (donde los alelos son los diferentes intrones superpuestos) para calcular la vinculación alélica de las isoformas de empalme.

Quiñones-Valdez G, Fu T, Chan TW, Xiao X. (2022) scAllele: Una herramienta versátil para la detección y análisis de variantes en scRNA-seq. ciencia avanzada 8(35):eabn6398. [article]



Fuente del artículo

¿Que te ha parecido?

Deja un comentario