![]() |
Puede ganar una línea gratuita de secuenciación HiSeq 2500 de sus propias bibliotecas de RNA-seq (con SIRV, por supuesto) solicitando el Premio de Investigación Lexogen
|
Los SIRV de Lexogen son probablemente los controles más complejos disponibles en el mercado hoy en día, ya que están diseñados para evaluar empalmes alternativos, sitios alternativos de inicio y finalización de la transcripción, genes superpuestos y transcripción antisentido. Consisten en siete genes artificiales in vitro transcritos como isoformas múltiples (6-18) para generar un total de 69 transcripciones. Cada uno tiene un trifosfato 5′ y una cola poli(A) de 30 nt, lo que permite los métodos mRNA-Seq y TotalRNA-seq. Las transcripciones varían de 191 a 2528nt de largo y tienen un contenido de GC variable (30-50%).
Antes de profundizar en una descripción más detallada de los SIRV de Lexogen, y cómo podríamos usarlos en nuestros estudios estándar y/o de secuencias de ARN unicelulares, pensé en comenzar con un poco de descripción histórica de cómo Surgieron los controles de ARN… ¡y eso significa volver a los días en que los microarrays eran la herramienta preferida y NGS aún no se había inventado!
Control de calidad de ARN – MAQC: Se recomienda el uso de controles en cualquier experimento, y la falta de ellos es una de las razones más citadas para el actual crisis de reproducibilidad. Casi todos los que han trabajado en la expresión diferencial de genes en los últimos quince años han oído hablar de la MAQC (Control de Calidad MicroArray) estudio. Aunque se evaluaron cuatro fuentes de ARN ARN de referencia humano universal de Stratagene y ARN del cerebro humano de Ambion las muestras se eligieron debido a la cantidad de genes expresados a un nivel detectable, y el tamaño del pliegue cambia entre las dos muestras. Estas dos muestras de control se utilizaron para evaluar cinco plataformas de microarreglos, en un proyecto internacional en el que participaron 137 participantes de 51 organizaciones (ver Nat Biotech 2006). Laboratorios como el mío adoptaron y continúan utilizando los controles MAQC en nuestras canalizaciones de expresión génica diferencial, que hoy en día se basan casi en su totalidad en métodos RNA-seq. Los usamos en mi laboratorio para mostrar cómo la sensibilidad de detección cae a medida que las entradas de ARN se reducen a menos de 100 ng (algo que sigo queriendo repetir con RNA-seq).
El cambio a RNA-seq ha tenido un impacto dramático en nuestra capacidad para realizar experimentos complejos. Ya no estamos limitados a hacer preguntas sobre la expresión diferencial de genes donde tenemos información de secuencia disponible para hacer una matriz. RNA-seq nos permite analizar todo el transcriptoma; para evaluar la expresión génica diferencial (mRNA-seq enriquecido con oligo-dT es el método más utilizado), así como el empalme diferencial, la expresión específica de alelo, la longitud de la cola de poliA, el inicio y la terminación de la transcripción, microRNA, lincRNA, etc, etc, etc. (ver mi «lista de deseos» para los controles en la parte inferior de esta publicación).
Hay disponibles controles más nuevos, diseñados y fabricados con más cuidado que pueden satisfacer mejor las necesidades de los biólogos; y aquí es donde entran los SIRV.
![]() |
El flujo de trabajo SIRV: de la muestra a la respuesta |
Cómo se fabrican los SIRV: Los SIRV se diseñaron para ser similares a las estructuras de genes humanos con genes de múltiples exones superpuestos que se transcriben tanto en sentido como antisentido, con empalme alternativo y sitios de inicio y finalización de transcripción alternativos. Los genes se transcriben in vitro a partir de plásmidos linealizados para producir transcritos completos que están sujetos a un control de calidad y cuantificación muy cuidadosos. Esto incluye análisis espectrofotométricos, de peso molecular y de Agilent Bioanalyser. Después de QC y QT, los transcritos de SIRV se mezclan en concentraciones equimolares (E0), o en variaciones de 8 veces (E1) o 128 veces (E2).
Cómo se utilizan los SIRV: Agregar SIRV a sus muestras requiere una consideración cuidadosa de cómo utilizará los datos que proporcionan en la evaluación posterior. Hoy en día, el control más importante en mi laboratorio es simplemente si la preparación de la biblioteca ha funcionado o, lo que es más importante, dónde no funcionó, ya sea el laboratorio o la muestra la causa de la falla. Nuestro uso de controles MACQ en una placa de muestras es excelente, pero extender esto a un control interno en cada muestra será mejor. Sin embargo, no quiero que los controles dominen el experimento o aumentarán demasiado los costos de preparación y secuenciación de la biblioteca.
Los SIRV en sí mismos no necesitan muchos datos para generar resultados útiles y alrededor del 1% de sus lecturas de secuenciación deberían ser suficientes para la mayoría de los laboratorios. Sin embargo, determinar cuánta mezcla de SIRV agregar a sus muestras antes de la extracción, o su ARN antes de la preparación de la biblioteca, puede requerir algunas pruebas empíricas, ya que la cantidad de ARN en una muestra o una célula difiere mucho. Como regla general, el 95 % del ARN es ARN ribosómico y el otro 5 % es ARNm (y ARN no codificante). Para un experimento que comience con 100 ng de TotalRNA en un flujo de trabajo mRNA-seq, aproximadamente 50 pg representarían el 1 % de los 5 ng de mRNA presentes.
Coincidiendo con el seminario web el 19 de octubreLexogen lanzará el “Suite SIRV” (ver «¿Cómo se analizan los SIRV? debajo) para el análisis de datos de picos. Esto también incluirá una herramienta de «Diseñador de experimentos» para calcular las proporciones de refuerzo recomendadas en función de la entrada conocida o esperada para el contenido de ARN, la proporción de ARNm y el tipo y la eficiencia del flujo de trabajo.
SIRV en RNA-seq a granel: Los experimentos de RNA-seq a granel pueden usar SIRV como controles de proceso en lugar de las muestras MAQC Brain y UHRR, lo que permite ejecutar 96 muestras completas en cada placa. Asumiendo la entrada de 100 ng de TotalRNA, solo se necesitan 50 pg de SIRV por muestra, con 5 ng agregados a la mezcla maestra de oligo-dT utilizada en el paso de enriquecimiento. Se recomienda el uso de SIRV E0 para el control de calidad del proceso, pero E1 y E2 pueden ser útiles al evaluar nuevos métodos para determinar la exactitud y precisión de la detección y cuantificación de transcritos diferenciales.
Los SIRVS no están diseñados para usarse como una herramienta de normalización. Si bien se han considerado los complementos, en realidad no son lo suficientemente confiables para los procedimientos de normalización estándar. El desarrollo de nuevos algoritmos de normalización parece ofrecer esperanza para el futuro (ver Risso 2014), y enfoques como este podrían ser aplicables a los SIRV. Sospecho que esta será un área activa de desarrollo de algoritmos en los próximos dos años debido al gran interés en el RNA-seq de una sola célula.
La competencia: controles alternativos de RNA-seq
Conclusiones: El uso de controles en los experimentos de RNA-seq es un requisito absoluto si desea obtener lo mejor de sus experimentos. Bulk RNA-seq puede beneficiarse de un control de calidad de datos relativamente simple de los controles antes de pasar a análisis de empalme y expresión génica diferencial más complejos. E incluir controles adicionales puede facilitar la comparación de conjuntos de datos longitudinales o entre laboratorios. El RNA-seq de una sola célula ha demostrado un requisito absoluto para incluir complementos, aunque los artículos más recientes sugieren que las transcripciones enriquecidas pueden no reflejar realmente los ARNm humanos en los protocolos utilizados, debido a las colas de poli-A mucho más cortas (30 vs. 200+bp), y que pueden subestimar la sensibilidad de detección hasta diez veces.
- normalización de la expresión génica diferencial
- empalme diferencial
- expresión específica de alelo
- transcripción y variación de la longitud de la cola poliA
- contenido de GC
- iniciación y terminación de la transcripción
- ARN no poliadenilados, por ejemplo, microARN, lincARN
- mapeo de pseudogenes
- límites de detección
- Detección de variantes de ARN en diferentes MAF
- ARN FFPE degradado y de alta calidad
- Spike-in’s con los cebos correspondientes para la captura en solución
- Spike-in RNA encapsulado en células sintéticas
- Variantes escalonadas en ARN largos
- Modificaciones de bases de ARN