Inferencia de padres de origen para biobancos | Comunicaciones de la naturaleza

Inferencia de PofO a partir de datos de genotipo

Para inferir la PofO de todos los alelos portados por una determinada muestra objetivo, procedemos en dos pasos consecutivos como se detalla a continuación:

  1. 1.

    Identificación de los padres sustitutos (Fig. 1a). Para cada muestra objetivo (individuo británico blanco del Biobanco del Reino Unido), identificamos parientes cercanos y determinamos cuál de los dos padres (madre o padre) transmite la relación. Para esto, primero observamos las estimaciones de parentesco por pares dadas por KING13 para identificar a los familiares de segundo o tercer grado y agruparlos en los dos grupos parentales en función de su parentesco: se agrupan en el mismo grupo si están relacionados y en diferentes grupos de lo contrario. Luego, asignamos el estado parental (materno o paterno) a grupos parentales para objetivos masculinos solo explotando el hecho de que su única copia del cromosoma X se hereda por vía materna. Por lo tanto, buscamos parientes que compartan partes de su cromosoma X idénticos por descendencia (IBD) con la muestra objetivo y los etiquetamos como madres sustitutas. También propagamos la información a otros familiares: los del mismo grupo parental también son etiquetados como madres sustitutas y los del otro grupo parental como padres suplentes. En caso de que no se encuentre EII, no podemos anotar los grupos parentales como materno o paterno y excluimos la muestra objetivo del conjunto de datos. En adelante, llamamos padres sustitutos los parientes cercanos que identificamos usando este enfoque.

    Fig. 1: Justificación de la inferencia de PofO.
    Figura 1

    a Identificación de padres sustitutos en 3 pasos: (1) identificación de parientes cercanos para una muestra objetivo de interés utilizando las estimaciones de parentesco por pares, (2) agrupación de parientes cercanos al maximizar y minimizar la relación entre grupos e intragrupos, respectivamente, ( 3) asignación del estado parental a grupos de parientes cercanos (es decir, padres sustitutos) utilizando el intercambio de IBD en el cromosoma X para objetivos masculinos. b Inferencia del padre de origen en 4 pasos: (1) identificación de segmentos de IBD autosómicos compartidos entre el objetivo y los padres sustitutos, (2) construcción de andamios con alelos coheredados localizados en el mismo cromosoma homólogo en todos los autosomas, (3) escalonamiento estadístico de todos los alelos restantes contra el andamio y (4) deducción del genoma completo de los orígenes maternos y paternos de los alelos a partir de las probabilidades de escalonamiento.

  2. 2.

    Asignación de PofO a alelos (Fig. 1b). Después de la identificación de los padres sustitutos, asignamos PofO a los alelos del objetivo. En primer lugar, buscamos segmentos de IBD autosómicos compartidos entre el objetivo y los padres sustitutos utilizando un mapeo de IBD robusto tanto para errores de fase como de genotipado (ver Métodos, Figura complementaria 1). Luego, clasificamos los segmentos de EII resultantes como heredados por vía materna o paterna según el padre sustituto al que se asignan. Esto delimita un subconjunto de alelos que se coheredan del mismo progenitor dentro ya través de los cromosomas (es decir, que co-localizan en el conjunto transmitido de cromosomas homólogos). Esto deja otro subconjunto de alelos para los que no conocemos el PofO (es decir, aquellos que no comparten EII con ninguno de los padres sustitutos). Para esos, extrapolamos el PofO utilizando fases estadísticas: modelamos alelos para los que conocemos el estado de PofO como un andamio de haplotipo14 en el que todos los alelos restantes se escalonan probabilísticamente usando SHAPEIT415 (Fig. 1 complementaria). La asignación de PofO de estos alelos restantes viene dada por su frecuencia de colocalización en cada andamio de haplotipo, lo que también refleja cuán confiable es la fase (es decir, certeza de fase, Fig. 1 complementaria). Finalmente, extrapolamos el PofO para variantes no tipificadas al realizar la imputación haploide de cada haplotipo parental a su vez usando IMPUTE5dieciséis y el HRC como panel de referencia17.

Validación de la inferencia PofO en dúos y tríos

Para evaluar la precisión de nuestro enfoque, utilizamos 443 993 muestras genotipadas del Biobanco del Reino Unido de ascendencia británica o irlandesa, junto con sus estimaciones de parentesco por pares, para identificar un subconjunto de muestras con padres y parientes de segundo a tercer grado. Para estas muestras, inferimos el PofO usando dos enfoques: directamente de los padres o usando parientes de segundo a tercer grado como padres sustitutos. Comparamos la calidad de la inferencia de PofO dada por los padres sustitutos con el enfoque directo basado en los genomas de los padres, considerado como la verdad fundamental. Encontramos un total de 3872 dúos de padres e hijos y 1037 tríos, de los cuales 1090 dúos y 309 tríos también tienen grupos de padres sustitutos. Utilizamos este subconjunto de 1399 muestras para evaluar los parámetros óptimos y la precisión del método. Nos enfocamos en dos métricas: (i) la tasa de error, que es el porcentaje de genotipos heterocigotos con asignación incorrecta de PofO y (ii) la tasa de llamada, que es el porcentaje de genotipos heterocigotos para los que se podría hacer una llamada PofO (ver Métodos). Exploramos una variedad de configuraciones de parámetros diferentes para la detección de EII y la puntuación de confianza de PofO (es decir, certeza gradual en el andamio de haplotipos) y descubrimos que el uso de segmentos de haplotipos de más de 3 cm como andamio y una certeza de fase superior a 0,7 conducen a una buena compensación entre la tasa de llamada y la tasa de error (Fig. 2a). Esto dio como resultado una tasa de error del genoma completo del 0,51 % y una tasa de llamadas del 74,5 %. Como era de esperar, el error y la tasa de llamadas dependen de la cantidad de padres sustitutos disponibles por objetivo, aumentando la tasa de llamadas y disminuyendo la tasa de error a medida que aumenta la cantidad de padres sustitutos (Fig. 2b). La mayoría de nuestros objetivos solo tienen un único padre sustituto (75,95% de las muestras objetivo, Fig. 2c) e incluso en este caso, se logra una tasa de llamadas del 70,9% y una tasa de error del 0,6% (Fig. 2b ). Luego consideramos la localización genómica de las variantes: encontramos una tasa de llamada más baja y una tasa de error ligeramente más alta a medida que nos acercamos a los telómeros, lo que resulta de los efectos de borde de fase (Fig. 2d). En general, encontramos tasas de error pequeñas para la mayoría de las variantes: el 79 % tiene una tasa de error 15. En general, obtuvimos una tasa de error de cambio de genoma completo del 0,0845 % entre genotipos heterocigotos consecutivos en comparación con los genomas parentales, con solo pequeñas variaciones entre los cromosomas (Fig. 2A complementaria). Al observar la distribución de estos errores de cambio a lo largo del genoma, descubrimos que en su mayoría ocurren dentro de segmentos pequeños y que los errores de largo alcance se corrigen casi por completo mediante el uso de andamios de haplotipos (Fig. 2B complementaria). Como resultado, obtuvimos haplotipos que se resuelven en cromosomas completos con solo unos pocos errores esporádicos que, dada su frecuencia (tasa de error

Fig. 2: Validación de la inferencia PofO.
Figura 2

a Tasa de llamadas (X-eje) y la tasa de error (y-eje) en función de (i) la longitud mínima de las pistas de EII para la construcción de andamios y (ii) la probabilidad mínima de fase utilizada para llamar a un heterocigoto como en fase. Cada punto corresponde a un umbral de probabilidad de fase dado que va de 0,5 (punto más a la derecha) a 1,0 (punto más a la izquierda) con pasos de 0,05. La flecha gris indica los parámetros que utilizamos en nuestro análisis (pistas de EII de 3 cm de largo y probabilidad de fase mínima de 0,7). b Tasa de llamada (izquierda y-eje) y la tasa de error (derecho y-eje) en función de la composición de los grupos parentales (X-eje). Este último varía desde un grupo de padres con un padre sustituto (izquierda) hasta dos grupos de padres que comprenden múltiples padres sustitutos (derecha). C Fracción de blancos en función de la composición de los grupos parentales (X-eje): en los datos de validación (norte = 1399) en gris y en el conjunto de llamadas (norte = 21,484) en negro. d Tasa de error (panel superior; y-eje) y tasa de llamada (panel inferior; y-eje) por sitio variante en función de sus posiciones normalizadas en relación con cada telómero (X-ejes). Las líneas rojas son curvas de densidad ajustadas. Las tasas de error superiores al 10 % tienen un límite del 11 %, como indica la línea gris discontinua. mi Distribución de las tasas de error por número de sitios variantes (y-eje, escala logarítmica). F Fracción de muestras (púrpura) y heterocigotos (es decir, tasa de llamadas; naranja) en el conjunto de llamadas para las que se infiere PofO, en función de la longitud del cromosoma (cM, X-eje). Los números de cromosomas se muestran junto a los puntos en negro. Los datos de origen se proporcionan como un archivo de datos de origen.

Inferencia de PofO en 26.393 individuos

Para todos los individuos británicos e irlandeses con genotipo en el Biobanco del Reino Unido sin ningún padre con genotipo (norte = 438,993), inferimos el PofO utilizando el método basado en padres sustitutos, como se describe anteriormente. En total, encontramos 105.826 muestras con familiares de segundo a tercer grado formando grupos de padres sustitutos. Entre ellos, podríamos asignar el estado de los padres a los grupos de padres sustitutos a un subconjunto de 21 484 muestras utilizando la coincidencia de IBD en el cromosoma X. Al comparar la distribución de padres sustitutos por muestra objetivo, encontramos una coincidencia notable entre el completo (norte = 21,484) y la validación (norte= 1399) conjuntos de datos (Fig. 2c), lo que sugiere que podemos esperar tasas de error similares entre conjuntos de datos. Como nuestro método requiere el intercambio de EII entre los objetivos y los padres sustitutos, no se puede hacer ninguna inferencia para los cromosomas donde no se encuentra el intercambio de EII. Por lo tanto, el número de muestras con inferencia de PofO varía entre los cromosomas según su longitud, desde 15 645 muestras (72,8 %) para el cromosoma 21 hasta 20 381 muestras (94,8 %) para el cromosoma 1 (Fig. 2f). De ello se deduce que la tasa de llamada también varía entre los cromosomas, desde el 66 % para el cromosoma 21 hasta el 77,9 % para el cromosoma 2 (Fig. 2f). Desde el punto de vista de la muestra, encontramos que el 31,3 % de las muestras tiene inferencia para los 22 autosomas y el 96,1 % tiene inferencia para más de 15 cromosomas (Fig. 3 complementaria). Finalmente, fusionamos las 21 484 muestras con PofO inferidas de padres sustitutos junto con las 4909 muestras con PofO inferidas de padres genotipados (3872 dúos y 1037 tríos) para obtener un conjunto final que comprende un total de 26 393 individuos con inferencia PofO (22 652 machos y 3741 hembras) en 7,6 millones de variantes en todo el genoma (Tabla complementaria 1). Junto con el fenotipado profundo proporcionado por el Biobanco del Reino Unido, esto representa un conjunto de datos único para estudiar los efectos de PofO en rasgos complejos.

Descubrimiento de asociaciones PofO

Distinguir los alelos heredados por vía paterna de los heredados por vía materna nos permite diseñar diferentes exploraciones de asociación para probar la especificidad de PofO de las asociaciones: (i) materna, para probar solo los alelos heredados por vía materna, (ii) paterna, para probar solo los alelos heredados por vía paterna, (iii) diferencial, para comparar los alelos heredados por vía paterna y materna en genotipos heterocigóticos únicamente y (iv) aditivo, como control para probar alelos menores independientemente de PofO. Usando estos modelos, escaneamos para la asociación 99 fenotipos cuantitativos del biobanco del Reino Unido usando BOLT-LMM18 (Datos complementarios 1), para los que proporcionamos todas las estadísticas resumidas en línea (http://poedb.dcsr.unil.ch/).

En un primer paso, nos enfocamos en que las variantes fueran Bonferroni significativas tanto en los escaneos diferenciales como aditivos (pags −08) y utilizó los escaneos paterno y materno para determinar el origen parental y la dirección del efecto. Encontramos dos señales que cumplían estos criterios. El primero es una asociación de PofO con fenotipos plaquetarios en el MEG3/DLK1 locus impreso19 (Tabla 1 y Fig. 3a, b). El SNP principal rs59228823 es un eQTL para MEG3 en muestras de sangre20 y se asocia con el recuento de plaquetas y el crit plaquetario en las gammagrafías aditivas, maternas y diferenciales, pero no en las paternas (Tabla 1). El alelo menor C en este SNP reduce significativamente el recuento de plaquetas y el crit cuando se hereda por vía materna (Tabla 1 y Fig. 3c). Anteriormente se informó un efecto materno similar en el recuento de plaquetas para otro SNP en el mismo locus.8,9: rs1555405, que está en desequilibrio de ligamiento con rs59228823 (R2= 0,59). También replicamos la asociación en rs1555405 (materno, paterno, diferencial pags-valores = 2 × 10−160.13, 1.4 × 10−06, Figura complementaria 4A), lo que sugiere que estas dos asociaciones capturan el mismo efecto. La segunda asociación de PofO que encontramos es en SNP rs2735940 para el fenotipo de longitud de telómero de leucocitos (TL), con el alelo menor G disminuyendo TL solo cuando se hereda por vía materna (Tabla 1 y Fig. 4a-c). Este SNP se encuentra ~1,5 kb aguas arriba del promotor de TERCERO (Fig. 4b), un gen que codifica la subunidad catalítica de la telomerasa, una enzima involucrada en el mantenimiento de TL21. Este SNP está en alto desequilibrio de ligamiento con el SNP rs2853677 (r2= 0,6), informado previamente en diferentes GWAS para cánceres múltiples22,23recuentos de glóbulos24envejecimiento25 y longitud de los telómeros26. Cuando probamos directamente rs2853677 en nuestros datos, encontramos un fuerte efecto materno similar al SNP principal (materno, paterno, diferencial pags-valores = 4,6 ×10−170.8, 7.9 × 10−11, Figura complementaria 4B). Esto sugiere que un efecto de padre de origen subyace a este locus pleiotrópico.

Tabla 1 Descubrimiento de asociaciones PofO
Fig. 3: Exploraciones de asociación para los efectos de PofO en el crítico de plaquetas.
figura 3

a Gráficos de Manhattan de cuatro exploraciones de asociación con análisis de plaquetas. Los gráficos de arriba a abajo muestran los resultados de las exploraciones aditivas (negro), maternas (rojo), paternas (azul) y diferenciales (verde). La variante de plomo mencionada en este estudio (rs59228823) se muestra con un diamante. Las líneas horizontales rojas indican el umbral de significación de todo el genoma en −log10(5 × 10−08). b Locus zoom en rs59228823 en el escaneo diferencial. C Diagrama de caja del crit plaquetario normalizado (y-eje) estratificado por alelos de riesgo y origen en SNP rs59228823; paterno en azul y materno en rojo (X-eje). Las líneas punteadas horizontales representan la mediana fenotípica del alelo principal G. Los recuadros limitan los cuantiles 25, 50 (mediana) y 75. Los bigotes van desde mínimos (inferiores) hasta máximos (superiores). Los tamaños de muestra son nortepaternal(G/C) = 16,285/4,769 y nortematerno(G/C)=16,368/4686 individuos. NS no significativo (pags-valor = 0.66); ***=significativo (pags-valor = 6.6 × 10−17) (calculado con BOLT-LMM18). Datos de origen para (a) y (b) se proporcionan como un archivo de datos de origen.

Fig. 4: Exploraciones de asociación para los efectos de PofO en la longitud de los telómeros.
Figura 4

a Gráficos de Manhattan de cuatro exploraciones de asociación con la longitud de los telómeros. Los gráficos de arriba a abajo muestran los resultados de los modelos aditivo (negro), materno (rojo), paterno (azul) y diferencial (verde). La variante de plomo mencionada en este estudio (rs2735940) se muestra con un diamante. Las líneas horizontales rojas indican el umbral de significación de todo el genoma en −log10(5 × 10−08). b Locus zoom en rs2735940 en el escaneo diferencial. C Diagrama de caja de la longitud normalizada de los telómeros (y-eje) estratificado por alelos de riesgo y origen en SNP rs2735940; paterno en azul y materno en rojo (X-eje). Las líneas punteadas horizontales representan la mediana fenotípica del alelo principal A. Los recuadros limitan el cuantil 25, 50 (mediana) y 75. Los bigotes van desde mínimos (inferiores) hasta máximos (superiores). Los tamaños de muestra son nortepaternal(A/G) = 10,627/10,337 y nortematerno(A/G)=10.635/10.329 personas. NS no significativo (pags-valor = 0.46); *** = significativo (pags-value = 2.1 × 10−19) (calculado con BOLT-LMM18). Datos de origen para (a) y (b) se proporcionan como un archivo de datos de origen.

En un segundo paso, nos enfocamos en las asociaciones que son Bonferroni significativas en los escaneos diferenciales pero que no son compatibles con los escaneos aditivos. En total, encontramos 14 de estas asociaciones que clasificamos como efectos putativos de PofO (Tabla complementaria 2). Esto incluye tres asociaciones maternas, cuatro asociaciones paternas y siete asociaciones con efecto opuesto entre los alelos heredados paterno y materno que son consistente con un patrón de dominancia bipolar2. Para confirmar estos resultados, utilizamos un método desarrollado por Hoggart et al.11 diseñado para capturar los efectos de PofO mediante la detección de una mayor variación entre heterocigotos en comparación con homocigotos. Usando este método en el conjunto completo de muestras británicas (norte = 443,993), todas las asociaciones tienen pags-valores ARHGAP15 y disminuyendo el porcentaje de eosinófilos cuando se hereda por vía materna mientras que aumenta el rasgo cuando se hereda por vía paterna. ARHGAP15 es una proteína activadora de Rho GTPasa que ya se ha asociado con múltiples fenotipos de células sanguíneas, en particular neutrófilos, leucocitos y eosinófilos27,28,29. Estos son ejemplos de efectos genéticos que el modelo aditivo pasa por alto, ya que la contribución paterna y materna en los sitios heterocigotos se anula cuando se consideran juntos.

Finalmente, usamos las asociaciones PofO en el MEG3/DLK1 lugar y en el TERCERO locus para ilustrar el beneficio de usar nuestra inferencia PofO sobre el poder de descubrimiento de los efectos PofO. Para ello, utilizamos 4909 dúos/tríos de biobancos del Reino Unido como referencia y añadimos gradualmente subconjuntos aleatorios de 5000 muestras para las que se podía hacer una inferencia de PofO a partir de padres sustitutos, finalizando con el conjunto completo de 26 393 muestras. Hacerlo condujo a un claro aumento en la fuerza de la asociación para las señales aditivas, maternas y diferenciales, con exploraciones maternas que iban desde no significativas en los dúos/tríos para el crítico plaquetario y TL (norte= 4909; pags-valor = 6.28 × 10−04 y 8.36 × 10−05respectivamente) a fuertemente significativo en el tamaño total de la muestra (norte = 26,393; pags-valor = 6.6 × 10−17 y 2.1 × 10−19, respectivamente; Fig. 5a, b), mientras que la señal paterna no fue significativa. De manera similar, también observamos los efectos de los errores en la inferencia de PofO en el poder de descubrimiento al aleatorizar la asignación de PofO para un número creciente de muestras. Esto diluyó progresivamente la señal materna en los dos orígenes parentales mientras dejaba la señal aditiva sin cambios (Fig. 5c, d). Curiosamente, la asociación con TL sigue siendo significativa con hasta un 10 % de errores en la inferencia de PofO, lo que sugiere que las pruebas de PofO podrían tolerar tasas de error relativamente altas con nuestro tamaño de muestra.

Fig. 5: Robustez de la prueba de PofO.
Figura 5

a, b Fuerza de asociación como −log10(pags-valor) para rs59228823 y rs2735940 (y-eje) en el crit de plaquetas y TL, respectivamente, en función del número de muestras elegidas aleatoriamente incluidas en el análisis bajo las exploraciones aditiva (negra), paterna (azul), materna (roja) y diferencial (verde). Cada punto por norte = [10,000; 15,000; 20,000] representa la mediana pags-valor obtenido después de 10 aleatorizaciones con barras verticales que representan el error estándar. Puntos para norte= 4909 y norte = 26,393 representan el pags-valores obtenidos usando solo las muestras con padres genotipados y usando nuestro tamaño de muestra completo, respectivamente. C, d Fuerza de asociación como −log10(pags-valor) para rs59228823 y rs2735940 (y-eje) en el crit de plaquetas y TL, respectivamente, en función de la fracción de muestras para las que se ha extraído aleatoriamente PofO (X-eje, 100%=26,393). Las muestras incluidas son aquellas para las que se ha inferido el PofO de los padres sustitutos. Cada punto representa la mediana pags-valor obtenido después de 10 aleatorizaciones con barras verticales que representan los errores estándar. PAGS-los valores se calculan con BOLT-LMM18. Los datos de origen se proporcionan como un archivo de datos de origen.

Replicación de asociaciones PofO

El conjunto de llamadas de PofO para el Biobanco del Reino Unido generado con nuestro método proporciona un recurso poderoso para replicar asociaciones de PofO independientes o para anotar otros tipos de asociaciones como efectos de PofO. Para mostrar esto, evaluamos la capacidad de nuestro método para replicar los resultados de siete estudios GWAS en múltiples fenotipos que a menudo se estudian en el contexto de los efectos de PofO. Estos estudios pertenecen a tres categorías diferentes: (i) estudios de PofO que utilizan tríos o genealogías conocidas, (ii) estudios de PofO en individuos no relacionados que utilizan un método de varianza aumentada y (iii) estudios que investigan las interacciones genotipo-ambiente (GxE).

Altura de pie

Nos centramos en las 11 asociaciones de PofO informadas en tres estudios que utilizan la inferencia de PofO basada en la genealogía.30,31,32, 9 de los cuales podrían evaluarse en nuestros datos (par de SNP-fenotipo idéntico en el Biobanco del Reino Unido). Siete de estas asociaciones están ubicadas en dos conocidas regiones impresas, 11p15.5 y 14q32, y las dos restantes están ubicadas en la región HLA. Solo se ha replicado una asociación en los dos de los tres estudios en rs143840904. Por el contrario, replicamos 8 asociaciones de las 9 que pudimos probar, con el mismo padre y la misma dirección de los efectos (Tabla 2A-C), reforzando así el papel de estas dos conocidas regiones impresas en la altura y brindando más evidencia sobre el efecto PofO en la región HLA.

Tabla 2 Replicación de asociaciones PofO

Biomarcadores sanguíneos

Un estudio reciente9 examinó múltiples biomarcadores sanguíneos e informó un total de 10 asociaciones de PofO dentro de loci impresos utilizando la inferencia de PofO basada en tríos. En nuestro conjunto de datos pudimos evaluar 7 de estas asociaciones y replicamos 5 de ellas, con el mismo padre y dirección de efectos (Tabla 2D). Esto incluyó el efecto PofO sobre los fenotipos plaquetarios en el MEG3/DLK1 locus que informamos anteriormente.

Diabetes tipo 2

Kong et al.6 informó un total de 4 asociaciones de PofO en diabetes tipo 2 (T2D) utilizando la inferencia de PofO basada en la genealogía. Caen dentro de dos regiones distintas que albergan grupos de genes impresos bien documentados, 11p15.533 y 7q3234,35. Como no pudimos probar directamente el estado de DT2 debido a la pequeña cantidad de casos en nuestro conjunto de datos, probamos el biomarcador más correlacionado con DT2: hemoglobina glucosilada (HbA1c,https://ukbb-rg.hail.is/). Al hacerlo, replicamos las tres asociaciones más fuertes con el mismo efecto parental (Tabla 2E). Además, analizamos en todo el fenómeno estas cuatro variantes en nuestro conjunto de datos y encontramos 22 asociaciones con diferencias pags-valor

IMC por aumento de la varianza

Hoggart et al.11 informaron un total de 6 asociaciones de PofO con el IMC utilizando un método de varianza aumentada diseñado para capturar los efectos de PofO, dos de los cuales se replicaron utilizando conjuntos de datos familiares independientes. Estos incluyen variantes asociadas con genes impresos conocidos, SLC2A10 en 20q13.12 y KCNK9 en 8q24.3. Podríamos replicar la asociación más fuerte en nuestro conjunto de datos en el KCNK9 locus, con el alelo T de rs2471083 aumentando el IMC cuando se hereda por vía materna (Tabla 2F). Aquí, nuestra replicación ofrece soporte adicional para el locus KCNK9 y la confirmación del origen materno de este efecto, una información que el enfoque de varianza aumentada no puede proporcionar.

IMC por GxE

Presumimos que algunas señales GxE detectadas para el IMC podrían deberse a los efectos de PofO. Utilizando el Biobanco del Reino Unido, Kerin et al.36 informó dos asociaciones GxE en rs2153960 y rs539515, mapeándose a FOXO3 y SEC16Brespectivamente, con este último replicado por otro estudio37. En nuestro estudio, encontramos un efecto paterno de rs539515 en el IMC (Tabla 2G, diferencial materno, paterno pags-valores = 0,047, 7,3 ×10−09, 0,0069). Curiosamente, al realizar un escaneo de todo el fenoma del locus 1q25.2 que alberga rs539515, encontramos asociaciones paternas entre cuatro SNP en LD alto (rs527065, rs539515, rs8030 y rs531385; r2 > 0.5) con peso, cintura circunferencia de la cadera, tasa metabólica basal y masa de brazos/piernas (materna pags-valores > 0.05, paterno pags-valores 8diferencial pags-valores SEC16B (QTL intrónicos o de empalme) y ya se han asociado con fenotipos relacionados con el peso o la obesidad bajo el modelo aditivo38,39,40. En conjunto, esto sugiere que el efecto GxE de SEC16B en el IMC probablemente se deba a un efecto paterno.

Peso de nacimiento

Investigamos las 22 asociaciones de PofO informadas con el fenotipo del peso al nacer41 y no pudimos replicar ninguna de estas asociaciones en nuestros datos, ni ninguno de los aditivos (Datos complementarios 3). Lo más probable es que esto se deba a alguna especificación incorrecta del fenotipo del peso al nacer en el Biobanco del Reino Unido, ya que este fenotipo es autoinformado por personas de entre 39 y 73 años, lo que probablemente sea menos confiable que el peso al nacer del recién nacido informado por la madre. Además, los individuos con especificación de peso al nacer disponible representan solo la mitad de nuestras muestras (Datos complementarios 1), lo que reduce considerablemente el poder de descubrimiento.

Fuente del artículo

Deja un comentario