Un modelo de red neuronal para detectar genes característicos del cáncer de páncreas | BMC Bioinformática

En los últimos años, el cáncer de páncreas ha mostrado una tendencia creciente a nivel mundial. La tasa de mortalidad resultante también está aumentando. Desde 1990 hasta 2017, la cantidad de muertes, casos incidentes y años de vida ajustados por discapacidad causados ​​por el cáncer de páncreas en el mundo se ha más que duplicado [1], y podría convertirse en la segunda causa principal de muerte por cáncer en los próximos 20 a 30 años. En las últimas décadas, la investigación y el tratamiento del cáncer de páncreas han progresado lentamente. El diagnóstico de cáncer de páncreas temprano aún es difícil, con una tasa de supervivencia a 5 años de menos del 10 %, y la mayor parte de la esperanza de vida después del diagnóstico no supera el medio año [2]. El mal pronóstico del cáncer de páncreas está íntimamente relacionado con la dificultad del diagnóstico precoz de la enfermedad. La aparición del cáncer de páncreas es oculta y los síntomas son dolor abdominal, dolor de espalda, pérdida de peso, etc., sin manifestaciones específicas. Cuando los síntomas son evidentes, es difícil realizar un tratamiento quirúrgico, solo alrededor del 20% de los pacientes pueden ser diagnosticados y resecados a tiempo en una etapa temprana, y la tasa de supervivencia a 5 años de los pacientes sometidos a resección quirúrgica es de solo 15-25. % [3]la respuesta del cáncer de páncreas a la mayoría de los medicamentos de quimioterapia también es deficiente.

El tabaquismo, la obesidad y la diabetes se conocen como los principales factores de riesgo del cáncer de páncreas, y el consumo excesivo de alcohol también es una de las razones del aumento del riesgo de cáncer de páncreas. Fumar sigue siendo la principal causa de cáncer de páncreas en el mundo, y actualmente se reconoce como un factor de riesgo [4,5,6]. Otros pueden estar relacionados con pancreatitis, alergia, flora microbiana y genes de susceptibilidad genética. En la actualidad, la TC con protocolo pancreático trifásico es una forma importante de diagnosticar el cáncer de páncreas. En gran medida, proporciona valor predictivo para la resección y valor de referencia para el cáncer de páncreas avanzado y la metástasis. Sin embargo, tiene poca sensibilidad para detectar el cáncer de páncreas temprano. La ecografía endoscópica también es muy útil para el diagnóstico del cáncer de páncreas, y el muestreo citológico de diagnóstico se realiza bajo un endoscopio. Además, la resonancia magnética también juega un cierto papel en el diagnóstico del cáncer de páncreas. [7].

La red neuronal artificial (ANN) es un nuevo campo utilizado actualmente para el análisis de datos. Es un modelo construido en base a aprendizaje automático, que ha sido utilizado para resolver diversas tareas. La red neuronal toma las neuronas como la unidad básica de cálculo, acepta datos de entrada o externos de diferentes neuronas y luego calcula una salida. Los diferentes valores de entrada tienen un peso, y el tamaño del peso se usa para medir la importancia del valor de entrada. ANN procesa información y transformaciones no lineales al simular la forma en que el cerebro humano procesa la información, no solo de acuerdo con un programa dado, sino que también se adapta al entorno y resume las reglas, adquiere conocimiento externo a través del aprendizaje y lo almacena en la red. [8]. Pueden procesar datos a gran escala de forma rápida y precisa, y pueden predecir con precisión. La precisión del modelo es particularmente importante para estudiar y comprender los posibles mecanismos moleculares y celulares. [9, 10]. En muchos problemas de bioinformática, han mostrado un mejor rendimiento que los métodos tradicionales de aprendizaje automático, como el descubrimiento de motivos de secuencia. [10, 11]predicción de la interacción de la cromatina [12]y detección de variaciones genéticas [13].

El aprendizaje automático analizará y procesará una gran cantidad de datos de diferentes bases de datos, extraerá la información genética que cumpla con nuestras condiciones de selección en la mayor medida en el caso de una intervención humana mínima, construirá un árbol forestal aleatorio. Juzgando su importancia de acuerdo con el peso de la información genética de entrada, realice cálculos en la capa oculta intermedia, transforme la información de entrada de la capa de entrada a través del cálculo y luego envíela a la capa de salida, realice un análisis en profundidad de los resultados de salida , y aclaró las características de sus atributos. Después de eso, la curva ROC detectó nuevamente la precisión del árbol forestal aleatorio. Además, el árbol forestal aleatorio se ha utilizado ampliamente para predecir la tasa de hospitalización y el riesgo de recurrencia. [14].

En el modelo genético del cáncer, el modelo de red neuronal extrae genes de características cruzadas de múltiples bases de datos de cáncer y busca genes con una expresión diferencial significativa y vías de alta correlación, que es un método efectivo para aprender sobre la enfermedad y buscar más. [8]. Cada vez se aplican más modelos de redes neuronales a la investigación del cáncer, lo que proporciona un valor de referencia para la predicción temprana y el pronóstico del cáncer. Por ejemplo, se han mostrado características sobresalientes en la predicción de factores de riesgo [15]o red de cápsulas (CapsNet) en un nuevo modelo de identificación de compuestos relacionados con enfermedades [16]. Sin embargo, todavía faltan modelos ideales en el cáncer de páncreas, incluidos biomarcadores y mecanismos de vía, para proporcionar ideas completas del cáncer de páncreas, con especificidad y sensibilidad exactas.

Por lo tanto, nuestra investigación tiene como objetivo realizar un análisis en profundidad del cáncer de páncreas mediante la construcción de un modelo de red neuronal para filtrar sus genes característicos. Los datos adquiridos de la base de datos GEO se ordenaron y resumieron, y los genes característicos se seleccionaron de genes expresados ​​(DEG) como biomarcadores candidatos de acuerdo con sus puntajes de importancia. Luego, estos DEG se validaron a nivel de transcriptoma y proteína, lo que demostró las diferencias en su expresión en tejidos de cáncer de páncreas y su impacto en el pronóstico.

Fuente del artículo

Deja un comentario