AMADAR: un paquete basado en Python para la predicción a gran escala de geometrías de estado de transición Diels-Alder y análisis de ruta IRC | Revista de quimioinformática

Paso 1

El programa se inicia desde__init.py secuencia de comandos de un entorno RDKit local. Este script accede a las cadenas SMILES de los cicloaductos guardados en el archivo SMILES.txt y lee la entrada del usuario desde el archivo de configuración principal (da.ini). Este archivo de configuración principal contiene indicadores que deben establecerse de acuerdo con el tipo de trabajos que el usuario desee realizar. La descripción y el uso de las palabras clave (banderas) en el archivo da.ini se proporcionan en el archivo adicional 1 (archivo adicional 3: tabla S1).

Paso 2

Las cadenas SMILES a las que se accede se convierten en mol objetos, que luego se utilizan para localizar y realizar un seguimiento de los sitios reactivos (RS). Como tal, se devuelve una lista ordenada de índices atómicos (ListAtomsInt), en la que cuatro átomos se originan en el dieno y los otros dos en el dienófilo. En caso de que el cicloaducto tenga más de una subestructura de ciclohexeno, se devuelve una lista con forma de 2 × n, siendo n el número de subestructuras de ciclohexeno. Esto da como resultado rutas en competencia que se tratan por separado.

Paso 3

En este paso se obtiene la geometría 3D de los cicloaductos en coordenadas cartesianas mediante un procedimiento secuencial, incluyendo la incrustación de sus mol objeto y la optimización del confórmero devuelto utilizando el campo de fuerza UFF [16]. UFF es un campo de fuerza ampliamente aplicable que contiene parámetros para casi todos los átomos de la tabla periódica. Esto garantiza que no se devuelva ningún error al estudiar un sistema con átomos tan poco comunes como los actínidos debido a parámetros de campo de fuerza inexistentes. Además, dado que UFF es un campo de fuerza no reactivo, la topología del sistema bajo investigación se mantiene intacta durante esta búsqueda de conformación, evitando cualquier ruptura o formación de enlaces. En caso de falla, se repite el procedimiento, esta vez buscando más conformadores (hasta 60) y aumentando el número de corridas (hasta 2000). El confórmero seleccionado se utiliza como entrada en la optimización restringida hacia la pseudo-conjetura del TS (paso 4).

Paso 4

Una optimización restringida en coordenadas internas obliga a los cicloaductos a adoptar una configuración simétrica de dos fragmentos en la que dos pares de átomos de C terminales del dieno y el dienófilo están separados por 2,15 Å. Tenga en cuenta que las posiciones de estos átomos de C se recuperan del ListAtomsInt obtenido en el paso 2. El usuario puede modificar la distancia de separación predeterminada de 2,15 Å. Para ello, tienen que editar simultáneamente el archivo de configuración ini.da y el Gen_gjf_file_ts() metodo de la Geom_3D.py módulo. Usando la configuración predeterminada, esta optimización devuelve 16 configuraciones sucesivas del sistema, de las cuales la estructura de energía más alta (una estructura de 2 fragmentos para reacciones DA intermoleculares) corresponde a la pseudo-conjetura TS. Este último se aísla y luego se limpia al mismo nivel de teoría utilizando el algoritmo de Berny de un solo extremo de TS. [17]. Esto da lugar a la conjetura-TS. Se ha encontrado que el método semiempírico PM6 funciona bien en este paso.

Paso 5

Para cada sistema, se realiza un nuevo cálculo de TS para refinar la estructura de suposición anterior en un nivel de teoría de mecánica cuántica definido por el usuario. Este paso va seguido de una verificación vibratoria para asegurarse de que el punto estacionario previsto sea un TS real. Esta verificación está destinada a asegurar que el TS devuelto tenga solo una frecuencia imaginaria. Para ello, examinamos (extraemos y contamos) los modos vibracionales normales del sistema. Solo las estructuras con una frecuencia negativa (imaginaria) única se conservan como TS reales. Los puntos estacionarios rechazados se copian automáticamente en una carpeta adecuada denominada ERROR_FILES. Los pasos 3 a 5 se ilustran en la figura 2 para un pequeño conjunto de tres sistemas seleccionados al azar. Archivo adicional 3: la Fig. S1 representa geometrías (optimizadas) de los reactivos asociados (dieno y dienófilo), cuyas cadenas SMILES se generaron primero aplicando el proceso_retro_Diels_Alder() función de la retro_DA() módulo al cicloaducto SMILES, antes de optimizarse secuencialmente en los niveles PM6 y B3LYP/6-31G(d) respectivamente (archivo adicional 2).

Figura 2
Figura 2

Ilustración del proceso hacia la predicción de TS por el programa AMADAR a partir de cadenas de cicloaductos SMILES. Los índices de sincronicidad (S) se dan en los diferentes pasos

Paso 6

Una vez que se ha localizado el TS, se puede determinar la ruta de IRC. Los detalles sobre el nivel teórico o el número de puntos IRC los define el usuario en el archivo da.ini. Hemos observado que al menos 60 puntos por dirección IRC desde el TS son suficientes para obtener una buena ruta IRC (para sistemas de tamaño medio con heteroátomos) que une los reactivos a los cicloaductos a través del TS. Las geometrías de los reactivos y cicloaductos se pueden optimizar junto con la del TS (durante los pasos 2 a 4) si RC_FLAG en el da.ini se establece en 1 (Tabla 1).

Después de los cálculos de IRC, un script separado llamado myIRCAnalyzer.py puede ser ejecutado para realizar ranálisis de fuerza de reacción (RFA, paso 7) y descomposiciones atómicas de la fuerza de reacción y la constante de fuerza de reacción (paso 8) para reacciones específicas. Los detalles sobre el sistema a analizar o los átomos a considerar en la descomposición se deben dar en un archivo de configuración separado (analysis.ini). La descripción y el uso de todas las palabras clave (y secciones) que se encuentran en los archivos de configuración de analysis.ini se proporcionan en el Archivo adicional 3: Tabla S2.

Paso 7

Un módulo especial (ARF) se ha integrado al paquete para ejecutar todos los cálculos relacionados con el análisis de la fuerza de reacción. Los detalles sobre el paradigma RFA se pueden encontrar aquí [18].Dos cantidades importantes de la teoría son la fuerza de reacción F y la constante de fuerza de reacción (kappa), que se definen usando las Ecs. 1 y 2, donde E es la energía del sistema a lo largo de la ruta IRC (xi). Torro-Labé y sus colaboradores han proporcionado pruebas sólidas que demuestran que F y (kappa) puede ayudar a comprender mejor el mecanismo de varias reacciones [19].

$$_=-frac,$$

(1)

$$_=frac=-frac.$$

(2)

F y (kappa) se calculan numéricamente en cada punto de la ruta IRC utilizando el enfoque de diferencia finita. Técnicamente, el valor promedio de las derivadas hacia adelante y hacia atrás en cada punto dado se usa como una buena estimación de la derivada exacta, excepto para el primer y último punto de la ruta IRC. Se ignorará cualquier intento de ejecutar este análisis si RFA_FLAG en el archivo da.ini no se ha establecido en 1.

Paso 8

Como lo demuestran Jędrzejewski et al. [20]la fuerza de reacción F y la constante de fuerza (kappa) se puede descomponer en contribuciones atómicas introduciendo Hellman-Feynman [21] fuerzas que actúan sobre cada núcleo en la definición estándar de F y (kappa) (Ecuaciones 3-4).

$$_=-frac=-sum_frac frac=sum__frac=sum__left(xi right),$$

(3)

$$_=-frac=-sum_frac izquierda[_fracright]=sum__left(xi right).$$

(4)

Es más, (_) se puede dividir en dos componentes que se originan a partir de los átomos y enlaces de la molécula (Ec. 5) [20].

$$_=sum_^_(xi )+2sum_^sum_{B

(5)

donde las sumas corren sobre todos los átomos en la molécula.

También hemos incorporado en el paquete AMADAR un módulo llamado RFD, que implementa las Ecs. 3–5 en el caso de reacciones DA. Para realizar la serie de análisis de descomposición disponibles en el módulo, RFD_FLAG en el archivo da.ini debe establecerse en 1 antes de ejecutar el script myIRCAnalyzer.py (Fig. 3).

Fig. 3
figura 3

Ilustración de los resultados clave del programa AMADAR: S (Índice de sincronicidad en Å); Análisis de la fuerza de reacción (E, F, en kcal, kcal/(xi) y kcal/(xi)2 respectivamente); Descomposición atómica de la constante de fuerza de reacción ((kappa) en Hartree/Bohr2): las curvas violeta y granate indican las contribuciones de los dos pares de átomos que interactúan del dieno y el dienófilo. La línea discontinua da la (_^) componente de (kappa)

¿Que te ha parecido?

Deja un comentario