Citación: Parra-Barrero E, Cheng S (2023) Aprendiendo a predecir ubicaciones futuras con secuencias theta generadas internamente. PLoS Comput Biol 19(5): e1011101. https://doi.org/10.1371/journal.pcbi.1011101
Editor: Daniel Bush, University College London, REINO UNIDO
Recibió: 16 de diciembre de 2022; Aceptado: 13 de abril de 2023; Publicado: 12 de mayo de 2023
Derechos de autor: © 2023 Parra-Barrero, Cheng. Este es un artículo de acceso abierto distribuido bajo los términos de la Licencia de atribución de Creative Commonsque permite el uso, la distribución y la reproducción sin restricciones en cualquier medio, siempre que se acredite el autor original y la fuente.
Disponibilidad de datos: Todo el código escrito en apoyo de esta publicación está disponible públicamente en https://github.com/EloyPB/theta_sequence_models.
Fondos: Este trabajo fue apoyado por subvenciones de la Fundación Alemana de Investigación (Deutsche Forschungsgemeinschaft, DFG), número de proyecto 419037518 – FOR 2812, P2 (SC) – y número de proyecto 122679504 – SFB 874, B2 (SC). Este último pagó el salario de EPB. Los financiadores no tuvieron ningún papel en el diseño del estudio, la recopilación y el análisis de datos, la decisión de publicar o la preparación del manuscrito.
Conflicto de intereses: Los autores han declarado que no existen intereses contrapuestos.
Introducción
Dentro de cada ciclo theta, la trayectoria representada por la población de células de lugar comienza en la posición donde el animal estuvo ubicado en algún momento en el pasado (p. ej., hace 1 s) y continúa hasta la posición donde el animal estará ubicado en algún momento. punto en el futuro (por ejemplo, en 1 s) asumiendo que el animal corrió a su velocidad típica en cada posición (arriba). Como resultado, los barridos theta son más cortos donde los animales normalmente corren más lento (centro a la izquierda) y más largos donde normalmente corren más rápido (centro a la derecha). A nivel de celda individual, este efecto se manifiesta como campos de lugar más pequeños con una precesión de fase más pronunciada donde los animales corren más lento (abajo a la izquierda) y campos de lugar más grandes con precesión de fase más superficial donde los animales corren más rápido (abajo a la derecha).
https://doi.org/10.1371/journal.pcbi.1011101.g001
Se ha propuesto que este código de fase theta desempeña un papel en una amplia gama de funciones cognitivas, como la memoria de trabajo. [16]secuencia de aprendizaje [4, 16, 17]predicción [12, 18]y planificación [19–22]. Sin embargo, sus mecanismos neurales subyacentes siguen siendo un tema de discusión. [23]. Algunos han argumentado que los barridos theta son el resultado de una población de células de lugar que precesan de forma independiente entre sí. [24, 25]. Una forma en que esto podría ocurrir es a través del patrón de interferencia oscilatorio creado dentro de las células que reciben dos entradas oscilatorias de frecuencias ligeramente diferentes. [3, 26]. Otra forma de generar precesión de fase a nivel de una sola célula implica la competencia entre una entrada inhibidora oscilatoria y una entrada excitatoria que aumenta a medida que el animal cruza el campo de lugar de la célula. [27–32]. A medida que aumenta la excitación, se supera la inhibición en fases progresivamente más tempranas del ciclo theta, lo que da como resultado una precesión de fase. Un problema potencial con este tipo de modelo es que la actividad de la celda de lugar siempre está ligada a entradas externas y, por lo tanto, no se puede decir que la actividad en las últimas fases de theta prediga las próximas posiciones, como a veces se cree que es el caso.
Un tipo diferente de modelo se centra en la conectividad de la red y propone que la precesión de fase resulta de secuencias theta generadas por la propagación de actividad en la red a través de conexiones sinápticas entre células (Figura 2A) [33–36]. En este tipo de modelo, a menudo se asume que las células de lugar primero se activan secuencialmente al cambiar las entradas sensoriales e idiotéticas y luego se vinculan a través de conexiones sinápticas laterales que se aprenden en las primeras pruebas en un entorno novedoso (Fig. 2B, arriba). Una alternativa intrigante es que las secuencias están preconfiguradas en la red y lo que se aprende es principalmente la asociación entre las entradas externas y las celdas en la secuencia (Fig. 2B, abajo) [37–39]. Cierto apoyo para la última alternativa proviene de la observación de que el hipocampo puede generar internamente secuencias de células de tiempo. [40, 41]. Sin embargo, lo más notable es que la idea está respaldada por la observación del juego previo: células que desarrollan una secuencia de campos de lugar en una nueva pista lineal ya disparada en un orden similar durante ondulaciones de ondas agudas antes de que el animal haya experimentado la pista. [42–46]. Aquí desarrollamos un modelo computacional mecanicista que opera en base a este principio, mapeando el espacio con secuencias preexistentes generadas internamente. Mostramos que el modelo puede dar cuenta de los barridos dependientes del comportamiento y ofrecer una explicación de la mayor densidad de campos de lugar observados alrededor de las recompensas y otras áreas donde los animales disminuyen la velocidad. [47–61].
Figura 2. Modelos de conectividad de red de precesión de fase y modo de operación propuesto.
R: En el modelo de conectividad de red de precesión de fase, cada ciclo theta comienza con picos (líneas verticales cortas) de celdas de lugar que codifican la posición actual del animal, es decir, celdas que reciben fuertes entradas externas en esa ubicación. Luego, la actividad se propaga hacia adelante a través de conexiones sinápticas a las células que codifican posiciones progresivamente más adelante. Como resultado, una célula individual dispara en posiciones progresivamente anteriores dentro de las secuencias theta a medida que el animal se acerca a la ubicación codificada por una célula, generando una precesión de fase. B: Dos variantes de modelos de conectividad de red. O bien las secuencias de campos de lugar son impulsadas inicialmente por entradas espaciales externas y las conexiones entre las celdas se aprenden después, o las conexiones entre las celdas están presentes desde el principio y la asociación con las entradas espaciales se aprende después. C: Principio subyacente a nuestro modelo de barridos dependientes del comportamiento. Una rata corre sobre una pista lineal con un perfil característico de velocidad lento-rápido-lento. Arriba: si la actividad en una secuencia impulsada internamente se propaga a un ritmo fijo en el espacio neuronal, las unidades vecinas se asocian con posiciones más cercanas donde el animal corre lentamente y más separadas donde el animal corre más rápido. Abajo: Igual que arriba, pero mostrando cada neurona en la posición con la que se asocia. El espacio neuronal podría verse como elástico, extendiéndose en áreas de alta velocidad de carrera y comprimiéndose en áreas de baja velocidad de carrera.
https://doi.org/10.1371/journal.pcbi.1011101.g002
Resultados
Mapeo elástico del espacio por secuencias generadas internamente
Fig. 3. Mapeo elástico del espacio por secuencias generadas internamente.
R: Arquitectura modelo. Una red recurrente preconfigurada de celdas de lugar (discos de colores y flechas negras) recibe entradas de celdas débilmente sintonizadas espacialmente a través de pesos de plástico Ws (discos y flechas verdes), así como excitación e inhibición rítmica iθ. Las celdas débilmente sintonizadas espacialmente y las celdas de lugar toman valores de activación continuos en los rangos [-1, 1] y [0, 1], respectivamente. B: Matriz de pesos recurrentes. La línea discontinua representa la identidad. C: Evolución temporal de iθla excitación e inhibición rítmica de todas las células de la red, y βθ, que define la ventana en la que las celdas reciben entradas espaciales. D: Las activaciones de la red cuando la rata simulada corre varias vueltas en una nueva pista lineal. La actividad en la red se inicializa en las celdas de primer lugar al comienzo de cada vuelta. En las primeras vueltas, la actividad se propaga más en la red en vueltas lentas que tardan más en completarse. Sin embargo, en ejecuciones posteriores, las entradas espaciales (verde) que llegan al comienzo de cada ciclo theta anclan la actividad de la red en el espacio. E: Las regiones de alta activación (> 0,5) en la red están contorneadas en negro y se superponen a la depresión sináptica a corto plazo, Dy facilitación, F, de las sinapsis recurrentes salientes de las células de lugar. Al salir de la inhibición rítmica, se forma un golpe de actividad en las células cuyas conexiones recurrentes están más facilitadas y menos deprimidas, (1 − D)F (panel inferior). Esto asegura que cada secuencia theta comience ligeramente por delante de donde comenzó la última. Tenga en cuenta que, debido al umbral utilizado para trazar el contorno negro, la protuberancia de actividad en realidad se forma un poco antes, dentro de la banda amarilla.
https://doi.org/10.1371/journal.pcbi.1011101.g003
Simulamos una rata corriendo varias vueltas en una pista lineal de 2 m de largo. Cada posición a lo largo de la pista tiene una velocidad de carrera media objetivo que sigue un perfil triangular, siendo 15 cm/s en ambos extremos y 80 cm/s en el medio. La velocidad instantánea de la rata se determinó en cada paso de tiempo multiplicando la velocidad media objetivo en la posición actual con un término de ruido que evoluciona suavemente con el tiempo, generando así una variabilidad de velocidad vuelta a vuelta (Figura 3D, centro).
Al comienzo de cada vuelta, la actividad se inicializaba en las primeras neuronas de la red y se dejaba evolucionar. Las primeras vueltas, la actividad se propagó a un ritmo fijo en el espacio neuronal, totalmente impulsada por la dinámica interna de la red. Por lo tanto, la actividad se propagaba más en la red cuanto más tiempo tardaba la rata simulada en completar una vuelta (Fig. 3D, arriba a la izquierda, 0–45 s). En esta etapa, las celdas de la red se comportaron como celdas de tiempo con campos de tiempo anclados al comienzo de la vuelta; sus campos de lugar cambiaron de un lado a otro dependiendo de la velocidad de carrera. La actividad de las células luego se ancló en el espacio aprendiendo las conexiones entre las entradas débilmente sintonizadas espacialmente y las células de lugar activo a través de una regla de aprendizaje hebbiana modificada. El aprendizaje fue relativamente lento para poder promediar las variaciones en la velocidad de carrera de la rata en cada posición. Las entradas espaciales llegaron solo dentro de una pequeña ventana temporal al comienzo de cada ciclo theta (Fig. 3C, curva verde), y esta es también la ventana en la que las sinapsis eran plásticas, consistentes con diferentes fases de codificación y recuperación. [67, 68]. Después de que tuvo lugar el aprendizaje, las entradas espaciales que llegan al comienzo de cada ciclo theta (Fig. 3D, abajo a la derecha, verde) extrajeron el aumento de actividad de la posición en la red en la que se habría formado basándose únicamente en la dinámica interna de la red, hacia la posición que se ha asociado con la ubicación actual del animal, anclando así la actividad de cada unidad en el espacio. En particular, si el animal corriera más rápido que el promedio, las unidades en la red asociadas con la ubicación actual del animal estarían más adelante que aquellas que se habrían vuelto activas basándose solo en la dinámica interna de la red, y por lo tanto las entradas espaciales atraerían la actividad avanza. Por el contrario, si el animal corriera más lento que el promedio, las entradas espaciales harían retroceder la actividad. Esto significa que el salto en la ubicación inicial del aumento de actividad de un ciclo theta al siguiente dejó de ser constante (Fig. 3D, arriba a la derecha, observe cómo cambia la pendiente de la relación entre el número de celda de lugar y el tiempo para rápido y lento). vueltas). Más precisamente, la velocidad a la que la actividad se propagó a través de los ciclos theta en el espacio neuronal, tuse moduló por la relación entre la velocidad de carrera instantánea, vy la velocidad de carrera promedio en cada posición, es decir,
. Para el resto de los análisis, nos enfocamos en estos períodos donde el mapeo aprendido entre el espacio físico y el neural se había estabilizado.
Efecto de la velocidad en las propiedades del campo de lugar
Primero analizamos las propiedades de los campos de lugar producidos por la red. Para obtener un análogo de los mapas de tasa de disparo, discretizamos la pista lineal y calculamos la activación promedio de cada neurona en cada contenedor espacial (Figura 4A). Usando estos mapas de activación, calculamos los tamaños de los campos de lugar y observamos que aumentaban linealmente con la velocidad media de carrera a través de los campos (Fig. 4B) de acuerdo con los barridos dependientes del comportamiento observados experimentalmente [15].
Figura 4. El modelo desarrolla campos de lugar más grandes con una precesión de fase más superficial en áreas de mayor velocidad de carrera.
A: Activación media de cada unidad en cada posición a lo largo de la pista para una ejecución de la simulación. B: Los tamaños de los campos de lugar aumentan en función de la velocidad media de carrera a través del campo de lugar. Cada punto corresponde a un campo de lugar, agrupado en 10 ejecuciones de simulación diferentes. El color del punto representa la posición del pico del campo de lugar. La línea de color muestra el tamaño de campo de lugar promedio en cada contenedor espacial a lo largo de la pista con al menos 8 muestras. C: Ejemplos de precesión de fase theta de la misma ejecución de simulación que en A. D: La precesión de fase theta se vuelve menos profunda donde el animal corre más rápido. E, F: Los tamaños de campo de lugares individuales y las pendientes de precesión de fase inversa son en gran medida invariantes de las velocidades de funcionamiento instantáneas. Se muestra un histograma de proporciones de estas medidas calculadas usando el 20% superior e inferior de las velocidades de funcionamiento instantáneas en cada ubicación. Hay una tendencia a una disminución modesta como la media de la distribución (puntos línea) está por debajo de una relación de 1. G: La densidad de campos de lugar calculada en ventanas deslizantes de 10 cm disminuye en función de la velocidad media en la ventana.
https://doi.org/10.1371/journal.pcbi.1011101.g004
Luego examinamos la precesión de fase discretizando también la fase theta y calculando la actividad promedio de cada neurona en cada intervalo de espacio × fase (Figura 4C). La precesión de fase fue más pronunciada en la primera parte del campo de lugar, como se observó experimentalmente [69]. Esto refleja el hecho de que la primera parte del campo de lugar es enteramente el resultado de secuencias theta, mientras que la última parte está mayormente determinada por entradas espaciales que llegan a las primeras fases de la oscilación theta. Nuevamente de acuerdo con las observaciones experimentales, la precesión de fase fue menos profunda en el medio de la pista, donde la velocidad de carrera es mayor. [15]. Dado que es la extensión espacial de las nubes de precesión de fase la que cambia linealmente con la velocidad media de carrera, trazar la inversa de la pendiente de precesión de fase (cm por grado) también cambia linealmente con la velocidad media (Fig. 4D). Tenga en cuenta, sin embargo, que para la misma velocidad media, los tamaños de campo de lugar son un poco más grandes y la precesión de fase un poco más superficial en la primera mitad de la trayectoria lineal, donde el animal está acelerando. Comentamos este efecto en la discusión.
El modelo de barrido dependiente del comportamiento indica que los tamaños de campo de lugar y las pendientes de precesión de fase no dependen de la velocidad de carrera instantánea del animal en una vuelta determinada. [15, 70–72]. Por lo tanto, calculamos los tamaños de campo de lugar y las pendientes de precesión de fase por separado para el 20% superior e inferior de las velocidades en cada contenedor espacial, y trazamos sus proporciones (Fig. 4E y 4F). Aunque la media de las proporciones estaba ligeramente por debajo de 1, lo que significa que los campos de lugar eran más pequeños y la precesión de fase más pronunciada cuando los animales corrían más rápido, las desviaciones eran pequeñas. Por lo tanto, concluimos que las propiedades del campo de lugar son en gran medida invariantes de la velocidad de carrera instantánea, lo que sugiere que el modelo actual proporciona una buena aproximación a los datos experimentales.
Finalmente, examinamos el efecto de la velocidad media de carrera sobre la densidad del campo de lugar contando el número de picos de campo de lugar en una ventana deslizante de 10 cm. De acuerdo con nuestras expectativas (Fig. 2C), la densidad de los campos de lugar disminuyó con la velocidad media siguiendo una curva hiperbólica (Fig. 4G).
Efecto de la velocidad en los barridos theta
A continuación, decodificamos la posición representada por la población de las celdas de lugar en nuestro modelo en cada momento. Para hacer esto, correlacionamos el vector de población que contiene la activación de cada unidad en el paso de tiempo a decodificar con los vectores de población que contienen los valores medios de activación de las unidades en cada contenedor espacial a lo largo de la pista. [7] (Figura 5A). Como se observa comúnmente, los barridos decodificados comenzaron detrás de la posición actual del animal y se adelantaron. Luego procedimos a cuantificar estas distancias de mirada hacia atrás y hacia adelante, así como la extensión total del barrido. Para evitar artefactos introducidos por el principio y el final de la pista, solo consideramos los barridos que no llegaban a ninguno de ellos. De acuerdo con los barridos dependientes del comportamiento, las tres medidas aumentaron con la velocidad media de carrera en los lugares en los que ocurrieron (Fig. 5B-5D). También hubo un efecto de aceleración que discutimos a continuación.
Figura 5. Análisis de decodificación.
R: Descodificación de posiciones representadas de una red bien entrenada durante una vuelta. B: La distancia de mirada hacia atrás (a qué distancia de la posición real del animal comienza el barrido decodificado) aumenta con la velocidad media en la posición real correspondiente (codificado por colores). Cada punto corresponde a un barrido theta, agrupado en vueltas y en 10 ejecuciones de simulación diferentes. La línea de color muestra la distancia promedio de mirada hacia atrás en cada contenedor espacial a lo largo de la pista. C: Lo mismo para la distancia de anticipación (a qué distancia de la posición real del animal termina el barrido decodificado), y D: para la longitud total del barrido. E: Un ejemplo de un campo de lugar medido que se calculó a partir de la activación de una celda y de un campo de lugar verdadero que se calculó en función de las entradas espaciales que impulsan la celda. Las líneas discontinuas marcan las posiciones de sus picos, y la diferencia entre ellos es lo que llamamos cambio de campo de lugar. F: cambia entre cada campo de lugar y su campo de entrada espacial. Las mismas convenciones que en la figura 4B. G: La distancia retrospectiva de los barridos theta en una ubicación dada corresponde aproximadamente al cambio de campo de lugar en esa ubicación. La línea negra discontinua representa la identidad.
https://doi.org/10.1371/journal.pcbi.1011101.g005
Las posiciones decodificadas se desplazan hacia atrás
Que los barridos theta decodificados comenzaran detrás de la posición actual del animal es de hecho sorprendente considerando cómo se configuró el modelo: las entradas espaciales que llegan al comienzo de cada ciclo theta atraen la actividad en la red hacia las unidades asociadas con la posición actual, y la actividad luego se propaga hacia adelante (Fig. 3C y 3D). Por lo tanto, la red solo puede representar posiciones actuales y futuras, pero no posiciones en el pasado.
El cambio hacia atrás en las posiciones decodificadas fue el resultado de la decodificación utilizando campos de lugar medidos que se desplazan hacia atrás con respecto a los campos de lugar verdaderos, que definimos como las posiciones en las que están fuertemente impulsados por entradas espaciales. [35] (Figura 5E). De hecho, al igual que la mirada hacia atrás, el cambio hacia atrás entre los campos de lugar medido y real aumenta con la velocidad de carrera media (Fig. 5F), y ambas medidas coinciden aproximadamente (Fig. 5G). Podríamos revelar este cambio en nuestro modelo porque se conocen tanto los campos de lugar medidos como los reales. Presumimos que este cambio también ocurre en los datos experimentales y discutimos las posibles implicaciones a continuación.
Discusión
Anteriormente, encontramos que los barridos theta son más largos y los campos de lugar son más grandes con una precesión de fase más superficial donde los animales normalmente corren más rápido, aunque los campos de lugar individuales no cambian con la velocidad de carrera instantánea. [15]. Estos hallazgos fueron consistentes y ofrecieron una resolución a las observaciones aparentemente contradictorias sobre el efecto de la velocidad en los barridos theta y las propiedades del campo de lugar. [7, 8, 70–72]. Aquí desarrollamos y estudiamos un modelo computacional mecanicista que reproduce nuestras observaciones experimentales basadas en secuencias preconfiguradas que mapean el espacio. Además, los resultados de nuestro modelo predicen que hay un cambio hacia atrás entre el campo de lugar medido en relación con el campo de lugar real de una celda de lugar, y que este artefacto explica las trayectorias theta que aparentemente comienzan en la posición detrás de la ubicación actual del animal.
El efecto de la velocidad sobre el tamaño y la densidad del campo de lugar descrito por nuestro modelo también puede dar cuenta de algunas observaciones experimentales para las que no se ha reconocido explícitamente un vínculo con la velocidad. Un ejemplo destacado de esto son los hallazgos de Tanni y sus colegas. [73]. Informan que el ancho del campo del lugar perpendicular (pero no paralelo) a una pared aumenta con la distancia a la pared. Al mismo tiempo, la densidad de los campos de lugar disminuye con la distancia a la pared, y estos dos efectos se contrarrestan de tal manera que la proporción de células coactivas es siempre la misma. Esto es exactamente lo que produce nuestro modelo bajo el supuesto de que los animales corren más lentamente cuando se acercan o salen de una pared (Fig. 4B y 4G).
Numerosos otros estudios también han observado una mayor densidad de campos de lugar donde los animales normalmente corren más lento, como en la posición inicial y puntos de inflexión de un laberinto. [49, 58–61]. Las posiciones de las recompensas también tienden a estar sobrerrepresentadas por celdas de lugar. [47–57, 60]pero mira [74, 75]. Algunos de estos estudios informan explícitamente que los animales disminuyen la velocidad alrededor de las posiciones recompensadas, y uno de ellos muestra una coincidencia sorprendente entre la desaceleración y el aumento en la densidad del campo de lugar. [55] (su figura 5A–5C).
Los campos de lugar más pequeños y más densamente poblados que produce nuestro modelo en áreas donde los animales normalmente corren más lento tienen sentido intuitivo por dos razones. Primero, porque estas son áreas generalmente importantes, donde los animales pueden beneficiarse de una representación más detallada. Y segundo, porque dado que el animal se mueve lentamente, sería un desperdicio tener grandes campos de lugar participando en los barridos theta que predicen posiciones muy por delante, ya que esas posiciones no se alcanzarían pronto.
Además del efecto de la velocidad, el modelo apunta a un efecto de la aceleración. Incluso a la misma velocidad media, los barridos theta fueron un poco más largos y colocan campos un poco más grandes con una precesión de fase más superficial en la primera mitad de la pista donde el animal aceleró en comparación con la segunda mitad donde el animal desaceleró (Figs. 4B, 4D y 5D). Esto se debe a que los barridos theta se extienden a las posiciones en las que el animal alcanzará un intervalo de tiempo fijo en el futuro y, en igualdad de condiciones, esas posiciones estarán más alejadas si el animal está acelerando. Curiosamente, Gupta y sus colegas [8] informan un aumento en la distancia de anticipación de barrido theta con aceleración consistente con nuestros resultados (Fig. 5C), pero también informan el efecto opuesto para la distancia de anticipación, que no observamos. Se requiere más investigación para dilucidar el efecto de la aceleración en el disparo de las células de lugar.
También se ha demostrado que la frecuencia theta aumenta modestamente con la velocidad (alrededor de 1 o 2 Hz dentro del rango de velocidades evaluadas en los experimentos; [76–78]), o tal vez con aceleración [79]pero mira [80]. Sin embargo, parece que existen mecanismos compensatorios de tal manera que los cambios en la frecuencia theta no afectan el código de fase theta. [15, 70–72, 81, 82]. En nuestro modelo, estos mecanismos compensatorios tendrían que garantizar que la velocidad de propagación de la actividad cambie en tándem con la frecuencia theta, tal vez mediada por el aumento en la tasa de disparo que también se sabe que ocurre con la velocidad.
Aunque este estudio se ha centrado en el efecto de la dinámica del movimiento, otros factores también parecen influir en el código del hipocampo. Por ejemplo, se han observado secuencias theta más largas cuando se viaja a posiciones más lejanas [83]o al recuperar correctamente la posición memorizada de una portería [14]. Una mayor densidad de señales sensoriales también puede conducir a campos de lugar más pequeños. [84, 85]. Además, se ha propuesto que el hipocampo juega un papel más general en el almacenamiento de secuencias de eventos que se extienden más allá del dominio espacial. [37, 86, 87]. De hecho, nuestro modelo podría operar con cualquier tipo de entrada, extrayendo características que cambian a un ritmo que coincide con el de la dinámica interna de la red.
Nuestro modelo se basa en secuencias generadas internamente. Algunas pruebas de esto provienen de la observación de que el hipocampo desarrolla secuencias que codifican el tiempo o la distancia recorrida en ausencia de cambios en la estimulación sensorial. [40, 41, 88]. Además, la existencia de preplay [42–46, 89] y fenómenos relacionados [90, 91] apunta a secuencias generadas internamente preconfiguradas que se reclutan para codificar memorias espaciales o episódicas [37, 39]. Estos puntos de vista, sin embargo, siguen siendo controvertidos [92, 93]. Además, las secuencias generadas internamente pueden no ser la única opción para modelar barridos dependientes del comportamiento. Una posibilidad podría ser aprender las conexiones entre las células que participan en una secuencia impulsada externamente (Fig. 2B, arriba) utilizando una ventana de plasticidad relativamente larga, como en la plasticidad sináptica de escala de tiempo conductual (BTSP) [94, 95]. Esto permitiría que las células que codifican posiciones más separadas se conecten entre sí donde el animal corre más rápido, lo que lleva a secuencias theta más largas y campos de lugar más grandes en esas áreas. Alternativamente, en lugar de conexiones recurrentes asimétricas como en nuestro modelo, se podrían usar células de precesión de fase independiente para generar una activación secuencial de la población. [25]. Estas células podrían adquirir su selectividad espacial a través de una regla de aprendizaje similar a BTSP, lo que daría como resultado campos de lugares más grandes donde los animales corren más rápido. Sin embargo, las secuencias generadas internamente ofrecen una cuenta parsimoniosa tanto de la previa al juego [96] y theta barre [36]. Además, el hecho de que nuestro modelo, que opera sobre estas ideas, reproduzca hallazgos experimentales no relacionados sobre las propiedades del campo de lugar ofrece una línea indirecta de evidencia a favor de las secuencias generadas internamente. También es posible que las células que hemos modelado, que participan en secuencias generadas internamente, constituyan una columna vertebral sobre la que luego se reclutan más células por otros mecanismos. [44].
Nuestro modelo hace algunas predicciones sobre el comportamiento de las celdas de lugar en entornos novedosos que podrían usarse para probar su validez. En particular, el modelo predice que las celdas de lugar expresarían campos de lugar, precesión de fase y secuencias theta desde el inicio, pero la ubicación de los campos variaría inicialmente. De hecho, algunos estudios han demostrado que muchos campos de lugar están presentes desde la primera vuelta. [97, 98]pero que los mapas de tasa de disparo son inicialmente inestables [99, 100]. Un estudio ha demostrado que las células muestran precesión de fase desde la primera vuelta, pero solo parecen comenzar a participar en secuencias theta desde la segunda vuelta. [10]. Sin embargo, en ese estudio, los animales corrieron más despacio durante la primera vuelta. Según nuestro modelo, esto produciría una precesión de fase más pronunciada y, en consecuencia, secuencias theta cortas, que podrían ser difíciles de detectar. Se requiere más trabajo para probar las predicciones del modelo.
Algunas decisiones de modelado también podrían reemplazarse por otros mecanismos o mejorarse para dar mejor cuenta de los datos experimentales. Por ejemplo, el modelo utiliza la facilitación y la depresión sinápticas a corto plazo para producir un salto hacia atrás en la actividad al comienzo de cada ciclo theta. Sin embargo, se podrían obtener resultados similares utilizando otros mecanismos, como el aumento de rebote. [101] o cambios lentos en la conductancia que producen despolarización en las neuronas que se dispararon ca. 100 ms antes [16, 102]. Una posible extensión del modelo podría ser garantizar que los tamaños de campo de lugar y las pendientes de precesión de fase permanezcan completamente protegidos de los cambios en la velocidad de ejecución instantánea. Esto podría lograrse permitiendo que la velocidad de carrera instantánea influya en la propagación neuronal de las secuencias theta (Texto S1), de forma similar a cómo la velocidad de carrera mueve el atractor de golpes en los modelos de integración de rutas [103, 104]. Finalmente, el modelo podría extenderse a entornos bidimensionales. En tal caso, las diferentes secuencias tendrían que unirse para formar una representación coherente del espacio, tal vez similar a cómo se hace en los gráficos estructurados por clones. [105].
Finalmente, si bien es un desafío en la práctica, en principio podría ser posible examinar la relación entre los campos de lugar medidos y reales directamente en los experimentos. La clave sería disociar las entradas recurrentes para ubicar las celdas de las entradas retroalimentadas externas, cuya distribución espacial correspondería a los verdaderos campos de ubicación de las celdas. También puede ser posible estimar las ubicaciones en las que las entradas espaciales impulsan la actividad de las celdas de lugar basándose en la idea de que las celdas de lugar deberían activarse de manera más confiable, es decir, con la variabilidad más baja, en estas ubicaciones. Eso se debe a que las entradas externas en estos lugares actúan como puntos de anclaje para la actividad de las células, mientras que el disparo fuera de estos lugares está mediado por mecanismos internos que presumiblemente introducirían algún ruido en la relación entre la posición y la tasa de disparo. Por lo tanto, uno podría tratar de encontrar la porción del campo de lugar medido (definido en términos de posición y/o fases theta en las que se emiten los picos) que tiene la menor variabilidad de prueba a prueba en las tasas de disparo. La decodificación de la actividad de población utilizando estas porciones de campos de lugar debería dar como resultado la mayor precisión de decodificación, por ejemplo, los valores de probabilidad más altos en un decodificador bayesiano, así como la precisión.
En conclusión, hemos desarrollado un modelo de barridos dependientes del comportamiento en el hipocampo que es consistente con la observación del juego previo y que explica el efecto de la velocidad en las longitudes de barrido theta, los tamaños de campo de lugar, las pendientes de precesión de fase y las densidades. Además, el modelo sugiere que la codificación de la fase theta podría limitarse a las posiciones actuales y futuras, lo que hace que los campos de lugar medidos a partir de grabaciones del hipocampo tergiversen sistemáticamente la verdadera naturaleza de las respuestas espaciales de las células de lugar del hipocampo.
Materiales y métodos
Pista lineal y movimiento simulado
Simulamos una rata corriendo 30 vueltas en una nueva pista lineal de 200 cm de largo usando pasos de tiempo de 1 ms. Cuando la rata llega al final de la pista, es teletransportada al principio. La velocidad de carrera media objetivo de la rata en cada posición a lo largo de la pista tiene un perfil triangular, siendo 15 cm/s en ambos extremos y 80 cm/s en el medio de la pista. Para generar variabilidad en la velocidad de carrera, cada paso de tiempo multiplicamos la velocidad media objetivo en la posición actual de la rata con un factor de ruido que evoluciona lentamente. Este factor de ruido se obtiene convolucionando muestras independientes de ruido gaussiano (media = 0, std = 1) en cada paso de tiempo con un kernel gaussiano (media = 0 s, std = 2 s), y escalando y desplazando el resultado para que oscila entre 0,5 y 1,5 y está centrado en 1.
Luego creamos 128 características débilmente sintonizadas espacialmente, s, definida sobre la extensión de la pista, discretizada en bins de 1 cm. Estas características se producen mediante el filtrado de muestras independientes de ruido gaussiano (media = 0, estándar = 1) en cada contenedor espacial con núcleos gaussianos (media = 0, estándar seleccionado aleatoriamente entre 2 y 20 cm). Luego, cada una de las señales se escala y se desplaza para que oscile entre -1 y 1 y se centre en 0.
Red
Simulamos una red compuesta por 250 unidades, cuyo nivel de activación, rsigue la ecuación diferencial:
(1)
dónde τr = 5 ms. iθ proporciona excitación e inhibición rítmica a todas las unidades de la red en función de la fase θ de la oscilación theta de 8 Hz. Picos de excitación alrededor θ = π, proporcionando una ventana temporal donde pueden formarse y propagarse aumentos de actividad; la inhibición es máxima alrededor θ = 0, cerrando toda actividad en la red. iθ se ilustra en Fig. 3C, y dada por la siguiente ecuación:
(2)
dónde kθ = 12, y
. El tercer término del lado derecho de Eq 1 define las interacciones recurrentes entre unidades en la red. Estos son el resultado de multiplicar la matriz de ponderaciones recurrentes, Wreccon la actividad de las unidades tras aplicar una función de activación logística, σr(r), y multiplicando elemento-sabio por la facilitación presináptica a corto plazo de cada unidad, Fy el complemento de la depresión, 1 − d. Los pesos recurrentes de la unidad j a la unidad i están dadas por:
(3)
dónde d = 0,6 controla la dirección y la velocidad de propagación de los picos de actividad en la red, σrec = 5, y
. La función de activación logística viene dada por:
(4)
dónde αr = 6, y Xr = 0,5. La facilitación presináptica y la depresión a corto plazo son las siguientes:
(5)
(6)
dónde τF = 0,32 s, τd = 0,06 s, y F0 = 0,14.
Al comienzo de cada vuelta simulada, r y d se establecen en 0, y F se establece en F0. ien eso luego se usa para inicializar la actividad en la red. ien eso = βθ para las primeras cinco unidades en la red por la duración de un ciclo theta, y de lo contrario igual a 0. βθ se ilustra en Fig. 3C y descrito por la siguiente ecuación. Toma valores entre 0 y 1 a lo largo del ciclo theta, alcanzando un máximo en θ = π/2:
(7)
dónde ks = 2
dónde βmáximo = 0,4. La no linealidad dendrítica viene dada por la función logística Eq 4 con parámetros αs = 12 y Xs = 0,7.
Los pesos, Wsse inicializan en 0 y se actualizan en función de una regla de plasticidad hebbiana modificada:
(9)
dónde τw = 20 s. El cambio de peso está controlado por βθy depende del producto exterior de las entradas sintonizadas espacialmente y las activaciones de las unidades menos iextensión. la resta de iextensión actúa como un factor de normalización que limita el crecimiento de los pesos al valor requerido para igualar la actividad limitada de las unidades.
Análisis de propiedades de campo de lugar
Para los siguientes análisis, descartamos los primeros 80 s de la simulación, donde los campos de lugar son inestables. Para calcular los campos de lugar medidos de las unidades, discretizamos la pista en contenedores de 2 cm y calculamos la activación media σr(r) de cada unidad en cada contenedor. Luego, las activaciones medias se suavizan ligeramente convolucionándolas con un kernel gaussiano (std = 3 cm). Descartamos las unidades con un pico de activación por debajo de 0,2 y las unidades con campos de lugar sustancialmente cortados por el principio o el final de la pista, es decir, campos de lugar para los cuales el valor de activación no fue inferior al 50% del valor máximo en ambos lados.
Calculamos los tamaños de campo de lugar como la extensión del campo de lugar por encima del 10 % del valor máximo. Para los campos de lugar donde este umbral solo se alcanzó en un lado del pico, calculamos el tamaño del campo de lugar como el doble de la distancia desde el pico hasta ese punto. [15]. Para el resto de los análisis, solo incluimos campos de lugar que estaban por debajo del umbral del 10 % en ambos lados del pico.
Calculamos campos de lugar verdaderos de la misma manera, pero usando la modulación de las entradas a las celdas de lugar, iextensiónen lugar de su salida σr(r). Luego calculamos el cambio de campo de lugar como la diferencia entre los picos de los campos medidos y verdaderos.
Para analizar la precesión de fase, discretizamos la pista con pasos de 2 cm y la fase theta con pasos de 20°, y calculamos la activación media de cada unidad en cada intervalo de posición × fase. Calculamos la pendiente de la precesión de fase ajustando líneas a las nubes de precesión de fase utilizando la regresión de distancia ortogonal tal como se implementa en la biblioteca SciPy [110]. Este algoritmo minimiza la distancia ortogonal de los puntos a la línea de mejor ajuste. Debido a esto, puede describir con precisión nubes de precesión de fase muy pronunciadas que darían como resultado ajustes aproximadamente horizontales cuando se utilizan otros métodos de regresión lineal que solo minimizan las desviaciones entre los puntos y el mejor ajuste. línea a lo largo de la y eje [15].
Calculamos el cambio en los tamaños de campo de lugar individuales y las pendientes de precesión de fase con velocidad instantánea mediante el cálculo independiente de estos valores utilizando solo pasos de tiempo con velocidades instantáneas en el 20% superior o inferior de las velocidades en cada contenedor espacial. Para este análisis, aumentamos el número de vueltas a 45.
Para calcular la densidad de los campos de lugar, contamos el número de picos de campo de lugar en ventanas superpuestas de 10 cm con un paso de 2 cm.
Descodificación
Descodificamos las posiciones de la actividad de la red en cada paso de tiempo calculando, para cada contenedor espacial, la coincidencia entre la activación instantánea de la población y la activación media de las unidades en ese contenedor espacial, según lo evaluado a través del coeficiente de correlación de Pearson. [7]. El contenedor espacial con el valor de correlación más alto se seleccionó como la posición decodificada en ese paso de tiempo. Solo decodificamos la posición en pasos de tiempo donde al menos una unidad tenía un valor de activación superior a 0,1. Esto excluyó períodos entre ciclos theta cuando las unidades en la red estaban fuertemente inhibidas.
Análisis de barridos theta
Para evitar artefactos introducidos por los límites del entorno, excluimos los ciclos theta en los que el primer o el último contenedor espacial alcanzó el valor de correlación más alto. Para cada ciclo theta, identificamos los pasos de tiempo correspondientes al primer y último contenedor de 36° con valores de decodificación válidos, es decir, el comienzo y el final del barrido theta. A continuación, se definió la distancia retrospectiva como la diferencia entre la posición real media y la posición decodificada media dentro de la primera ventana temporal. De manera similar, la distancia de anticipación se definió como la diferencia entre la posición media decodificada y la posición real dentro de la segunda ventana temporal [8]. La longitud de barrido theta total se definió como la diferencia entre las posiciones medias decodificadas en la segunda y la primera ventana temporal.