Operacionalización del aprendizaje automático en el laboratorio

En blogs anteriores, mostramos cómo la solución de análisis de datos se puede utilizar en muchos escenarios de laboratorio diferentes para ayudar a identificar los cuellos de botella mediante la capacidad de inteligencia comercial y, luego, reducir las pruebas y pronosticar el rendimiento de las muestras mediante la capacidad de aprendizaje automático. En este blog, mostraremos cómo los modelos de Machine Learning (ML) que se han creado se pueden entrenar automáticamente y cómo se pueden poner en funcionamiento dentro del propio Thermo Scientific™ SampleManager™ LIMS, sin necesidad de utilizar aplicaciones o plataformas externas.

Dado que la solución de análisis de datos está integrada en SampleManager LIMS, tiene varias ventajas desde la perspectiva de la puesta en funcionamiento, a saber:

  • Todos los datos permanecen dentro de SampleManager LIMS, lo que ayuda al control de datos
  • Los datos siempre están actualizados
  • Los modelos ML están controlados por versión
  • El control de acceso a los modelos de ML y los datos se rigen a través de roles y grupos
  • El reentrenamiento se puede programar automáticamente desde SampleManager LIMS
  • Las predicciones pueden ejecutarse desde el flujo de trabajo y, por lo tanto, se activan automáticamente

Desde la perspectiva de MLOps, el modelo de ML se desarrolla, entrena, implementa y supervisa dentro de SampleManager LIMS.

Cada modelo de ML tiene varios indicadores que controlan su visibilidad en cada etapa del proceso de MLOps. Para que se implemente un modelo de ML, debe marcarse como modelo activo y marcarse para capacitación automatizada.

El Programador en segundo plano de SampleManager LIMS se usa para volver a entrenar los modelos de ML marcados como disponibles para el entrenamiento automatizado. En este ejemplo los modelos se conservan todos los martes y domingos a las 16:35.

Evaluación de resultados

Es importante realizar un seguimiento del rendimiento de cada modelo de ML a medida que se utilizan nuevos datos para volver a entrenar cada modelo. La calidad del modelo de ML depende de la calidad de los datos etiquetados utilizados para entrenarlo, por lo que la calidad puede variar con el tiempo. El rendimiento del modelo ML frente a los datos entrenados etiquetados se puede rastrear a través de la página de evaluación de resultados.

Cuando se ingresan los resultados de una nueva muestra, se puede usar el flujo de trabajo para realizar automáticamente una predicción usando un modelo de ML determinado.

En este ejemplo, cuando se han ingresado todos los resultados para la prueba ‘Calidad del vino’, se activa el evento ‘Prueba completada’. El modelo de generación de perfiles ‘Wine Classification XGBoost’ se ejecuta para esa muestra y se predice su clasificación de calidad. A continuación, se añade una prueba de ‘Predicción de la calidad del vino’ a la muestra y el valor de la calidad del vino predicho se almacena en el resultado ‘Quality Cat’. Este enfoque gráfico permite configurar un flujo de trabajo para las necesidades de cada cliente. Por ejemplo, podría enviar un correo electrónico o realizar una nueva prueba si la clasificación de calidad no es aceptable.

Obtenga más información sobre cómo se puede aplicar la solución de análisis de datos para SampleManager LIMS aquí.

La publicación Puesta en funcionamiento del aprendizaje automático en el laboratorio apareció por primera vez en The Connected Lab.

Fuente del artículo

Deja un comentario