Por favor, alimenta tus datos a las máquinas.
La inteligencia artificial está llevando la demanda de datos a un nuevo nivel. 📈
Supongamos que tiene acceso a 5000 imágenes de rayos X de pacientes a los que se les diagnosticó correctamente un tipo de cáncer en particular: el tipo A.
Hoy en día, es sorprendentemente fácil usar estos datos para entrenar a un bot para que detecte este cáncer en nuevos pacientes.
Para construir este bot, construiría un clasificador de imágenes alimentado por una red neuronal y las 5000 imágenes de rayos X serían su conjunto de datos de entrenamiento.
Agregaría otras 5000 radiografías de pacientes sin cáncer para que el clasificador tenga ejemplos de radiografías sanas y afectadas.
En esencia, este bot clasificador de imágenes buscaría patrones comunes a nivel de píxel usando gradientes de imagen y correlacionaría ese patrón con el cáncer tipo A usando un algoritmo de aprendizaje automático ampliamente utilizado llamado propagación hacia atrás.
Tenga en cuenta que USTED no tiene que especificar los patrones a nivel de píxel al bot para que detecte el cáncer. Ese sería un proceso altamente ineficiente y posiblemente también inexacto.
En cambio, en nuestro modelo de aprendizaje profundo, el bot busca los patrones por sí mismo. Evalúa minuciosamente pequeñas cuadrículas de píxeles de una imagen con el cáncer y las compara con la cuadrícula correspondiente en TODAS las demás imágenes para encontrar los patrones que existen. Para leer más, puede consultar conceptos como circunvoluciones del kernel o como son los bots detectar varios objetos en las competiciones de Kaggle.
Si desea profundizar más en la tecnología, puede leer mi ensayo “Aprendizaje a escala y el fin de la lógica ‘si-entonces'”.
El punto es que, utilizando las plataformas de aprendizaje profundo de código abierto/SaaS actualmente disponibles, un poco de motivación y acceso al conjunto de datos correcto, uno podría configurar este bot en muy poco tiempo.
Una vez capacitado, si ingresa la radiografía de un nuevo paciente, el clasificador podría decir cosas como “Hay un 98% de posibilidades de que se trate de un cáncer tipo A”.
Si has pasado por un proceso de diagnóstico de cáncer de un ser querido, sabes lo importante que es estar seguro. Es por eso que la gente obtiene la segunda, la tercera y la cuarta opinión de diferentes médicos.
Con este bot, cada paciente puede tener más confianza en un diagnóstico, mucho más rápido.
La mejor parte es que si continúa agregando más imágenes de rayos X de cáncer de tipo A correctamente diagnosticado, el bot seguirá mejorando para detectarlo.
A medida que las técnicas de aprendizaje automático se generalicen, se otorgará mucho más valor a los datos porque las máquinas pueden aprender de ellos para hacer nuestro trabajo mejor que nosotros.
Este caso de uso anterior no es ciencia ficción.
En el Hospital John Radcliffe, un equipo de investigadores de la Universidad de Oxford utilizan imágenes de electrocardiograma (prueba Eco) del corazón para detectar enfermedades del corazón. El sistema se llama ultramics y se desempeña consistentemente mejor que los cardiólogos humanos. El equipo tiene acceso a la base de datos de imágenes cardíacas de la Universidad de Oxford y está entrenando sus algoritmos de aprendizaje automático con estas imágenes para detectar diversas enfermedades cardíacas.
DeepMind de Google está utilizando un sistema similar para entrenar una IA para detectar enfermedades oculares observando miles de escaneos de retina en Hospital Oftalmológico Moorfields de Londres.
En un estudio doble ciego, IBM Watson para oncología Las recomendaciones de tratamiento del cáncer de mama coincidieron en un 90 % con las recomendaciones de una junta de tumores formada por médicos y profesionales multidisciplinarios. Aquí, los datos de entrenamiento provienen de registros médicos de pacientes anteriores, revistas médicas y libros.
No hace falta decir que los casos de uso de AI/ML no se limitan a la atención médica, sino que nos muestran cuán valiosos son los datos para resolver problemas reales.
La mayoría de las organizaciones/empresas/gobiernos están sentados sobre minas de oro literales de datos que podrían convertirse en poderosos productos de IA.
Desafortunadamente, no se está haciendo lo suficiente. No suficientemente rápido.
Los datos son una fuente de gran poder. Y un gran poder conlleva una gran responsabilidad.*
Entonces, si tiene acceso a datos valiosos, es mejor que cree algo útil con ellos.