Baidu, comúnmente conocido en España como "el Google chino", ha mostrado un nuevo algoritmo de Aprendizaje Automático capaz de identificar metástasis de cáncer mucho mejor que un humano. De hecho, el algoritmo (que además es de código libre, por lo que puede ser usado por otras personas), ayudará a los patólogos humanos a encontrar más sencillamente tumores u otros tipos de enfermedades.
La Inteligencia Artificial fue entrenada mediante 400 imágenes tan grandes que pueden llegar a ocupar varios GB de tamaño divididas en cuadrículas de decenas de miles de imágenes más pequeñas, y posteriormente seleccionando de manera aleatoria 200 000 de esas imágenes más pequeñas. El nivel de precisión de análisis del algoritmo de Aprendizaje Profundo es mucho más fiable, por lo que detecta más y mejor los tumores en estas imágenes.
Es algo muy similar al microscopio con Inteligencia Artificial de Google que señala en círculos los tumores que va viendo del que hablamos hace tiempo, que también detecta tumores mucho más rápidamente (y más eficazmente) que un patólogo humano profesional con muchos años de experiencia. En el caso de Google no solo se usa la Inteligencia Automática, sino que además se combina con la experiencia humana.
El algoritmo literalmente identifica célula por célula y averigua si se trata de una célula cancerígena o si por el contrario se trata de una normal. Y, mediante la correlación espacial, es capaz de realizar predicciones mucho más seguras, tal y como explica Yi Li, uno de los científico de investigación de aprendizaje automático en el Laboratorio de Inteligencia Artificial Silicon Valley de Baidu Research.
La ventaja de hacerlo así es bastante clara. En la imagen superior vemos en la (a) la diapositiva original; en la (b) las anotaciones de patólogos, donde las zonas blanca son tumores; la (c) se corresponde con regiones tumorales identificadas por una Inteligencia Artificial que no considera parches vecinos; y la (d) el resultado de que la IA sí los considere.
En la curva FROC (free-response receiver operating characteristic por sus siglas en ingles), con la que se mide la sensibilidad de detección promedio de tumores, el algoritmo de Baidu, el Google Chino, obtuvo una nota de 80,9 sobre 100, superior a la nota de 72,4 sobre 100 de un patólogo humano. Incluso está por arriba de los 80,74 puntos obtenidos por el ganador de una competición de detección de tumores.
Las imágenes con las que se entrenó la Inteligencia Artificial fueron obtenidas de Camelyon16, un software de mahine learning usado en la lucha pro detección precoz del cáncer. Se usó imágenes etiquetadas como sanas, imágenes de células etiquetadas como cancerígenas, e imágenes sin etiquetar.