Oir hablar de Inteligencia Artificial (IA) a todos nos evoca recuerdos tipo "Terminator", "2001 Odisea del espacio", "Yo, Robot" o la película "Inteligencia Artificial"... Pero nadie en la actualidad cree en la posibilidad cercana de conseguir lo que en dicha ficción se muestra. En este caso la ficción supera a la realidad. Y es que estamos muy lejos de conseguir IA en este amplio sentido. De hecho mucha gente piensa que es imposible. Incluso los grandes investigadores del ramo han llegado a pensarlo.
Las historia de la IA, que abordaremos en otro artículo, ha tenido grandes altibajos y grandes variaciones metodológicas. En su punto de mayor auge se llegó a creer que estábamos en un primer paso hacia esa idea generalizada de IA como sistema artificial capaz de imitar, e incluso superar, la inteligencia y el comportamiento humano. Hoy sabemos que nada más lejos de la realidad.
Pero esto tampoco quiere decir que la IA se haya estancado y no se haya avanzado en otras líneas, menos ambiciosas, pero con gran importancia e implicación científica e industrial. Este es el caso de los Sistemas Basados en el Conocimiento (SBC) y los Sistemas Expertos (SE).
Sin ánimo de ser exhaustivo y a modo introductorio para la exposición de SE y SBC existentes en el mundo de la sanidad, decir que cuando en un sistema se hace un uso intensivo del conocimiento del dominio separándolo de los mecanismos que controlan su uso en inferencia, se dice que se tiene un SBC. Cuando el conocimiento del SBC procede de un experto humano especialista en un tema técnico concreto, se dice que tenemos un SE. De manera general se utilizan indistintamente los conceptos de SE y SBC, aunque siendo purista un SBC es más generalista y comprehensivo que un SE, siendo este último, por decirlo de algún modo, un subconjunto de aquél.
Los SBC y los SE surgen en el periodo que abarca entre los 70 y los 80, dónde se hace especial énfasis en el Conocimiento, su representación y su tratamiento. El objetivo es reproducir el comportamiento humano en campos especializados, por contra del objetivo más generalista y ambicioso de la IA de la representación del conocimiento en sus aspectos básicos y que precedió a esta etapa.
Uno de los principales objetivos es la separación entre el conocimiento y los mecanismos de aplicación o inferencia. En este sentido la representación del conocimiento se basa en una hibridación entre métodos de la lógica formal, las reglas de decisión, las redes asociativas y los objetos estructurados denominados marcos y scripts.
Uno de los primeros SE y sin duda alguna el más influyente en toda la historia de la IA fue MYCIN, desarrollado en la Universidad de Stanford hacia finales de los años 60. MYCIN es un SE para la consulta sobre el diagnóstico y el tratamiento de enfermedades infeccionas que ya incluía características como el razonamiento por encadenamiento de reglas, el tratamiento de la incertidumbre por combinación de factores de certeza o la explicación de su método de razonamiento para alcanzar el diagnóstico o tratamiento propuesto. La capacidad de adquirir nuevo conocimiento se introdujo en una extensión de MYCIN llamada TEIRESIAS, el cuál permitía la inclusión de meta-reglas, es decir, reglas que indican cómo utilizar otras reglas, con el objetivo de construir la base de conocimientos a partir de un diálogo con el experto humano, guiar el razonamiento mediante objetivos explícitos y mejorar la capacidad de explicación a partir de dichos objetivos.
A partir de MYCIN surgieron CENTAUR dónde se combinó el uso de reglas y marcos en lo que Aikins llamó prototipos, y ONCOCIN destinado a la gestión de protocolos de oncología.
CENTAUR es un SE híbrido que combina marcos más reglas para la interpretación de datos referentes a fisiopatologías pulmonares con la meta de confirmar qué prototipos (marcos con reglas de producción) se acoplan mejor al conjunto de datos que presenta el enfermo.
ONCOCIN es un sistema de planificación temporal que aconseja en terapias oncológicas ayudando en la aplicación de decisiones estratégicas y tratamientos alternativos, evaluando para ello la información en tiempo real sobre los efectos laterales de la quimioterapia y la evolución general del entorno, proponiendo protocolos y cálculo de dosis a aplicar.
Hacia mediados de los 70 se desarrollo CASNET para el diagnóstico del glaucoma, usando una representación del conocimiento basada en redes causales dónde los nodos representan observaciones, estados patofisiológicos, enfermedades y planes terapéuticos y los arcos representaban relaciones causales, temporales y jerárquicas, con un factor de confianza asociado a cada uno de ellos, es decir, la probabilidad de que se produzca el efecto apuntado. El diagnóstico consiste en hallar caminos que unan estados fisiológicos, tratando de explicar los hallazgos y la evolución de la enfermedad mediante el mecanismo causa-efecto cuantificado probabilísticamente.
El sistema INTERNIST se desarrolló para consulta en medicina interna, aceptando síntomas, datos de laboratorio, signos físicos y/o histórias clínicas y produciendo un diágnóstico. Para la producción del diagnóstico hace competir diferentes hipótesis alternativas representadas mediante árboles de probabilidad condicionada.
PIP es el primer sistema basado en marcos, desarrollado en el MIT en los años 70. Todos sus marcos, que disponen de tres únicos estados, se inicializan en el estado Inactivo inicialmente, y al introducirse un hallazgo se Activan todos aquéllos marcos que podrían explicar dicho hallazgo. Los marcos relacionados con los anteriores en relaciones tipo "puede-complicarse-por" o "diagnóstico-diferencial", pasan al estado Semiactivo, imitando con ello el comportamiento del médico que investiga una determinada enfermedad y "activa" aquéllas hipótesis que responden o explican una determinada sintomatología (marcos activos), teniendo en cuenta hipótesis alternativas de enfermedades relacionadas (marcos semiactivos) hasta llegar a una conclusión o diagnóstico que englobe la información disponible y se explique con los hallazgos hechos hasta el momento (marcos activos).
Algunos SE desarrollados en España, concretamente en la Universidad de Santiago de Compostela y en la UNED, son los siguientes:
- CAEMF, desarrollado por Marín & Mira entre 1986 y 1987, está dedicado al diagnóstico y seguimiento anteparto del estado materno-fetal
- SUTIL desarrollado por Barro en 1987 destinado a la monitorización inteligende en una unidad de cuidados coronarios
- TAO, desarrollado por Mira en 1987, aconseja en terapia oncológica, incluyendo planificación estratégica para la inclusión de enfermos en protocolos de quimioterapia y el seguimiento de los efectos del mismo
- DIAVAL, desarrollado por Díez en 1994, destinado a ecocardiografía.
El autor también se atrevió por el año 98 a efectuar sus pinitos con los SE con su sistema Cabalisto, un pequeño conjunto de reglas que formaban la base de conocimiento de una Shell basada en EMYCIN y que permitía evaluar el estado previo de predisposición de un caballo en un proceso de doma clásica. ¡Algún día tendré que rescatar el proyecto!
La evolución y perspectivas actuales para los SE se resumen en los tres siguientes puntos:
- Consolidación y explotación de los sistemas desarrollados hasta la actualidad. Se desarrollan nuevos SE basándose en metodologías existentes y estables, usando entornos comerciales y métodos de inferencia ampliamente utilizados (pe. EMYCIN), lo que determina una fase de explotación de los avances producidos en esta rama de investigación
- Investigación teórica en temas frontera de los SE y SBC para la representación del conocimiento o los modos de razonamiento
- Aumento del énfasis en el aprendizaje y en el renacimiento del conexionismo, produciendo métodos híbridos capaces de aprender e incluir dicho aprendizaje en su base de conocimiento para mejorar con la interacción con el experto humano
En la actualidad y siguiendo las tendencias anteriores, la IA en sanidad se centra en tareas de procesamiento del lenguaje natural para la extracción de conocimiento médico de bases de datos y páginas de internet (datamining y webmining), la clasificación automática de dicho conocimiento, la codificación automática y/o la obtención de resúmenes automáticos.
En este sentido es importante nombrar algunos de los trabajos presentados en la Sociedad Española de Procesamiento del Lenguaje Natural SEPLN en el ámbito de la salud como puedan ser "Detección de fármacos genéricos en textos biomédicos", "Categorización de textos biomédicos usando UMLS", "PPIEs: Protein-Protein Interaction Information Extraction system", "Medidas Internas y Externas en el Agrupamiento de Resúmenes Científicos de Dominios Reducidos", "Similitud entre Documentos Multilingües de Carácter Científico-Técnico en un Entorno Web", "MIDAS: An Information-Extraction Approach to Medical Text Classification", "Uso de Grafos de Conceptos para la Generación Automática de Resúmenes en Biomedicina", y un largo etcétera.
En esta línea de investigación dominada principalmente por la extracción de información y la clasificación de dicha información el autor presentó en la SEPLN 2008 un artículo denominado "Clasificación de páginas Web en dominio específico", trabajo centrado inicialmente para su entrenamiento y validación en el ámbito del teatro pero que está en la actualidad en revisión y experimentación en el dominio biomédico.
Otros trabajos de interés en esta línea llevados a cabo por Corex SI en su departamento de I+D+i son el lector de Chipcard y el meta-buscador de medicamentos. El primer proyecto consiste en un wrapper Web que captura la facturación emitida desde un terminal Chipcard a la compañía de seguro y mediante un procesamiento de los datos enviados mediante una gramática de tipo 3 o gramática regular obtener la información necesaria (paciente, titular, número de tarjeta y autorización, actos médicos...) para la generación de los registros correspondientes en el ERP local SIC+ (historial clínico, facturación de compañía...), aunque es integrable con cualquier ERP y estamos trabajando también en esa línea. El segundo proyecto consiste en un crawler + parser que recorre las principales páginas Web de búsqueda de información sobre medicamentos y principios activos como pueda ser Vademecum online y mediante un proceso de webmining y aplicación de técnicas de parsing mediante gramáticas tipo 3 y tipo 2 obtener los resultados mostrándoselos al especialista según los criterios de usabilidad y accesibilidad requeridos, incluidos dentro del propio ERP de gestión de clínicas SIC+ (y cualquier sistema con el que se desee integrar) y permitiendo la generación automática de la posología en las recetas emitidas.
Por último nombrar el proyecto hCod llevado a cabo por nuestros colegas y colaboradores de Thera-Clic y que permite la codificación automática de historiales clínicos (motivos y diagnósticos) en los sistemas de codificiación actuales ICD-9, ICD-10 y SNOMED-CT
Con todo lo anterior se puede observar una evolución de las necesidades y soluciones ofrecidas, pero sobre todo un interés y un trabajo constante en la investigación y aplicación de las técnicas de IA en el mundo de la sanidad, interés que compartimos en el Grupo Fivasa, como expertos en salud y en innovación tecnológica, para lo cuál nos centramos e invertimos en proyectos de investigación y desarrollo que contribuyan a la comunidad científica y al desarrollo del día a día de los profesionales de la sanidad.