El dato como materia prima
Hasta ahora hemos hablado de algunos aspectos importantes para el uso de la IA en salud, pero la IA se basa en una materia prima y esta materia prima son los datos. La calidad de la información es crítica para los diferentes estados de ciclo de vida de una solución de IA. Para el entrenamiento, para la validación y para el testeo, estos datos deben ser relevantes y representativos y esta relevancia y representatividad se ha de definir con criterios de calidad y transparencia. Esta calidad y transparencia se consigue con una documentación clara del ciclo de vida del dato (dónde y cómo se obtenido, qué procesos de transformación ha sufrido, etc.).
La gestión de los datos se considera como el proceso de seguimiento de todos los datos. La información relacionada con la creación, producción, distribución y eliminación de los datos nos permite identificar potenciales riesgos de sesgo, que, como se ha indicado, es el principal problema para el despliegue de la IA en salud.
Las organizaciones de salud se están viendo afectadas por una mala calidad de los datos. La gran cantidad de registros e información deben mejorarse para que sean accesibles y utilizables en la IA. Sistemas obsoletos con una consulta de datos deficiente o inexistente y la renuncia a incorporar modelos normalizados de información en la mayoría de las organizaciones son los mayores obstáculos para disponer de una calidad de datos en la atención medica, que permita su utilización para el entrenamiento de soluciones de IA.
Aun así, si uno de los principios de la calidad de la información, como es la confianza de los usuarios en los datos, la aplicamos a salud nos encontraríamos que esta confianza es máxima ya que se mantienen los máximos estándares y los profesionales asistenciales toman decisiones a diario sobre estos datos. Pero es aquí donde radica la diferencia sobre otros ámbitos, ya que la decisión clínica se toma no sobre los datos, sino sobre la información registrada en los sistemas y esta está sujeta a interpretaciones.
Trabajar sobre la fiabilidad y la coherencia de la información requiere que esta sigue un estándar establecido en toda la organización y aquí es donde tenemos diferencias de criterios y modelos diferentes entre organizaciones, e incluso, dentro de la misma organización. Este cóctel da como resultado que los datos no siguen unos estándares establecidos. Sin esta máxima, la marca de multi proveedor de salud desaparece y es muy débil, lo que hace que el desarrollo de soluciones de IA en entornos de multi proveedor requiera de unas políticas de gobierno del dato altamente complejas. Es responsabilidad de las autoridades sanitarias definir y garantizar el cumplimiento de estándares de calidad del dato, ya que estos repercuten directamente sobre la asistencia sanitaria.