El reciente estudio de la Facultad de Medicina Elson S. Floyd de la Universidad Estatal de Washington proporciona información clave sobre las posibles barreras a la inteligencia artificial (IA) durante situaciones de emergencia médica. En el estudio publicado PLOS One, los autores exploraron las capacidades del programa ChatGPT de OpenAI para decidir sobre el riesgo cardíaco de pacientes simulados en un caso de dolor en el pecho.

Conclusiones inconsistentes

Los resultados señalan un nivel problemático de variabilidad en las conclusiones del ChatGPT mientras se ingresan los mismos datos del paciente. Según palabras del Dr. Thomas Heston, investigador principal, ChatGPT no funciona de manera consistente. Al mostrar exactamente los mismos datos, ChatGPT daría un riesgo bajo la primera vez, un riesgo intermedio la siguiente vez e incluso, en ocasiones, una calificación de alto riesgo.

Esta brecha es muy grave en casos críticos que ponen en peligro la vida, ya que en estos casos, las evaluaciones esenciales y objetivas tienen mucha importancia para que el médico tome las medidas adecuadas y precisas. Los pacientes pueden experimentar dolor en el pecho debido a diferentes enfermedades. Por lo tanto, el médico debe examinar al paciente rápidamente y realizar un tratamiento oportuno para brindarle la atención adecuada.

El estudio también descubrió que el rendimiento de ChatGPT era deficiente en comparación con los métodos tradicionales utilizados por los médicos para evaluar el riesgo cardíaco de los pacientes. Hoy en día, los médicos utilizan un método de lista de verificación de dos caras que evalúa a los pacientes aproximadamente de acuerdo con los protocolos TIMI y HEART, que son indicadores del grado de enfermedad cardíaca de un paciente.

Sin embargo, al ofrecer como entradas variables como las que se muestran en las escalas TIMI y HEART, se alcanzó un mayor desacuerdo con las puntuaciones de ChatGPT, con un índice de acuerdo del 45% y 48% para las respectivas escalas. Supongamos que esta diversidad se encuentra en la toma de decisiones de la IA en casos médicos de alto riesgo. En ese caso, lleva a cuestionar la confiabilidad de la IA porque son estas situaciones de alto riesgo las que dependen de decisiones consistentes y precisas.

Abordar las limitaciones y el potencial de la IA en la atención sanitaria

El Dr. Heston destacó la capacidad de la IA para mejorar la asistencia sanitaria y destacó la necesidad de realizar un estudio exhaustivo para descartar deficiencias inherentes a la misma. La IA puede ser una herramienta necesaria, pero avanzamos más rápido de lo que creemos. Por lo tanto, debemos realizar muchas investigaciones, especialmente en situaciones clínicas habituales.

Evidentemente, los resultados de la investigación han confirmado la importancia de las enfermeras humanas en estos entornos, aunque la tecnología de IA también ha mostrado algunas ventajas. Tomemos el ejemplo de una emergencia durante la cual los especialistas en salud digital podrían examinar el informe médico completo de un paciente, utilizando así la capacidad del sistema para ofrecer solo información pertinente con el mayor grado de eficiencia. Además de eso, la IA puede participar tanto en la generación de diagnósticos diferenciales como en la reflexión sobre los casos difíciles con los médicos. Esto ayudará a los médicos a avanzar de manera más eficiente con el proceso de diagnóstico.

Sin embargo, según el Dr. Heston, aún quedan algunos problemas.

“Puede ser muy útil para ayudarte a pensar en el diagnóstico diferencial de algo que no conoces, y probablemente sea una de sus mayores fortalezas. Quiero decir, puedes preguntarle por los cinco diagnósticos principales y la evidencia que respalda cada uno, y por lo tanto puede ser muy útil para ayudarte a pensar en el problema, pero simplemente no puede dar la respuesta directa”.

Donde la IA está en constante evolución, es de suma importancia evaluar su desempeño en profundidad, tal vez especialmente en situaciones de alto riesgo como la atención médica, para proteger a los pacientes y así optimizar la toma de decisiones médicas.