Probablement, mentre escric aquesta entrada del blog, s’aconsegueix acabar la maqueta de la presentació i vostè finalitza la seva lectura, la major part del que digui aquí ja correspondrà a algun temps passat. Si quan començava l’e-salut ja semblava que corria, ara la intel·ligència artificial (IA) vola. Escollir parlar d’IA en salut té aquest risc. Disculpi si arribo tard.
La meva percepció de la IA en salut sembla molt als debats, precaucions, temors i circumstàncies de quan començàvem a parlar sobre les possibilitats i l’impacte, primer d’Internet en salut i, al cap de poc, de l’e-salud[1]. A finals del XX intuíem que alguna cosa rellevant estava passant, però poc sabíem a on podia arribar. I, al final, l’impacte de l’e-salut ha estat molt més gran del que imaginàvem. Amb la IA em sembla que està passant una cosa molt semblant, la diferència és, probablement, que mentre que vam trigar més 20 anys a assimilar l’e-salut, amb la IA els temps d’implantació seran molt més curts.
Si fem una mica de memòria, recordarem que amb l’aparició dels llocs web de salut va sorgir la preocupació sobre si aquest accés lliure a informació “no controlada”, de fonts que podien ser poc fiables, confondria els pacients més que els ajudaria i va aflorar, també, la incertesa de com podia afectar la relació entre pacients i professionals sanitaris[2]. A poc a poc, vam començar a diferenciar entre fiabilitat i credibilitat de la informació a Internet[3] i a analitzar els estils de navegació dels internautes que ens van posar sobre la pista que els (nostres) pacients havien après a fer servir Internet per conèixer més sobre la seva malaltia i per complementar la informació a què tenien accés per les vies formals, diferenciant el “gra de la palla”[4]. Les societats professionals, les revistes científiques de pes entre professionals, les associacions de pacients o les ONG van començar a oferir informació contrastada, ampliant l’oferta d’informació que els internautes podien consultar. Els sistemes d’acreditació de llocs web[5], per cert, alguns encara vigents, van anar perdent la força amb què van néixer i el seu sentit. A poc a poc, vam anar perdent la por a aquesta nova eina i vam passar a veure-la com una aliada per a l’alfabetització en salut de la població, per aconseguir més implicació dels pacients o per gestionar millor la demanda. L’extensió dels smartphones i de les tarifes planes de dades que van aparèixer poc temps després van acabar de democratitzar l’accés a la informació i van portar un món de noves aplicacions obrint el camí de l’e-salut.
Ara amb la IA imagino que li passarà el mateix que em passa a mi, que cada vegada que faig servir alguna d’aquestes eines trobo que és capaç de fer alguna cosa nova i que hi ha noves aplicacions que amplien el meu horitzó. La màquina sembla que aprèn, però l’usuari també aprèn a fer servir la màquina de diferents maneres i per aconseguir diferents resultats. L’horitzó, per tant, és obert. La incertesa també.
Ara, el processament de llenguatge natural (aplicacions denominades de Llenguatge de Gran Grandària, LLM), potenciades per les tècniques de Big Data i “l’aprenentatge profund”, han transformat la manera com podem utilitzar el coneixement i, obren noves possibilitats en la manera d’interactuar dels pacients amb el sistema de salut i amb els professionals sanitaris[6]. Les aplicacions i possibilitats que apareixen al mercat no paren de créixer i sembla que el límit per emprar-les és la nostra pròpia capacitat per assimilar com fer-ho. Als llocs web estàvem limitats a les pàgines en el nostre idioma, després comptem amb traductors automàtics d’aquesta informació “plana” a què podíem accedir. Ara podem interactuar amb qualsevol assistent virtual en pràcticament qualsevol idioma[7].
Les aplicacions, per exemple, de LLM tenen múltiples aplicacions atesa la seva capacitat per comprendre, interpretar i generar expressions, textos, resums, informes, tal com faria una intel·ligència humana. Això ha despertat suspicàcies sobre el seu impacte, veus que en reclamen la regulació, o temors sobre el rol dels actuals perfils professionals.
Ara estan apareixent estudis que descriuen la capacitat de les aplicacions LLM per al diagnòstic o la presa de decisions a la clínica, que estem comprovant que, en alguns aspectes, supera el judici clínic de professionals experimentats[8],[9],[10]. El problema de la credibilitat i de la fiabilitat persisteix de diverses maneres i hem de ser conscients que els algorismes per “entrenar la màquina” són tan humans que incorporen els nostres biaixos, perquè usen dades no sempre actualitzades, que procedeixen d’estudis amb fonts de dades no equivalents o amb biaixos habituals en investigació que, al final, fan que uns col·lectius socials rebin més i millor atenció que altres, comprometent l’equitat. La qualitat de les dades ara és més important que mai abans.
Perquè puguin interactuar amb nosaltres, aquestes aplicacions d’IA aprenen i ho fan com aprenem nosaltres, dels llibres, dels articles científics, dels que es creua per xarxes socials i, també, del que us preguntem, o us informem, quan compartim amb la màquina els nostres propis informes i estudis, vídeos o fotografies. La diferència rau en la seva ingent capacitat d’assimilació de tota la informació, la seva capacitat de processar expressions, sentiments, estats d’ànim, o frases amb doble sentit com ho fem nosaltres al nostre dia a dia per interpretar el que passa al nostre voltant. Però amb més capacitat d’anàlisi en combinar un ingent nombre d’inputs. Disposen d’una capacitat desconeguda fins ara i només reservada al món de la ficció, com la del protagonista d’una Ment Meravellosa o de Rain Man, però no estan exempts dels mateixos estereotips i prejudicis que els que generem a través dels nostres estudis i actuacions. De fet, sabem que són presents a les dades d’entrenament, els recursos disponibles, els models i fins i tot als algorismes[11].
El debat sobre l’horitzó en què aquestes màquines intel·ligents[12],[13] trobaran el seu paper en la provisió de serveis de salut, en la presa de decisions, en el control de processos, el seu rol en la investigació en salut, o sobre l’ètica en el desenvolupament i l’ús d’IA[14] estan oberts, com ja ho van estar fa uns anys amb les TIC. Personalment, crec que aquests debats són necessaris, enriqueixen la qualitat del resultat, però no hem d’oblidar que com abans, corregir aquests biaixos forma part de les regulacions pel que fa a l’ètica en investigar, en relacionar-se amb els pacients, o a l’hora de prendre decisions clíniques. Avançar en nous compromisos en emprar les aplicacions d’IA no s’hauria de demorar, com tampoc promoure la formació per explotar aquestes eines en benefici dels pacients.
Per cert, ja no recordo si vaig escriure això fa un parell de dies o si vaig demanar a la meva aplicació de LLM que ho escrivís per mi. Vostè ho sap?
Referències
[1] Eysenbach G. What is e-health? J Med Internet Res. 2001;3(2):E20.
[2] Mira JJ, Llinás G, Lorenzo S, Aibar C. Uso de Internet por médicos de primaria y hospitales y percepción de cómo influye en su relación con los pacientes. Aten Primaria. 2009; 41:308-14.
[3] Mira JJ, Llinás G, Tomás O, Pérez-Jover V. ¿Qué hace que una página sanitaria en Internet tenga mayor credibilidad para los internautas? Revista de Calidad Asistencial 2005;20:239.
[4] Mira JJ, Llinás G, Pérez-Jover V. Habits of Internet users and usefulness of websites in Spanish for health education. World Hospitals and Health Services. 2008;44:30-5.
[5] Eysenbach G. Improving the quality of Web surveys: the Checklist for Reporting Results of Internet E-Surveys (CHERRIES). J Med Internet Res. 2004;6(3):e34.
[6] Nagi F, Salih R, Alzubaidi M, Shah H, Alam T, Shah Z, Househ M. Applications of Artificial Intelligence (AI) in Medical Education: A Scoping Review. Stud Health Technol Inform. 2023;305:648-651.
[7] Aggarwal A, Tam CC, Wu D, Li X, Qiao S. Artificial Intelligence–Based Chatbots for Promoting Health Behavioral Changes: Systematic Review. J Med Internet Res 2023;25:e40789.
[8] Cabral S, Restrepo D, Kanjee Z, Wilson P, Crowe B, Abdulnour RE, Rodman A. Clinical Reasoning of a Generative Artificial Intelligence Model Compared With Physicians. JAMA Intern Med. 2024;184(5):581-583.
[9] Taha A, Saad B, Taha-Mehlitz S, Ochs V, El-Awar J, Mourad MM, Neumann K, Glaser C, Rosenberg R, Cattin PC. Analysis of artificial intelligence in thyroid diagnostics and surgery: A scoping review. Am J Surg. 2024;229:57-64.
[10] Yasmin F, Shah SMI, Naeem A, Shujauddin SM, Jabeen A, Kazmi S, Siddiqui SA, Kumar P, Salman S, Hassan SA, Dasari C, Choudhry AS, Mustafa A, Chawla S, Lak HM. Artificial intelligence in the diagnosis and detection of heart failure: the past, present, and future. Rev Cardiovasc Med. 2021;22(4):1095-1113.
[11] Caliskan A, Bryson JJ, Narayanan A. Semantics Derived Automatically.
from Language Corpora Contain Human-Like Biases. Science. 2017;356(6334):183–186.
[12] Quttainah M, Mishra V, Madakam S, Lurie Y, Mark S. Cost, Usability, Credibility, Fairness, Accountability, Transparency, and Explainability Framework for Safe and Effective Large Language Models in Medical Education: Narrative Review and Qualitative Study. JMIR AI. 2024;3:e51834.
[13] Newman-Toker DE, Sharfstein JM. The Role for Policy in AI-Assisted Medical Diagnosis. JAMA Health Forum. 2024;5(4):e241339.
[14] Keskinbora KH. Medical ethics considerations on artificial intelligence. J Clin Neurosci. 2019;64:277-282.