ChatGPT e Salute: lo studio che rivela i pericoli nascosti nelle emergenze

Ti sei mai rivolto a ChatGPT per un consiglio sulla salute? Oltre 40 milioni di persone lo fanno ogni giorno, affidandosi all’AI per risposte rapide. Ma cosa succede quando una funzione all’avanguardia come “ChatGPT Health” commette errori critici proprio quando conta di più? Un nuovo studio indipendente ha gettato un’ombra inquietante su questa tecnologia, rivelando come, in situazioni di urgenza, l’intelligenza artificiale possa consigliare di restare a casa anziché correre al pronto soccorso. Questo non è solo un problema tecnico; è una questione che potrebbe costare tempo prezioso, e forse anche la vita.

“ChatGPT Health” sotto esame: i risultati allarmanti

OpenAI ha lanciato “ChatGPT Health” con la promessa di fornire consigli personalizzati, integrando dati medici e app per il benessere. Sembrava un passo avanti enorme verso una sanità più accessibile. Tuttavia, il primo studio indipendente sulla sua sicurezza, pubblicato su Nature Medicine, rivela un quadro preoccupante.

Più della metà dei consigli si sono rivelati errati in emergenza

I ricercatori hanno messo sotto torchio il sistema, simulando scenari medici realistici, da lievi disturbi a condizioni potenzialmente mortali. I risultati sono stati scioccanti: in oltre la metà dei casi in cui le linee guida cliniche prevedevano un’immediata visita al pronto soccorso, “ChatGPT Health” ha suggerito approcci meno urgenti, come attendere o prenotare una visita programmata. Il dottor Ashwin Ramaswamy, a capo dello studio, ha riassunto la situazione: “Volevamo sapere se l’IA avrebbe riconosciuto un’emergenza medica reale e consigliato di andare in ospedale. La risposta non è stata sempre quella che ci aspettavamo.”

Errori pericolosi in scenari complessi

Il sistema ha dimostrato di gestire bene condizioni classiche come ictus o shock anafilattico severo. Tuttavia, nelle situazioni più sfumate, ha mostrato delle falle preoccupanti. Ad esempio, in uno scenario di asma con chiari segnali di insufficienza respiratoria precoce, l’IA ha continuato a raccomandare di aspettare, invece di chiamare un’ambulanza. Alex Ruani, ricercatore presso l’University College di Londra, ha definito questa situazione “incredibilmente pericolosa”, stimando che la probabilità di ricevere un consiglio errato in tali condizioni possa raggiungere il 50%.

Quando il contesto inganna l’IA

Una simulazione ha rivelato che a una paziente con difficoltà respiratorie veniva raccomandata una visita futura nel 84% dei casi, nonostante i medici valutassero che potesse non arrivare a vederla. Allo stesso tempo, quasi il 65% degli scenari completamente sani ricevevano raccomandazioni per cure immediate, dimostrando una tendenza a sovrastimare il rischio in altri casi. Ancora più allarmante è la sensibilità del sistema ai dettagli contestuali: se un “amico” suggeriva che i sintomi fossero probabilmente innocui, l’IA tendeva a minimizzare la gravità della situazione.

Il caso suicidio: la funzione di sicurezza “svanisce”

Il test sulla valutazione del rischio suicidario è stato particolarmente delicato. Quando un paziente di 27 anni ha espresso pensieri suicidi, il sistema ha correttamente attivato un avviso di crisi, fornendo numeri di emergenza. Tuttavia, l’aggiunta di risultati di laboratorio “normali” – un dettaglio comune nella realtà – ha fatto completamente sparire l’avviso. L’IA sembrava interpretare valori ematici normali come un segno di buona salute generale, ignorando il rischio suicida. Ramaswamy ha avvertito che una funzione di sicurezza che può scomparire in base a informazioni aggiuntive è “potenzialmente più pericolosa che non avere affatto funzioni di sicurezza”.

La risposta di OpenAI e le implicazioni future

Un portavoce di OpenAI ha dichiarato che l’azienda accoglie con favore le ricerche indipendenti e lavora costantemente al miglioramento del modello, pur sottolineando che lo studio potrebbe non riflettere il contesto di utilizzo reale. Il professor Paul Henman dell’Università del Queensland, tuttavia, non è d’accordo, sostenendo che un sistema del genere potrebbe avere un doppio effetto negativo: incoraggiare visite mediche non necessarie per disturbi minori e, al contrario, scoraggiare le persone dal cercare aiuto urgente in caso di problemi seri.

Tecnologia o responsabilità?

L’intelligenza artificiale può essere una fonte di informazione preziosa, ma non è un decisore clinico. Questo studio ci ricorda una verità fondamentale: in medicina, il contesto, le sfumature e la responsabilità sono cruciali. Quando un sistema agisce come consulente, i suoi errori non sono solo tecnici; possono costare tempo e, a volte, la vita. La discussione su standard di sicurezza chiari e sul controllo indipendente dell’IA in ambito sanitario sembra essere solo all’inizio.

E tu, ti affideresti a ChatGPT per un consiglio medico urgente? Condividi la tua opinione nei commenti qui sotto!