Google ha silenziosamente rimosso le AI Overview, le sintesi generate dall'intelligenza artificiale, dai risultati di ricerca relativi a temi medici specifici, in particolare quelli riguardanti le analisi della funzione epatica. La decisione è stata presa in seguito alla scoperta che l'IA forniva intervalli di valori di riferimento semplificati e privi del contesto necessario, come l'età, il sesso o l'etnia del paziente.
Le AI Overview, introdotte da Google per fornire risposte rapide e concise alle domande degli utenti tramite riassunti generati da reti neurali, si sono rivelate problematiche nel campo della salute. Esperti del settore hanno definito le risposte dell'IA su questioni mediche "preoccupanti" e "pericolose".
Un esempio concreto è rappresentato dalla fornitura di intervalli standard per i valori delle analisi del fegato, senza specificare che tali valori possono variare significativamente in base a fattori individuali come l'età, il sesso e l'etnia. Questo tipo di informazione incompleta poteva facilmente confondere un paziente con una patologia epatica, ritardando potenzialmente la richiesta di assistenza medica tempestiva.
Google ha agito prontamente rimuovendo le AI Overview per le query specifiche identificate come problematiche, come ad esempio "qual è l'intervallo normale per un esame del sangue della funzione epatica?". Un portavoce dell'azienda ha dichiarato che Google sta operando in linea con le proprie policy e sta apportando "ampi miglioramenti" al sistema.
Tuttavia, è emerso che modificando leggermente la formulazione della domanda, era ancora possibile ottenere riepiloghi inaccurati dall'IA, evidenziando le limitazioni delle protezioni implementate. Vanessa Hebditch, del British Liver Trust, ha sottolineato come piccole variazioni nella query di ricerca, come l'utilizzo della frase "intervallo di riferimento dei valori della funzione epatica", continuassero a produrre le stesse risposte errate.
La vicenda solleva importanti interrogativi sull'affidabilità dell'IA nel fornire informazioni mediche. L'accuratezza è fondamentale in questo campo, dove la diagnosi si basa su un complesso insieme di elementi, tra cui il contesto clinico, le probabilità e le eccezioni. Aree in cui i modelli linguistici di grandi dimensioni (LLM) mostrano ancora delle difficoltà. Sembra che l'intelligenza artificiale di Google non sia ancora pronta a sostituire un medico in carne ed ossa.
La rimozione delle AI Overview per le analisi del fegato rappresenta un campanello d'allarme sull'importanza di validare attentamente le informazioni fornite dall'IA, soprattutto in ambiti delicati come la salute. Mentre l'IA continua a evolversi, è fondamentale che il suo utilizzo sia guidato da principi di accuratezza, trasparenza e responsabilità, per evitare di compromettere la salute e il benessere delle persone.

