Oltre la verità: perché la scienza deve proteggere la provenienza dei dati nell’era dell’AI generativa

Pubblicato il 3 marzo 2026 alle ore 10:37

Quando i dati perdono la loro innocenza, il metodo scientifico deve imparare a difendersi.

Questa riflessione nasce da un articolo pubblicato sul sito del SETI Institute (link in fondo). Non è una traduzione né un riassunto, ma un commento personale ispirato da quella lettura.

Fantasmi nei laboratori

Nel 2022 si è scoperto che uno studio del 2006 sul morbo di Alzheimer, considerato per anni una pietra miliare, conteneva immagini manipolate. Per sedici anni, programmi di ricerca e sviluppo farmaceutico hanno camminato su fondamenta fragili.
La scienza si autocorregge, certo. Ma ciò che davvero la destabilizza non sono le teorie sbagliate: è l’inquinamento dei dati su cui tutte le teorie si basano.
Oggi, quel rischio ha una nuova dimensione: gli strumenti per fabbricare dati credibili non sono più appannaggio di pochi esperti. Sono diffusi, accessibili, potenti.

Il problema non è l’AI che pensa, ma l’AI che “osserva”

Quando parliamo di intelligenza artificiale, è facile scivolare nella fantascienza: macchine che superano l’intuito umano o scoprono leggi della natura oltre la nostra comprensione.
Il vero rischio è più sottile.
Le moderne AI generative non si limitano a testi o immagini. Possono produrre dataset completi, segnali strumentali, immagini satellitari, tracciati spettroscopici e registrazioni audio statisticamente indistinguibili dal reale.
Il pericolo non è che l’AI diventi un nuovo scienziato. È che diventi un testimone oculare perfetto, capace di inventare “prove” che sembrano autentiche.

L’eredità dell’Alzheimer e il fantasma della “Cold Fusion”

La storia della scienza è piena di strade sbagliate nate da ipotesi audaci ma sincere. Il caso Alzheimer del 2006 è diverso: è un vicolo cieco creato da dati manipolati. Un esempio di come un errore alla base possa deviare un intero campo di ricerca.
Ora immaginiamo la stessa dinamica con strumenti capaci di generare dati così perfetti da sembrare reali. Dataset di risonanza magnetica, segnali radioastronomici, immagini microscopiche… prodotti da modelli generativi.
Quanti anni di lavoro potrebbero essere sprecati inseguendo ombre?

Il “problema SETI” per tutti

Un articolo del SETI Institute propone un esempio illuminante: il giorno in cui riceveremo un possibile segnale extraterrestre, la prima reazione della comunità scientifica non sarà festa, ma sospetto. Disturbo? Errore strumentale? Interferenza umana?
Oggi dobbiamo aggiungere una nuova domanda: è stato generato da un modello?
Non è una preoccupazione che riguarda solo l’astronomia. Ogni disciplina deve ormai confrontarsi con lo stesso interrogativo:
-Quel dato climatico è reale o è un artefatto?
-Quell’immagine astronomica è catturata o sintetica?
-Quella sequenza genetica è stata misurata o “immaginata”?
Se non possiamo dimostrare la catena di custodia di un dato — dal fenomeno osservato al risultato pubblicato — la scienza non scivola semplicemente nell’errore. Si dissolve nel dubbio.

Una via possibile: tracciabilità e trasparenza

Una possibile risposta è già in fase di sperimentazione in ambiti legati alla ricerca scientifica: sistemi di registrazione immutabile per certificare l’origine dei dati.
Quando uno strumento misura un fenomeno, l’informazione può essere ancorata a un timestamp, a un luogo, a una specifica catena di strumenti e processi verificabili. Una volta registrata, quella traccia non può essere alterata senza lasciare evidenza.
Questo non garantisce la “verità” del dato in senso filosofico. Ma può garantire che non sia stato manipolato dopo la sua acquisizione.

Oltre la verità, verso un’oggettività protetta

La scienza non cerca la Verità assoluta. Cerca oggettività: fare in modo che le conclusioni seguano i dati, che le ipotesi cedano il passo alle misurazioni, che l’evidenza disciplini l’immaginazione.
Ma l’oggettività inizia alla fonte. Nel momento in cui un fotone colpisce un sensore e quel segnale diventa dato.
Se perdiamo la capacità di certificare quel momento, perdiamo la base stessa del metodo.
La domanda non è se la scienza adotterà strumenti di verifica dell’origine dei dati. È quando.
Perché l’alternativa è un mondo in cui ogni scoperta potrà essere liquidata con un sospiro:
“Sarà mica stata generata da un’AI?”
E quel dubbio sistematico sarebbe un prezzo altissimo per la conoscenza.

La mia opinione

Il punto centrale, a mio avviso, è questo: non dobbiamo temere che l’AI pensi meglio di noi. Dobbiamo preoccuparci che diventi un testimone perfetto, capace di rendere indistinguibile la realtà dalla finzione.
La tecnologia che crea il problema può contribuire anche alla soluzione. Strumenti per tracciare e certificare l’origine dei dati non sono una moda, ma una possibile difesa dell’oggettività scientifica.
Nei prossimi anni assisteremo a una corsa: da un lato, la capacità dell’AI di generare prove sempre più credibili; dall’altro, la capacità della comunità scientifica di blindare l’autenticità delle proprie osservazioni.
Il futuro della conoscenza potrebbe dipendere dall’equilibrio tra queste due forze.

Fonte e ispirazione

Articolo pubblicato dal SETI Institute “Guarding the Source: Why the Future of Science Depends on Proven Data”

Clicca qui per andare su artcolo SETI