Il valore dei dati e la loro corretta interpretazione per comprendere la realtà

Il valore dei dati e la loro corretta interpretazione per comprendere la realtà

La natura ci sottopone di tanto in tanto a delle prove severe, quali tsunami, terremoti e pandemie. Sino a qualche anno fa l’uomo era inerme di fronte a questi cataclismi, ma oggi, grazie al progresso scientifico, abbiamo a disposizione molti strumenti concettuali per ridurne i potenziali effetti devastanti. 

Il principale di questi strumenti è la matematica, nella sua incarnazione chiamata statistica.

Già Platone quasi due millenni e mezzo fa aveva compreso che l’uomo non ha diretto accesso alla realtà, ma di questa ne percepisce solo alcune ombre, come se queste fossero proiettate sulla parete di una caverna nella quale esso è prigioniero. Queste ombre della realtà sono i dati che noi esseri umani sappiamo raccogliere da ciò che avviene accanto a noi. I dati sono in genere dei semplici numeri e, in quanto tali, non sono LA REALTÀ, sono solo un riflesso di essa (se misuriamo la temperatura in diversi punti del nostro paese in date differenti, questi valori non saranno “il nostro paese”, saranno solo uno spiraglio di veduta su un particolarissimo aspetto della realtà del paese). 

Per comprendere il comportamento del fenomeno di cui si sono raccolti i dati occorrono poi due ulteriori ingredienti: un modello mentale che ci possiamo essere fatti sul meccanismo mediante il quale la realtà produce quei valori in particolare, e un bagaglio di nozioni di statistica che ci permetta di confrontare in modo corretto il nostro modello con i dati in questione. 

Si capisce facilmente che, più precisi e comprensivi di molteplici aspetti della realtà saranno i dati raccolti, più probabilmente potremo fare affermazioni corrette sulla natura del fenomeno. Naturalmente gioverà a questo scopo avere un modello matematico per trattare i dati nel modo più sofisticato possibile per far sì che le risposte fornite coincidano il meglio possibile con i dati stessi. 

Diversamente da ciò che comunemente si crede i dati non sono comunque mai precisi in modo assoluto: qualunque strumento di misura è affetto da imprecisioni strutturali che fanno sì che le misure prodotte siano in qualche modo affette da imprecisioni (quelle che chiamiamo comunemente errori di misura). Diversamente dal linguaggio comune, qui la parola “errore” non significa “sbagliato”, significa piuttosto “affidabile solo entro una certa misura”. 

La conseguenza di ciò è che pur avendo i dati migliori possibili (là dove si sia tenuto sotto stretto controllo la qualità delle misure) e pur avendo un modello molto sofisticato da testare su quei dati, né i primi saranno mai esenti da imprecisioni né i secondi saranno così articolati da tenere in conto proprio tutti gli aspetti del fenomeno studiato.

Ne consegue che nel fare predizioni sull’evoluzione di un fenomeno si sarà sempre limitati nella precisione con cui farlo dalle incertezze sui dati e dalle incompletezze del modello usato.
Ecco perché gli scienziati sono sempre così cauti nell’esprimere conclusioni: non perché non abbiano chiari in mente i concetti che utilizzano, ma perché sono consci che fornita una “predizione” è sempre fondamentale poter fornire l’intervallo di confidenza di quel valore. Un singolo numero per quantificare un fenomeno non è mai considerato una cosa significativa nella scienza (dire di aver misurato l’altezza del Pantheon con la precisione del diametro di un atomo è notoriamente cosa poco credibile, mentre dire che lo si è misurato con la precisione del kilometro rende invece l’informazione data inutile). Questo è un punto che tutti dovrebbero sempre ben considerare nel leggere i risultati di una ricerca scientifica: guardare quanto sia piccolo l’intervallo di confidenza dichiarato.

Questo mette bene in luce la difficoltà del legislatore e del politico che devono prendere provvedimenti per contrastare una pandemia che vanno potenzialmente a discapito economico di fette della popolazione: dare un solo numero è chiaramente una cosa dotata di poco senso per quanto detto prima, darne troppi rende le scelte poco comprensibili. Comunque sia, per capire se le scelte adottate siano o meno adeguate occorre avere un ottimo controllo di tutto il processo di analisi della realtà, dalla fase di raccolta dei dati, della loro distribuzione a persone competenti nell’analizzarli fino a comporre il quadro più preciso possibile, avendo sempre ben presente che comunque non saranno mai scelte “indiscutibili”, lo saranno solo entro certi limiti che sarà opportuno saper ben valutare.


> Iscriviti al webinar https://bit.ly/webinar3DIC

Leggi anche

Una torta da dividere con un chat bot
Quali asintoti ha una funzione razionale fratta? Scopriamolo in TEAL
AI e scenari elettorali: una simulazione mediante chatbot e foglio di calcolo
Sfide statistiche
Il Global Gender Gap Index: un’attività di Educazione civica e Matematica per misurare il divario di genere
Non solo femminicidi: alcuni dati sulla violenza di genere