Per qualcuno il fatto che io voglia smentire Ciro Discepolo a proposito della statistica dei ricercatori svizzeri, potrebbe sembrare una sorta di accanimento contro Discepolo.
I giornali hanno dato un gran risalto alla notizia di questa statistica, secondo la quale, si muore più spesso della media nel giorno del compleanno, per cui, almeno in parte, le regole di Discepolo sarebbero confermate, ed è quindi giusto che Discepolo lo faccia notare.
Secondo questa statistica, non è vero che si muore più spesso nei 20 giorni che precedono e seguono il compleanno, ma qualcosa di anomalo accadrebbe nel giorno del compleanno, perché i ricercatori svizzeri hanno trovato che c'è un 13,8% in più di decessi in questo giorno rispetto alla media dei decessi degli altri giorni.
In realtà nemmeno questo si può considerare accertato, per le ragioni che spiegherò.
Quando si fa una statistica il primo problema che si presenta è la validità dei dati che vengono utilizzati.
La statistica di cui parliamo è basata sulle date di nascita e di morte di oltre due milioni di persone, che sono state registrate dall'anagrafe elvetica. Però non tutte le date registrate sono corrette, e non tutti i soggetti della statistica sono nati o sono morti effettivamente nei giorni in cui risultano essere nati o essere morti.
Ad esempio, se si prendono per veri i dati anagrafici registrati, risulterebbe che le persone nate il primo del mese, ed in particolare il primo gennaio, sono molto più numerose di quelle nate in un qualsiasi altro giorno dell'anno.
Esiste forse una legge di tipo astrologico che fa nascere più persone il primo del mese?
Chiaramente non si tratta di questo, l'eccesso di persone che apparentemente sembrano nascere nel primo del mese, dipende da una tendenza ad attribuire la nascita al primo del mese quando non si conosce con esattezza il vero giorno di nascita. Quando invece non si conosce nemmeno il mese di nascita, ma solo l'anno, di solito si fa nascere la persona il primo gennaio di quell'anno.
Non è possibile fare una statistica senza tener conto di queste cose, perché noi vogliamo fare una statistica basata sulle reali date di nascita e di morte di questi soggetti, e non con le date che gli sono state attribuite d'ufficio da un impiegato dell'anagrafe.
Ci sono errori di vario tipo che si possono riscontrare nei dati, alcuni di questi errori non sono preoccupanti perché non hanno effetto sui risultati della statistica, ma ce ne sono altri che possono portare a dalle conclusioni sbagliate.
Ad esempio, il fatto che nel database dell'anagrafe svizzera, una persona nata il 15 maggio, sia registrata invece il 24 agosto, non è un errore in grado di alterare i risultati della statistica. Una attribuzione di una data di nascita errata, a favore di una data di nascita casuale, non è in grado di inficiare una statistica, perché questi errori si annullano a vicenda.
Gli errori nei dati preoccupanti, sono invece gli
errori sistematici, dove si nota una tendenza a sbagliare sempre nello stesso modo e a favore di un certo risultato.
E' proprio un errore di questo tipo che potrebbe spiegare l'eccesso del 13,8% dei decessi registrati nel giorno del compleanno.
Un impiegato dell'anagrafe distratto, invece di riportare il giorno della morte, potrebbe riportare per errore quello di nascita.
Questo errore potrebbe spiegare l'anomalia riscontrata dalla statistica a proposito del giorno del compleanno, anche perché la deviazione riscontrata è molto piccola.
Se si trova una notevole deviazione tra i risultati previsti e quelli trovati, in linea di massima non è tanto importante se nel database utilizzato ci sono un certo numero di errori, ma il discorso è diverso quando si parla di una deviazione non particolarmente importante come nel nostro caso.
Questo apparente eccesso di morti avvenute nel giorno del compleanno, nonostante l'elevatissima significatività statistica, potrebbe non avere alcun valore se fosse dovuto ad un errore sistematico presente nei dati.
Con che frequenza dovrebbe ripetersi un simile errore per produrre l'eccesso di morti del 13,8% trovato nel giorno del compleanno?
Possiamo calcolarlo facilmente, tenendo conto che il numero dei soggetti della statistica è 2.380.997 e che il numero di decessi in più della media nel giorno del compleanno è di 902 soggetti.
E' sufficiente dividere il numero dei soggetti per il numero di decessi in eccesso presenti nel giorno del compleanno.
2.380.997 / 902 = 2639
E' quindi sufficiente che ogni 2639 trascrizioni di dati di nascita, ce ne sia soltanto una che erroneamente riporti una data di nascita errata che coincide con quella di morte, oppure che riporti una data di morte errata che coincide con quella di nascita, per creare quel surplus di decessi che i ricercatori svizzeri hanno riscontrato sul giorno del compleanno.
Non possiamo sapere con certezza se questo surplus dipende da degli errori di trascrizione delle date di nascita e di morte, però questi numeri ci dicono che anche se questo ipotetico errore si verificasse molto raramente, una sola volta ogni 2639 volte, questo sarebbe sufficiente a creare l'eccesso del 13,8% di morti apparentemente presente nel giorno del compleanno.
Secondo me, l'ipotesi che ogni 2639 trascrizioni di date, ce ne sia una dove viene riportata una data sbagliata, che viene a coincidere con quella di morte o di nascita, è una ipotesi più che plausibile.
Questo perché ho esperienza di un'altra statistica, dove ho trovato moltissimi errori nei dati.
Non c'è solo il problema degli eccessi di nascite riscontrate nel primo del mese, ma apparentemente nascono più persone anche nei giorni 5, 10, 15, 20, 25, 30.
E' difficile pensare che realmente nascono più persone in un giorno "tondo" come potrebbe essere il 10 del mese, rispetto a quelle che nascono il giorno 9 o il giorno 11.
Queste cose ci dicono che dobbiamo diffidare della precisone dei dati, e che le date ufficiali sono da intendersi come una approssimazione delle vere date di nascita o di morte.
Ci tengo a precisare, che queste non sono soltanto delle mie considerazioni, ma che le stesse considerazioni sono state fatte dagli stessi ricercatori svizzeri.
Discepolo è l'unico che parla di dimostrazioni incontrovertibili, in realtà la scienza non è fatta di certezze, specialmente nel campo della statistica.
There is some evidence for a heaping effect on the first day of
month if the birthday was unknown to the authorities. In such
cases, typically the 1st or the 15th day of the month is recorded.
Basically, we cannot exclude that as other patterns were entered
into the data, for example, by attributing unknown birthdates to the
same date as the day of death.
Non possiamo escludere che altri errori ricorrenti siano stati inseriti nei dati, ad esempio, attribuendo a delle date di nascita sconosciute la stessa data del giorno della morte.
I ricercatori svizzeri non escludono che questo possa essere accaduto, e secondo me, l'ipotesi dell'errore di trascrizione del giorno di nascita a favore del giorno di morte è molto plausibile, considerando che è sufficiente che questo errore si ripeta una sola volta ogni 2639, per creare il surplus del 13,8% di decessi riscontrato sul giorno del compleanno.
Non credo che sia possibile stabilire con certezza se questo surplus di decessi apparentemente avvenuti nel giorno del compleanno siano dovuti ad un errore o siano reali.
Ma supponiamo che questi decessi in più del giorno del compleanno siano reali.
Questo eccesso riscontrato dai ricercatori svizzeri, conferma la regola n.2 di Ciro Discepolo che dice che si muore di più nel giorno del compleanno?
No, la statistica svizzera non conferma nemmeno la regola n.2 perché il numero dei decessi in più, non corrisponde al numero di decessi in più ipotizzato da Discepolo.
Perché quanti sono il numero di decessi in più ipotizzati da Discepolo?
Discepolo non fa dei numeri e non dice quale dovrebbe essere la percentuale di decessi in più che si verificano nel giorno del compleanno, a differenza dei ricercatori svizzeri che questa percentuale l'hanno calcolata, e che hanno stabilito che è del 13,8%.
Ma anche se Discepolo non fa dei numeri, è evidente che il suo effetto sul giorno del compleanno non è lo stesso effetto trovato dai ricercatori svizzeri.
Qualche giorno fa, Discepolo ha voluto spiegare a modo suo le statistiche e ha fatto un esempio.
Discepolo immagina che un medico che lavora in Liberia si sia accorto che tra la popolazione di quel posto, negli ultimi decenni siano aumentate le malattie dovute alla assunzione di mercurio, e che abbia deciso di rivolgersi agli esperti di statistica per verificare la sua ipotesi.
Egli potrebbe avere avuto due diversi risultati: uno enorme con una mortalità quattro volte superiore alla media mondiale, oppure uno leggerissimo con uno scostamento del 5% rispetto alla media mondiale, ma in entrambi i casi la significatività statistica è elevatissima.
Discepolo ha ragione, perché sia una deviazione del 400% che una del 5% possono essere significative dal punto di vista statistico. Però rimane il fatto che un aumento delle malattie legate all'assunzione del mercurio del 400% è molto più preoccupante di un aumento del 5%.
Lo "effect size" che Discepolo chiama impropriamente "intensità di ripetibilità" è un aspetto fondamentale di una statistica. La significatività statistica ci dice se dobbiamo credere ai risultati ottenuti, e se le deviazioni riscontrate sono compatibili con il caso oppure no.
Ma è lo "effect size" che ci permette di quantificare la grandezza del fenomeno che stiamo osservando.
Se il medico di cui parla Discepolo avesse ipotizzato un incremento del 400% delle malattie legate all'assunzione di mercurio, e gli esperti di statistica avessero trovato che effettivamente un aumento c'è stato ma che è solo del 5%, si potrebbe dire che la statistica ha confermato l'ipotesi del medico?
No, non lo si può dire assolutamente, perché la statistica smentisce l'aumento del 400% ipotizzato dal medico.
Questo è proprio il caso della statistica svizzera, anche se Discepolo non quantifica l'effetto che si produrrebbe nel giorno del compleanno, è evidente che per lui si tratta di un effetto notevole, e che non è quindi compatibile con l'incremento della mortalità del 13,8% riscontrato dai ricercatori svizzeri.