venerdì 16 settembre 2016

Un errore imperdonabile


Nella tabella qui sopra ci sono i risultati ottenuti da Gabriele Ruscelli in una statistica pubblicata sul numero 183 di Linguaggio Astrale (estate 2016). In pratica con questa sua ricerca Ruscelli intendeva verificare se i politici vincono più frequentemente le elezioni durante una delle 10 fasi del loro personale ciclo sinodico di Giove.

L'ipotesi di partenza
Esiste almeno una fase del ciclo sinodico di Giove durante la quale si verifica un frequenza significativamente elevata di elezioni politiche, per i politici di entrambi i sessi, calcolando il periodo sinodico a partire dalla data di nascita del politico.

Già su questa ipotesi ci sarebbe qualcosa da obiettare. Se Ruscelli crede che esista una relazione tra il ciclo di Giove e le vittorie elettorali, dovrebbe chiedersi se i risultati da lui ottenuti si discostano nel loro insieme da quelli che sono i risultati prevedibili, e se lo fanno in modo statisticamente significativo.

Non si capisce perché parli di frequenza significativamente elevata, visto che una frequenza significativamente bassa, avrebbe comunque la capacità di farci sospettare una relazione tra il ciclo di Giove e le vincite elettorali.

Certo, è naturale, di solito l'attenzione si rivolge più verso gli eccessi che verso i deficit. Però bisognerebbe tenere a mente che se esistesse realmente un influsso astrale legato al ciclo di Giove, questo influsso creerebbe tanto degli eccessi che dei deficit. Perché ovviamente i casi in eccesso che si producono per una fase, sono dei casi in deficit di un'altra fase.

Ma come si fa a sapere se i risultati trovati si discostano in modo significativo dai risultati attesi?

Basta inserire i risultati in questo sito di statistiche.

Ma prima di inserire in questo sito i risultati trovati vi suggerirei di inserire questi risultati.

Il sito ci dice che i risultati trovati sono estremamente statisticamente significativi, con una probabilità che questi risultati siano frutto di un caso molto bassa pari a 0,0007, per cui ci sarebbero solo 7 casi su 10.000 che questi risultati siano frutto di un caso. Eppure, nessuna di queste fasi mostra una deviazione significativa se presa singolarmente. Per cui Ruscelli con questi risultati avrebbe detto che la sua ipotesi non si era realizzata, sebbene l'insieme della tabella mostra un probabilissimo effetto astrologico.

In assenza di ipotesi precise, la cosa migliore da fare è quello di valutare la significatività statistica generale della tabella ottenuta.

Adesso provate ad inserire i risultati realmente ottenuti nel sito e leggete il responso.

Il responso è che le deviazioni trovate per questa tabella non sono significative, perché ci sono circa 12 probabilità su 100 di ottenere delle deviazioni come queste, o maggiori di queste, per un semplice caso.

Naturalmente io non posso imporre la mia ipotesi a Ruscelli, anche se trovo la sua ipotesi poco razionale.

L'ipotesi di Ruscelli in realtà si verifica. Nella fase n.1 della tabella in alto ci sono 278 vittorie mentre il numero atteso era di 234 vittorie.

Ma come si fa a sapere se questo risultato è significativo, e quanto è significativo?

Lo si può sapere utilizzando sempre lo stesso sito. Inserendo i dati della fase n.1 , e quindi 278 come numero trovato e 234 come numero atteso, e creando una nuova categoria che comprende tutti gli altri risultati.
Per cui il numero trovato per questa nuova categoria è dato dal numero totale delle vittorie meno quelle del settore n.1, e il numero atteso è 234 * 9 = 2106.



P value and statistical significance:
Chi squared equals 9.193 with 1 degrees of freedom.
The two-tailed P value equals 0.0024
By conventional criteria, this difference is considered to be very statistically significant.

Per cui il sito ci conferma che quella riscontrata per la fase n.1 è una deviazione significativa e che ci sarebbero solo 2 probabilità su 1000 che questo si sia verificato per caso. Ruscelli, chissà perché, calcola una probabilità leggermente diversa, perché dice che ci sarebbero 4 probabilità su 1000 che questa deviazione si sia verificata per un puro caso. Questa discrepanza non è molto importante, perché comunque l'ordine di grandezza è lo stesso, e se la probabilità è di 2 casi su 1000 o di 4 casi su 1000, non cambia molto.

Ma a cosa si riferisce questa probabilità?

Questa è la probabilità che nella fase n.1 si verificasse una simile deviazione.

Non è la probabilità corrispondente all'ipotesi di Ruscelli.

L'ipotesi di Ruscelli era che almeno per una fase, delle 10 fasi, avrebbe trovato un risultato significativo,
come in effetti è poi avvenuto. Ma la probabilità di questo evento non è quella relativa alla fase n.1.

Questa probabilità andrebbe presa in considerazione se Ruscelli avesse ipotizzato che avrebbe trovato una deviazione importante proprio per questa fase.

Ma l'ipotesi di Ruscelli era generica, non riguardava in modo specifico questa fase n.1, ma coinvolgeva tutte e 10 le fasi che potenzialmente potevano mostrare una deviazione significativa come questa.

In altre parole, se Ruscelli invece di trovare 278 vittorie per la fase n.1, le avesse trovate per la fase n.3 o per la fase n.5, lui sarebbe comunque andato alla cassa per reclamare la sua vincita, perché lui ha scommesso su tutte e 10 le fasi, e non su una fase in particolare.

E quindi qual è la vera probabilità associata all'ipotesi di Ruscelli?

E' molto semplice, è 10 volte la probabilità della fase n.1.

Per cui, è vero che l'ipotesi di Ruscelli si sia verificata, ma la probabilità che questo sia avvenuto per un semplice caso è di 2 casi su 100 e non di 2 casi su 1000.

Per cui la significatività trovata è piuttosto bassa raggiungendo soltanto il livello del 5%.

Immaginate di andare a giocare alla roulette e di puntare 10 euro su un certo numero.
La probabilità di vincita è di 1/37 e se il vostro numero esce il banco vi paga 360 euro.

Se invece puntate 1 euro su 10 numeri diversi, la vostra probabilità di vittoria è di 10/37, e
se uno di questi numeri esce il banco vi da 36 euro, perché su quel numero avete puntato solo un euro.

Ruscelli punta su 10 numeri, e uno di questi effettivamente esce, però non può pretendere una vincita di 360 euro perché gliene spettano solo 36, perché lui avevo distribuito la sua puntata su 10 numeri diversi, e non aveva puntato tutto il suo capitale sull''unico numero che poi è uscito.

Si tratta di logica elementare, e non capisco come ci sia qualcuno che non comprende queste cose.



Nessun commento: