sabato 27 settembre 2014

Ancora sulla statistica delle Miss Italia


P value and statistical significance: 
Chi squared equals 11.000 with 11 degrees of freedom. 
The two-tailed P value equals 0.4433
By conventional criteria, this difference is considered to be not statistically significant.
The P value answers this question: If the theory that generated the expected values were correct, what is the probability of observing such a large discrepancy (or larger) between observed and expected values? A small P value is evidence that the data are not sampled from the distribution you expected.
The chi-square calculations are only reliable when all the expected values are 5 or higher. This assumption is violated by your data, so the P value may not be very accurate.

I risultati complessivi relativi della statistica sulle Miss Italia, non mostrano assolutamente nulla di anomalo.
Il two tailed p value è 0.4433 il che significa che per puro caso si trovano dei valori che differiscono maggiormente da quelli previsti nel 44% dei casi. Per cui non c'è assolutamente alcuna significatività statistica in questi risultati.

Tra le altre cose, bisogna notare cosa nell'output di questa pagina c'è anche una avvertenza che dice che il calcolo non è nemmeno affidabile, a causa della esiguità dei dati. 

Le statistiche astrologiche su 40 casi non si possono proprio fare.

Comunque mi debbo un po' correggere su quello che ho scritto nel post precedente riguardante questa statistica.

Il P value calcolato per i risultati delle concorrenti del Capricorno, era sempre un P value two tailed, ossia che tiene conto sia degli eccessi in positivo, che di quelli in negativo. Per cui credo di essermi espresso male dicendo che la probabilità di trovare che nessuna delle donne Capricorno avesse mai vinto il concorso in 40 anni fosse uguale a 1/10, perché questa è in realtà la probabilità complessiva di trovare delle deviazioni dal previsto così ampie, tanto in eccesso che in difetto per questo specifico segno. 

La probabilità di trovare zero concorsi vinti su 40 per il Capricorno è 0,04422 se usiamo come valore atteso 3, ma siccome il numero atteso non era 3 ma qualcosina in più 3.3333 la probabilità è circa del 3%, mentre la probabilità di trovare almeno un segno che non vince mai su 40 concorsi è  3 * 12 = 36% ossia dovrebbe avvenire una volta su tre. Ed è per questo che non c'è nulla di straordinario nel fatto che questo sia avvenuto.

Tra queste due probabilità, quella del 3% e quella del 36%, quella da prendere in considerazione è la seconda, perché non mi pare che ci fosse una "scommessa" iniziale proprio sul segno del Capricorno. 

Rettifica
Ripensandoci mi sa che ho scritto una sciocchezza, perché la probabilità complessiva che non ci sia nessun segno che non vinca almeno una volta, non si ottiene semplicemente moltiplicando la probabilità di un singolo segno per dodici. Perché che cosa accadrebbe se questa probabilità per un singolo segno fosse del 10% come avevo erroneamente calcolato all'inizio?

Siccome i segni sono 12, seguendo questo criterio dovrei dire che la probabilità sarebbe del 120%, mentre la probabilità massima, ossia la certezza assoluta che un evento si verifichi  è data dal 100%.

Anche se in questo caso sarebbe molto probabile che questo evento si verifichi, non ci sarebbe la certezza che questo evento si verifichi.

Dovrei fare una simulazione per trovare la probabilità complessiva, cosa che di norma faccio sempre con le mie statistiche. Perché è molto facile fare dei ragionamenti sbagliati. L'importante è accorgersi dei propri errori e correggerli. 

19 commenti:

Anonimo ha detto...

Cosa ne pensi delle perizie statistiche sui vincitori di Formula 1 e sui vincitori dei "Palloni d'oro"?

Anonimo ha detto...

Ovviamente la statistica sulle miss Italia non è interessante, quelle che meritano attenzione sono le tre perizie degli esperti di statistica dell'Università di Milano Bicocca.

Astromauh ha detto...

Sto guardando la statistica sui palloni d'oro. Ho visto che se un giocatore lo vince più volte il suo segno viene conteggiato più volte.

Ma questo crea una anomalia.

Ad esempio Messi che è del Cancro ha vinto 4 volte, e Platini Cancro anche lui ha vinto tre volte.

Per cui è il Cancro che fa vincere il pallone d'oro, o sono Messi e Platini che hanno alzato il punteggio del segno del Cancro?

Il fatto che ci siano dei giocatori molto bravi che vincono ripetutamente, fa si che il loro segno non ha più una probabilità teorica di 1/12, ma maggiore.

Forse bisognerebbe rifare questa statistica conteggiando i vincitori dei palloni d'oro un'unica volta.

Anonimo ha detto...

Sicuramente la statistica sui "palloni d'oro" andrebbe rifatta contando una sola volta i vincitori.

Dixon

Astromauh ha detto...

Caro Dixon, ho provato a vedere cosa succede contando i vincitori una sola volta e ho rimesso i dati in quella pagina che fa i calcoli on line. Il responso è che anche con i nuovi dati, la tabella si discosta in modo notevole dai valori aspettati. Anche se scompare l'eccesso del segno del Cancro, rimane quello della Bilancia. Nel caso della Bilancia si tratta di giocatori diversi, e non degli stessi due giocatori che hanno vinto più volte il pallone d'oro.

Però anche se sulla carta questi risultati risultano significativi, non vuol dire nulla, perché stiamo parlando di una statistica che vorrebbe mettere in relazione 57 giocatori con 12 segni.

Questo tipo di statistiche non hanno senso in astrologia, perché anche se si trovano dei risultati significativi, non si può escludere che si tratti di un caso.

Questa statistica non è ripetibile, perché per rifarla occorrerebbe aspettare altri 57 anni.

E comunque con una tale scarsezza di dati, è il caso che gioca un ruolo preponderante.

Come astrologo è credibile il fatto che il segno della Bilancia sia così bravo da vincere un sacco di palloni d'oro?

Non è credibile. Ma non è poco credibile solo perché al segno della Bilancia non vengono attribuite delle predisposizioni per lo sport, cosa che invece si fa per il segno opposto, ossia per l'Ariete.

Non è credibile principalmente perché il solo segno zodiacale non è così determinante, e quindi non può esserci una relazione tra il nascere con il Sole in questo segno e vincere il pallone d'oro.

L'oroscopia non si manifesta soltanto quando si scrivono gli oroscopi segno-solari sui giornali, ma anche quando c'è qualcuno che pensa che il segno solare possa essere un fattore così determinante da poter far vincere il pallone d'oro.

Non funziona così, un effetto "segno della Bilancia" c'è, ma non si può pensare di trovarlo con una statistica su 57 soggetti.

E' sbagliato per principio.

Se poi in certi casi si verificano delle anomalie numeriche, queste anomalie numeriche rimangono ciò che sono, delle anomalie dovute ad un caso, anche perché questa statistica non è ripetibile.

Secondo me, sarebbe molto più sensata una statistica basata su tutti i giocatori di tutte le serie (A, B, C) se si ricerca un nesso tra la sportività e i segni zodiacali, piuttosto che una statistica su 57 vincitori del pallone d'oro.

Anonimo ha detto...

Secondo te quale sarebbe il numero minimo di casi che bisognerebbe esaminare per fare una statistica seria tendente a verificare l'influenza dei segni zodiacali?

Dixon

Astromauh ha detto...

20 milioni.

Astromauh ha detto...

Dipende dal tipo di statistica. 20 milioni è il numero di soggetti di una mia statistica sulle coppie sposate. Con questo numero di soggetti sono stato in grado di dimostrare che esiste una relazione tra il proprio segno di nascita e la scelta del partner.

Forse sarei riuscito a dimostrare ugualmente l'esistenza di questa correlazione con la metà dei soggetti, ma con qualche difficoltà.

Può darsi che per delle statistiche diverse da questa, basata sulla comparazione tra il Sole di nascita dei mariti con quello delle mogli, possono essere sufficienti dei numeri minori, ma non credo tanto minori.

Anonimo ha detto...

Cosa è emerso dalla tua statistica su 20 milioni di coppie?
L'hai pubblicata?


Masai

Astromauh ha detto...

La mia statistica su 10 milioni di coppie sposate non l'ho pubblicata.

E' emerso che le coppie i cui segni sono in congiunzione, semisestile, sestile, e trigono si sposano più della media, mentre le coppie i cui segni sono in quadratura, quinconce, e opposizione si sposano meno della media.

Anonimo ha detto...

Se non l'hai pubblicata è come se non esistesse.

Astromauh ha detto...

Mi sono scoraggiato. La statistica non l'ho pubblicata, ma ne ho discusso a lungo su un forum di "matematici".

Veramente tra gli utenti di questo forum non so se ci sia qualcuno laureato in matematica, forse il moderatore, che però è latitante da anni. Incredibilmente in questo forum non litiga mai nessuno, e il suo intervento non è mai stato necessario.

Però ci sono fisici, chimici, ingegneri e persone che la matematica l'hanno insegnata e che continuano a insegnarla.

Il risultato è stato deludente.

Io sono sicuro della validità della mia statistica, perché sono l'unico che l'abbia veramente studiata e che ha fatto tutti i calcoli.

Ho calcolato che anche se dal giorno del big bang ad oggi un supercomputer avesse mischiato le coppie presenti nella statistica, al ritmo di una simulazione al secondo, non si sarebbe mai prodotto il risultato che invece è presente nella realtà.

Ma nonostante questo, i risultati appaiono come poco convincenti.

Ciò che rende poco credibili i risultati della mia statistica è la scarsa grandezza degli effect size.

Ossia le differenze riscontrate tra il numero atteso atteso e il numero trovato per varie tipologie di coppie in congiunzione, semisestile, sestile, quadratura ecc. sono percentualmente molto piccole.

Si parla di variazioni percentuali dell'ordine del + 1.7% nel caso della congiunzione, e del - 0.5% nel caso della quadratura, e del quinconce, e ancora minore nel caso della opposizione.

Però per quanto piccole possano apparire queste variazioni, non sono il frutto di un artefatto, e non dovrebbero esserci se il segno zodiacale non contasse nulla.

Ma che tipo di variazioni ci si poteva aspettare di trovare con questa statistica?

Del 30% come nella statistica farlocca di Discepolo?

Barando si può ottenere qualsiasi risultato.

Però nella mia statistica non ho barato, e il mio intervento è anche marginale, perché non sono io che ho raccolto i dati, come ha fatto Gauquelin con le sue statistiche, ma ho utilizzato i dati dell'Istituto di Statistica del Regno Unito. Per cui il mio ruolo in questa ricerca, è solo quello di evidenziare i dati che sono presenti in questo database. Mi considero una specie di pennello evidenziatore, e niente più di questo, perché sono i dati che parlano da soli.

Astromauh ha detto...

Perché non provi a convincermi della necessità di pubblicare la mia statistica?

Io so che dovrei farlo, senza curarmi del fatto che le conclusioni della mia ricerca possano essere o non essere accettate.

Questa è una cosa che non mi dovrebbe interessare.

Scrivere una relazione sulla mia statistica mi sembra un lavoraccio, io ho fatto una statistica, ma non ho mai scritto una relazione di una statistica, e non so come si fa.

E' un lavoro noioso e non mi andrebbe di farlo.

Fatemi cambiare idea.

Anonimo ha detto...

Anche se le variazioni percentuali sono piccole la numerosità del campione rende questa statistica meritevole di essere pubblicata.

Dixon

Astromauh ha detto...

Questa statistica è molto simile a quella di Didier Castille perché entrambi abbiamo trovato che si sposano più frequentemente del dovuto le persone delle stesso segno, e che questo più che essere un fenomeno legato ai segni, è dovuto ad un fattore "vicinanza" del giorno del compleanno dei coniugi, perché si verifica anche quando i segni sono diversi, ma le date sono simili, ed è tanto più forte quanto più le date del compleanno sono ravvicinate.

Solo che le conclusioni di Didier Castille si fermano qui, almeno stando alle cose che ho potuto leggere in rete.

Mentre in realtà le deviazioni significative non riguardano soltanto le coppie dello stesso segno, ma riguardano anche le altre combinazioni tra i segni dei coniugi.

Non proprio tutte, perché ad esempio le coppie con i segni di nascita in sestile, o in trigono, sono leggermente più numerose di quello che dovrebbero essere, ma non lo sono in modo significativo.

Il surplus delle coppie in congiunzione (ossia dello stesso segno), avviene principalmente a scapito delle coppie in quadratura e in quinconce, e in misura minore a scapito delle coppie in opposizione.

Nella mia statistica gli aspetti appena elencati risultano anch'essi significativi, anche se non lo sono in modo così evidente come si verifica nel caso della congiunzione.

Il fenomeno scoperto da Didier Castille potrebbe anche non essere riconosciuto come un fenomeno astrologico, mentre nella mia statistica diventa evidente che è proprio di astrologia che si sta parlando, perché questo fenomeno riguarda tutto il cerchio dell'eclittica, e non solo la congiunzione.

Non solo ci sono le coppie in congiunzione che si sposano più frequentemente della media, ma ci sono anche le coppie in quadratura e in quinconce che si sposano meno frequentemente della media in modo statisticamente significativo.

Per cui diventa evidente che queste deviazioni siano proprio di tipo astrologico, e che confermano quasi perfettamente quelle che sono le regole della tradizione.

Perché la tradizione afferma che gli aspetti di congiunzione, semisestile, sestile, e trigono sono positivi, e che quelli di quadratura, quinconce, e opposizione sono negativi, e questo è esattamente il risultato della statistica.

Quello che forse differisce dalla tradizione è l'aspetto quantitativo.

Ad esempio, credo che nessuno avrebbe scommesso che l'aspetto congiunzione fosse così tanto più favorevole rispetto al sestile e al trigono, e che il semisestile fosse più favorevole di questi due aspetti.

Il semisestile viene considerato favorevole, ma meno favorevole del sestile, mentre dalla statistica risulta che l'aspetto più favorevole tra i due è sicuramente il semisestile (ricordo che parlo sempre di aspetti tra i segni).

Questa discordanza sull'aspetto quantitativo è in un certo senso una fortuna, perché se ci fosse stata una concordanza perfetta anche su questo, qualcuno avrebbe potuto dire che queste correlazioni più che dipendere dall'astrologia potrebbero dipendere dalla credenza nell'astrologia. In altre parole che le deviazioni riscontrate dal previsto invece di essere determinate da un influsso astrologico, dipenderebbero dal fatto che qualcuno si lascia influenzare dai consigli degli astrologi nel momento in cui decide di sposarsi.

L'ipotesi non è del tutto peregrina, perché non è affatto necessario che tutti seguano i consigli degli astrologi per produrre questo effetto, ma basterebbe che ci fosse un certo numero di persone che siano talmente credenti nell'astrologia da seguire i consigli dell'astrologi.

Però questo non può essere vero, altrimenti le coppie più frequenti sarebbero quelle in trigono, perché è questa la combinazione più gettonata dagli astrologi, ossia quella ritenuta più favorevole, mentre quella che risulta come la più favorevole di tutti è la congiunzione che forse è considerata favorevole dagli astrologi, ma non più di tanto.

Astromauh ha detto...

Ma queste cose interesseranno davvero a qualcuno?

Astromauh ha detto...

Fin qui ho parlato di aspetti tra i segni dei coniugi, ma naturalmente ho verificato anche che cosa accade considerando la distanza angolare effettiva tra i Soli di nascita dei coniugi, e anche qui emergono alcune cose interessanti.

Ho già accennato al fatto che l'effetto congiunzione più che essere legato ai segni di nascita dei coniugi è legato alla distanza in gradi tra i loro Soli di nascita.

L'effetto massimo si riscontra tra le persone nate nello stesso giorno dell'anno (anche se di anni diversi), ossia tra le persone che festeggiano il compleanno nella stesso giorno.

Però questo dato non l'ho preso così come appare dai dati, altrimenti sarebbe risultato molto più importante di quello che effettivamente è.

I dati contenuti nel database contengono alcuni errori, ed uno di questi errori è proprio questo del giorno del compleanno. Una certa percentuale dei coniugi che apparentemente mostrano di essere nati nello stesso giorno e mese dell'anno, in realtà non sono nati nello stesso giorno.

I dati su cui si basa la statistica sono stati ricavati dal censimento del 2001 avvenuto in Galles ed Inghilterra, in cui veniva richiesto ai capo-famiglia di compilare dei questionari.

L'eccesso riscontrato tra i coniugi nati nello stesso giorno, in parte si spiega con un errore ricorrente compiuto dai capo-famiglia.

Alcuni di questi capo-famiglia debbono non aver capito che nelle caselle in cui erano richiesti i dati di nascita del coniuge, avrebbero dovuto inserire i dati del coniuge, e per errore hanno inserito i propri dati di nascita.

Per cui non ho considerato le coppie di coniugi nate esattamente nello stesso giorno, ma ho sostituito il loro numero con quello ottenuto tra i coniugi le cui date di nascita differiscono di almeno un giorno.

Ma anche così facendo il numero delle coppie che mostrano una distanza angolare tra i Soli di nascita inferiore ad 1° grado risultano molte di più di quelle che dovrebbero essere.

L'effetto vicinanza del giorno del compleanno decresce gradualmente fino a scomparire del tutto dopo circa 19-20 giorni.

Qualcosa di simile si riscontra tra quasi tutti gli aspetti, anche quelli considerati negativi.

Quanto più l'aspetto è esatto, tante di più sono le coppie sposate che presentano questo aspetto.

Ad esempio, questo si nota molto nel caso dell'opposizione.

Mentre l'opposizione tra i segni è come ho spiegato un aspetto negativo, se l'opposizione è esatta, allora le coppie sposate sono più numerose.

Ma questo fenomeno si manifesta per tutti gli aspetti multipli di 30° gradi, ad eccezione della quadratura (vedi grafico).

Inoltre dal grafico si vede che l'aspetto di 45° e di 135° che sono di norma piuttosto trascurati dagli astrologi, presentano dei chiari picchi negativi, e che quindi andrebbero rivalutati.

Quindi Discepolo che considera questi aspetti, probabilmente fa bene a farlo, così come è vero che gli aspetti esatti possano favorire il matrimonio, anche se negativi, ad eccezione però dalla quadratura, che è sempre negativa anche quando l'aspetto è esatto.

Dove però Discepolo sicuramente sbaglia è sulla questione dei segni del destino. Le quadrature e le opposizioni tra i segni dei coniugi, sono sfavorevoli al matrimonio, e non favorevoli come pensa lui.

Astromauh ha detto...

Con questa statistica ho anche dimostrato delle altre cose, ad esempio che il sistema di riferimento dell'astrologia occidentale è quello giusto, e che i nostri colleghi indiani sbagliano.

L'ho fatto spostando fittiziamente il grado 0° dell'Ariete, facendolo retrocedere di un grado alla volta, fino a 30° gradi prima, creando in questo modo 30 zodiaci fittizi, con 12 segni ciascuno altrettanto fittizi.

La significatività statistica mostrata tra gli aspetti tra i segni, va via-via scemando fino a quando si arriva ad uno zodiaco che ha il suo punto di inizio 15° gradi prima del vero punto d'inizio dello zodiaco astronomico.

L'unico aspetto che sopravvive è quello della congiunzione, che però come ho già spiegato non è legato effettivamente ai segni dei coniugi, ma all'effetto "vicinanza" dei loro Soli di nascita.

In questo zodiaco fittizio, gli aspetti di quadratura, quinconce, e opposizione, cessano di essere statisticamente significativi, perché l'eccesso che si verifica sulla congiunzione, viene compensato da un deficit che si distribuisce piuttosto uniformemente su tutti gli altri aspetti.

Bisogna però chiarire che i risultati di questa statistica non hanno una utilità pratica.

Ossia l'aver stabilito ad esempio che le coppie sposate i cui segni sono in quadratura sono circa lo 0,5% in meno di quello che dovrebbero essere, non è qualcosa che si possa trasferire automaticamente nella pratica astrologica.

Un astrologo non potrebbe mai dire sulla base di questi risultati ad una coppia di fidanzati i cui segni solari sono in quadratura: "E' meglio se non vi sposate perché l'aspetto tra i vostri segni di nascita è negativo".

Non si può dire, perché quel misero 0.5% in meno di questo tipo di coppie non permette di dirlo.

Per cui i risultati che ho ottenuto dalla statistica da un lato sono una conferma della validità dell'astrologia, perché queste deviazioni statistiche non possono essere attribuite ad un caso nella maniera più assoluta, però nello stesso tempo questi risultati rappresentano la smentita di un certo tipo di astrologia "generalista".

Ossia, per intenderci dell'astrologia segno-solare che ritiene di poter fare delle previsioni sulla base del solo segno solare.

Il segno solare significa sicuramente qualcosa, però sicuramente meno, di quello che molti astrologi pensano che significhi.

Però la statistica non smentisce soltanto l'astrologia segno-solare in senso stretto, quella che qualcuno chiama oroscopia, ma ovviamente anche un certo modo di interpretare le carte del cielo in modo troppo deterministico.

Se la posizione del Sole influisce in questo modo così leggero, figuriamoci quanto possa influire una quadratura tra Marte e Saturno, o un trigono Venere-Giove.

Non si può attribuire ad una configurazione astrologica un risultato certo e uguale per tutti, eppure mi pare che gli astrologi che tendano a far questo siano molto numerosi.

Se il Sole che è il corpo più importante del sistema solare, ha questo influsso di così lieve entità, figuriamoci come possa essere leggero l'influsso di altre configurazioni astrologiche.

Ma forse non mi sono espresso bene, perché la questione non è la "leggerezza" delle configurazioni astrologiche, quanto la possibilità di tradurre il significato di una certa configurazione, in un evento concreto, come potrebbe essere quello di essere sposati o di non essere sposati con una persona di un certo segno.

Astromauh ha detto...

Penso che sto mettendo tutte queste considerazioni sulla mia statistica, di proposito tra i commenti di questo post, che non è l'ultimo post presente in questo momento sul blog.

In questo modo diminuisce la probabilità che qualcuno le legga.

Non so se ho veramente voglia di condividere le cose che ho scoperto con qualcuno.

A che pro?