martedì 7 giugno 2016

I preliminari della statistica

La correzione degli errori nei dati

Spero che si sia compreso quello che ho detto nei due post precedenti. Questa statistica è di vitale importanza perché non si propone di investigare su un item astrologico specifico, come potrebbe essere quello che Saturno nella quinta casa inclina alla sterilità o ad una prole poco numerosa. Qui in realtà è in gioco TUTTA l'astrologia perché se le persone dei vari segni non mostrano alcuna preferenza verso certi segni, questo vorrebbe dire che i segni non caratterizzano in alcun modo le persone, e quindi verrebbero a crollare quelle che sono le stesse fondamenta dell'astrologia. Ma fortunatamente non è così, perché Voas si è sbagliato, e i dati del censimento mostrano che esiste realmente una tendenza per gli appartenenti di ciascun segno a sposarsi con certi segni, e ad evitare di sposarsi con certi altri segni.

Voas continua la descrizione del suo test e scrive che idealmente quando ci si accinge a fare un test bisognerebbe partire da una ipotesi, ma che ha osservato una grande disparità di pareri tra gli astrologi, nella definizione di quali siano gli accoppiamenti di segni favorevoli, e sfavorevoli alla vita di coppia.

Decide quindi di verificare se esistono delle deviazioni significative tra il numero atteso e il numero trovato di tutte le 144 combinazioni dei segni delle mogli e quelli dei mariti.

Nella parte più tecnica della relazione della sua statistica spiega come viene calcolato il numero previsto per ciascuna di queste 144 combinazioni dei segni.

Birthdays are not spread evenly across the different months of the year. The seasonality of fertility varies in different parts of the world and over time; in Britain, births are more frequent in the spring than in the late autumn and winter. Scholars continue to debate the relative contribution of social, environmental and physiological factors. The expected frequencies of each marital combination of birth month or sun sign are therefore not assumed to be simply one twelfth times one twelfth.

Expected frequencies are calculated as the product of the two marginal totals divided by the grand total.

Voas spiega che la frequenza delle nascite non è costante durante l'anno, e che varia a secondo dei luoghi e delle epoche, e che in Gran Bretagna le nascite sono più frequenti in primavera piuttosto che in autunno o in inverno. Per cui sarebbe sbagliato pensare che il numero previsto per ciascuna di queste combinazione di segni sia uguale per tutti e che sia un dodicesimo di un dodicesimo del totale delle coppie.

Bisogna quindi tener conto del numero delle persone nate sotto ciascun segno, per cui le frequenze attese sono calcolate come il prodotto dei due totali marginali diviso il gran totale.

Ad esempio, se vogliamo sapere qual è il numero delle coppie attese per l'abbinamento moglie Ariete con marito Ariete, dobbiamo moltiplicare il totale delle mogli Ariete per il totale degli uomini Ariete, e dividere per il totale complessivo delle coppie contenute nella statistica.

Questa è una regola statistica elementare. Voas non cerca di spiegare perché sia così, ma si limita a dire che è così. Discepolo che ha condotto delle statistiche analoghe dove c'era da confrontare i segni di coppie di persone, come in questa statistica, non conosceva questa regola, e per questo cercava il numero atteso con una procedura random che gli dava dei valori che cambiavano di volta, in volta.

Non c'è alcun bisogno di ricorrere a delle procedure random, perché i valori attesi dipendono dal numero delle persone di ciascun segno, e sono già impliciti in questi numeri.

Dovete immaginare i soggetti della statistica come se fossero delle palline da ping pong con sopra disegnato il simbolo del segno. In un sacco ci sono le palline che rappresentano le mogli, e in un altro sacco ci sono le palline che rappresentano i mariti. Ovviamente i due sacchi contengono lo stesso numero di palline.

Se noi estraiamo a caso una pallina da ciascun sacco e creiamo così delle coppie, più o meno, quante potrebbero essere le coppie formate da una moglie Ariete e da un marito Leone?

Per trovare questo numero dobbiamo moltiplicare il numero delle mogli Arieti per il numero dei mariti Leone e dividerlo per il numero totale delle coppie presenti nella statistica.

La statistica di Voas si basa proprio su questo. Abbiamo la possibilità di poter stabilire il numero atteso per ciascuna di queste 144 coppie di segni di nascita, e quindi possiamo confrontarlo con i numeri reali delle coppie trovate, e verificare se ci sono delle differenze tali, da non poter essere l'effetto di un caso.

Su queste tutto ciò io e Voas siamo perfettamente d'accordo.

Voas nota che nei dati che gli sono stati forniti dallo ONS ci sono alcune anomalie. Ad esempio nota che apparentemente le persone nate il primo gennaio sono molto più numerose di quello che dovrebbero essere, e che lo stesso avviene anche per il primo giorno del mese di tutti gli altri mesi, sebbene in misura ridotta rispetto al 1 gennaio.

Naturalmente non c'è alcun motivo per cui il primo gennaio dovrebbero nascere più persone di quante ne nascono negli altri giorni dell'anno, e si tratta quindi di un artefatto.

Le ragioni di questo artefatto sono facilmente spiegabili. Quando non è conosciuta la data di nascita e si sa soltanto l'anno di nascita è consuetudine registrare come data di nascita il primo gennaio di quell'anno, e lo stesso avviene se si conosce il mese, ma non esattamente il giorno di nascita. In questo caso viene attribuito come giorno di nascita il primo di quel mese.

Un'altra anomalia che emerge dai dati è che apparentemente c'è un gran numero di persone sposate che sono nate nello stesso giorno e mese.

Anche questa anomalia è da attribuirsi ad un errore. Probabilmente una parte delle persone che avevano compilato i questionari non avevano capito che avrebbero dovuto inserire i dati di nascita del coniuge e per errore ha inserito invece i propri dati di nascita.

Voas dice che un funzionario dello ONS gli ha spiegato che ci sarebbe anche un gran numero di persone che compilando il questionario del censimento ha scritto di essere sposato con un coniuge del suo stesso sesso, e la cosa non era chiaramente possibile perché nel 2001 nel Regno Unito non era previsto il matrimonio tra persone dello stesso sesso.

Naturalmente di tutte queste anomalie bisogna tener conto, e Voas lo fa eliminando ad esempio dalla statistica tutte le coppie dove almeno uno dei coniugi è nato il primo del mese.

Voas una volta eliminate queste coppie costruisce quindi due tabelle, in una tabella incrocia i mesi di nascita dei coniugi, e nell'altra confronta i loro segni.

Da queste tabelle emerge qualcosa di insolito, sia le coppie formate da persone nate nello stesso mese, sia quelle formate da persone dello stesso segno sono più numerose di quello che dovrebbero essere.

C'è da dire che questo è esattamente quello che è stato rilevato dalla statistica di Didier Castille che ha compiuto una statistica sui matrimoni analoga a quella di Voas, ma con la popolazione francese.

Per cui i dati della statistica di Voas confermano i dati della statistica di Didier Castille, c'è qualcosa che fa si che si sposino più frequentemente le persone che sono nate nello stesso periodo dell'anno.

Ma Voas non è convinto di questo, e ipotizza che anche questo sia dovuto ad un artefatto, così come sono un artefatto le nascite avvenute il primo del mese, e così come è dovuto in gran parte ad un artefatto, l'eccesso riscontrato per le coppie, che apparentemente sono nate nello stesso giorno e mese.

Ma di questo ne parleremo nei prossimi post.

Nessun commento: