lunedì 13 luglio 2009

Il bollino blu

bollino blu

Non è vero che i professori di statistica dell'univeristà di Napoli hanno apposto un bollino blu alle statistiche di Ciro Discepolo.

Basta leggere ciò che scrive Ciro Discepolo per capirlo:

Torniamo, per un momento alla nostra precedente ricerca Come già spiegammo nel precedente lavoro, per valutare se il risultato ottenuto sulla variabile cercata (cioè trovare che l’Ascendente del figlio fosse uguale al segno solare del genitore) fosse o no significativo da un punto di vista statistico, formammo delle famiglie false; cioè accoppiammo a genitori veri figli di altri genitori, servendoci della funzione “random” del computer ovvero facendo scegliere a caso al computer stesso.

Come si sa i risultati furono estremamente brillanti ed i Professori del Dipartimento di Statistica non ci chiesero altre prove su quel campione. Noi, però, successivamente e volontariamente, facemmo un supplemento di indagine e generammo altre 100 coppie di famiglie false per vedere quante volte il risultato positivo si ripeteva. Ahimé questo si ripeté solo due o tre volte, significativamente in senso statistico, ma la cosa strana fu che nel 90 per cento dei confronti, la coppia vera era sempre più alta della coppia falsa.

Chiedemmo spiegazioni al dottor Mola e al professore D’Ambra e ci fu fatto l’esempio classico del recipiente di paglia che conteneva 100 numeri. Le cose erano andate così: noi avevamo estratto un numero in mezzo a cento, dichiarando, prima di fare la scelta, quale numero avremmo estratto ed effettivamente prelevammo, bendati, il numero che volevamo prelevare. Ma non basta: udite ancora! Per la seconda volta fummo bendati e cercammo tra i cento numeri, tutti diversi, uno tra cinque dichiarati precedentemente. Anche in questo caso facemmo centro. Insomma, fu un po’ come dire che comprando un biglietto della lotteria avevamo preso uno dei premi. Sul fatto, poi, come detto, che il 90 per cento delle successive estrazioni ci dava un numero vero superiore a quello falso, statisticamente non aveva alcun valore. E dobbiamo dire, a questo proposito, che questo procedimento ci sconforta un poco. Infatti, facendo una ricerca statistica di questo tipo, si viene avvertiti che sarà quasi impossibile ottenere un risultato positivo, ma se poi lo ottieni, vieni a scoprire che lo stesso non vale niente.
Noi su questo punto vorremmo aprire un grande dibattito tra i lettori di Ricerca ’90 e soprattutto vorremmo riferirci a quanto scritto da Jung sulle statistiche, nel famoso saggio sulla sincronicità.



Da queste frasi si capisce bene l'errore di Ciro Discepolo, lui avrebbe dovuto confrontare i risultati trovati con quelli previsti, invece di ricorrere a delle coppie fittizie.

Ricorrendo alle coppie fittizie, su 100 volte ha ottenuto dei risultati statistici significativi solo due o tre volte, e quindi dei risultati non significativi in 97-98 casi su 100.

Perchè allora insiste a voler utilizzare come termine di paragone proprio quei due o tre risultati random che danno dei risultati significativi?

La presenza di questi 97-98 casi negativi sono la dimostrazione che la supposta significatività dei risultati non esiste.

E' lo stesso Ciro Discepolo che smentisce Ciro Discepolo.

I professori di statistica in questo paragrafo gli hanno detto che è stato FORTUNATO nello scegliere come termine di paragone proprio quelle coppie fittizie che danno risultati significativi, è Ciro Discepolo che stravolge il senso delle loro affermazioni.

Inoltre i professori di statistica hanno ragione nel dire che il fatto che:

il 90 per cento delle successive estrazioni ci dava un numero vero superiore a quello falso, statisticamente non aveva alcun valore.

Infatti abbiamo visto che in questa prima indagine basata su circa 8000 date di nascita,
le coppie figli/padri con lo stesso ascendente/segno erano risultate essere leggermente superiore al previsto.

Erano previste 223 coppie e ne sono state trovate 234 ossia 11 in più.

Supponendo che Ciro Discepolo non abbia commesso ulteriori errori, cosa che non è per nulla scontata, i suoi risultati random dovrebbero infatti oscillare intorno al valore previsto 223, ed è quindi naturale che nella maggior parte dei casi questi valori random risultino inferiori al valore trovato 234.

Quello che gli sfugge completamente, è il fatto che la sua statistica non è basata sui risultati realmente trovati, ma su dei risultati random che variano di volta in volta, e che quindi non sono adatti a servire come termine di confronto.

Ciro Discepolo sembra proprio che non capisca il fatto che lanciando una monetina per 100 volte, raramente otterrà 50 teste, ma otterrà dei valori che vanno da 40 a 60.
Praticamente è come se lui avesse trovato 60 teste ed invece di confrontare questo numero con 50 che sarebbe il valore atteso, lo confrontasse con 40, in modo da poter dire che si trova di fronte ad un risultato significativo.

martedì 7 luglio 2009

Il metodo della statistica



Forse non a tutti è chiaro il metodo con cui ho calcolato il numero delle coppie previste, ossia il motivo per cui per calcolarle bisogna utilizzare questa formula:


Previsti(x,y) = TotaleColonna(x) * TotaleRiga(y) / TotaleConfronti

Dove con "x" viene indicato il segno solare dei padri e con "y" l'ascendente dei figli, mentre il TotaleConfronti è il numero totale dei confronti figli/padri.

Il motivo per cui bisogna utilizzare questa formula è dovuto al fatto che la probabilità che si verifichino due eventi è data dal prodotto della probabilità di ciascun evento.

Supponiamo di avere due dadi, uno di colore rosso ed un altro di colore blu, quante sono le probabilità che lanciando contemporaneamente questi due dadi si fermino entrambi sull'uno?

Ossia qual'è la probabilità della combinazione (1,1)?

E se lanciamo i dadi per 100 volte, quante volte dobbiamo aspettarci di trovare questa combinazione (1,1), ossia qual'è il numero previsto per questa combinazione?

Cominciamo a considerare la probabilità che ha un singolo dado di fermarsi sull'uno, credo che tutti sappiano che la probabilità è 1/6.

Questo perchè le facce di un dado sono 6, e solo 1 di queste facce è contrassegnata con il numero "uno".

Se il dado non è truccato dobbiamo quindi aspettarci che lanciandolo per 100 volte esso si fermerà sull'uno circa (1/6) * 100 = 16,666 volte.

Previsti = Probabilità * Eventi

Il numero previsto non ci dice esattamente quante volte troveremo il risultato "uno", ma da un'idea del numero di volte che possiamo aspettarci di trovare questo risultato.

Se vogliamo calcolare la probabilità della combinazione (1,1) dobbiamo fare il prodotto di 1/6 * 1/6 = 1/36 e se lanciamo i dadi per 100 volte il numero previsto in cui troveremo questa combinazione è 1/36 * 100 = 2,777.

Ma siamo sicuri di aver fatto bene? Siamo sicuri che per calcolare la probabilità che entrambi i dadi si fermino sull'uno è data dal prodotto della probabilità che ha ciascun dado di fermarsi sull'uno?

Certo che siamo sicuri!

Vediamo quali sono tutte i possibili risultati che possiamo ottenere lanciando due dadi colorati, uno rosso e l'altro blu, ossia dove il risultato (1,6) è diverso dal risultato (6,1):

(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

Possiamo ottenere 36 combinazioni diverse e che sono tutte equiprobabili, di queste combinazioni una sola è la combinazione (1,1) per cui la probabilità di questa combinazione è 1/36, abbiamo quindi fatto bene a moltiplicare la probabilità di ciascun dado.

Mi scuso per una trattazione tanto elementare di qualcosa che per la maggior parte di voi era già scontata, il fatto è che vorrei che il metodo adottato nella mia statistica sia chiaro proprio a tutti.

Per capire il metodo della mia statistica non bisogna infatti essere dei professori universitari di statistica, è sufficiente aver superato l'esame di terza media.

Adesso che ci siamo convinti che per calcolare la probabilità di due eventi è necessario moltiplicare le singole probabilità di ciascun evento, passiamo a considerare la nostra statistica che mette a confronto gli ascendenti dei figli con quello dei padri.

Abbiamo un problema del tutto analogo a quello dei dadi, anche qui abbiamo delle coppie di elementi di cui vogliamo calcolare la probabilità.

Nel caso del dado sappiamo che la probabilità di uscita di "uno" è un 1/6, perchè c'è 1 sola faccia contrassegnata con "uno" sulle 6 facce di un dado.

Nel caso degli ascendenti dei figli quante sono le probabilità che ha un figlio di avere l'ascendente Ariete?

Qualcuno potrebbe pensare che siano 1/12 perchè i segni zodiacali sono 12 e solo un segno è denominato Ariete, ma questo è sbagliato, anzi sbagliatissimo.

Per calcolare la probabilità di un figlio di essere ascendente Ariete, dobbiamo contare i figli con l'ascendente Ariete ed i figli con qualsiasi ascendente presenti nella statistica

I figli presenti nel file paris12.raw con l'ascendente Ariete e che avevano un padre erano 98 mentre il numero totale dei figli con qualsiasi ascendente (compreso l'ascendente Ariete) era 2739.

La probabilità di un figlio di essere ascendente Ariete è quindi 98/2739.

Questa probabilità è molto diversa da 1/12, possiamo esprimere 98/2739 in base 12 moltiplicando il numeratore ed il denominatore per lo stesso numero(12/2739), per cui al denominatore otteniamo 2739 * (12/2739) = 12 ed al numeratore 98 * (12/2739)= 0,43.

Quindi per un figlio la probabilità di essere ascendente Ariete è 0,43/12 ossia meno della metà di quello che ci sarebbe potuto aspettare in un primo momento.

La ragione di questa stranezza è dovuta ad un motivo astronomico, l'ascendente Ariete ascende molto rapidamente, a differenza di un ascendente Bilancia che ascende invece molto lentamente.

Essendo la durata temporale degli ascendenti diversa, è naturale che i figli con un ascendente rapido siano inferiori ad un teorico 1/12 del totale.

Del fatto che la probabilità di avere un certo ascendente differisca da un teorico 1/12 è ben consapevole lo stesso Ciro Discepolo, anche se lui tra le diverse cause che concorrono a creare questa differenza citi la comodità del ginecologo che preferisce far nascere i bambini durante le ore di ufficio, mentre il fattore preponderante è quello di natura astronomica.

L'errore di Ciro Discepolo, è quello che fa immediatamente dopo, sostendo che per calcolare il numero previsto della coppia figlio ascendente Ariete / padre segno Ariete bisogna ricorrere a delle coppie fittizie, generate in maniera casuale della funzione random del computer.

Non occorre procedere in questo modo, perchè è possibile calcolare esattamente la probabilità dei figli di nascere con l'ascendente Ariete e quella dei padri di nascere con il Sole in Ariete, ed è quindi anche possibile calcolare esattamente la probabilità delle coppie Ariete/Ariete, proprio come è possibile calcolare la probabilità che hanno due dadi di fermarsi entrambi sul numero "uno".

Anche in questo caso per trovare la probabilità delle coppie figlio ascendente Ariete / padre segno Ariete, dobbiamo moltiplicare la probabilità che hanno i figli di avere l'ascendente Ariete con quella che hanno i padri di essere del segno dell'Ariete.


Probabilità(x,y)= (TotPadri(x) / TotFigli)*(TotFigli(y) / TotFigli)

e siccome per trovare il numero previsto dobbiamo moltiplicare le probabilità per il TotFigli, abbiamo la formula:

Previsti(x,y)= (TotPadri(x) / TotFigli) *(TotFigli(y) / TotFigli)* TotFigli

che semplificata diventa:


Previsti(x,y)= TotPadri(x) * TotFigli(y) / TotFigli

Dove con "x" viene indicato il segno solare dei padri e con "y" l'ascendente dei figli, mentre il TotFigli è il numero totale dei confronti figli/padri che coincide con il numero totale dei figli.
Questo perchè bisogna tener presente che un figlio può avere un unico padre, mentre un padre può avere diversi figli.

Semplice no?