venerdì 1 novembre 2013

Il metodo Didier Castille

Didier Castille

In questo post parlo di cose che per alcuni potrebbero essere un po' complicate, per cui se non l'avete già fatto, vi consiglio invece di leggere il mio post precedente che è di più facile comprensione. 

Le regole astrologiche #1 e #2, pubblicate in Transiti e Rivoluzioni Solari, Armenia Editore, ma già descritte decenni prima in altre sue pubblicazioni, sono state statisticamente dimostrate da Didier Castille – il più grande ricercartore statistico astrologico al mondo – su tutta la popolazione francese, e costituiscono probabilmente la prova più convincente in astrologia della possibilità di dimostrare statisticamente alcuni items astrologici.

Ciro Discepolo


Dall’insieme di questo tema, se lo sapete leggere, avete il quadro di un essere cattivo, depresso, vendicativo, ottuso, che ripete idiozie all’infinito, che vorrebbe obbligare i Professori che hanno certificato la mia ricerca a trovare i dischetti nei loro archivi per farli esaminare a lui: lo Sceriffo, il più grande ignorante di questa Terra che continua a dire che la ricerca descritta nel libro che conoscete andava fatta senza il campione random e non gl’interessa che i Professori dicano il contrario: esso (dato il nome che si è dato), che ha prodotto zero in tutta la vita, ne sa di più dei Professori di statistica coautori del libro dove è scritto che tutti i calcoli e le analisi statistiche furono rifatti in sede universitaria!

Ciro Discepolo

Secondo Ciro Discepolo, Didier Castille sarebbe il più grande ricercatore statistico al mondo, mentre io sarei un imbecille perché dico che la ricerca di Discepolo sull'ereditarietà andava fatta senza il campione random.

Ma Didier Castille ha fatto la sua ricerca statistica sulla mortalità senza ricorrere ad un campione random.

Questa storia mi ricorda quella sulla quadratura tra Mercurio e Saturno che è presente nel mio oroscopo e in quello del padre di Discepolo. La stessa quadratura fa di me un mentecatto dal cervello piatto, mentre nel caso di suo padre, questa quadratura è un aspetto che indicherebbe la genialità.




Leggete cosa scrive Didier Castille nelle pagina linkata:

Un tableau théorique est ensuite calculé. Pour chacune des 144 cases, le total de la ligne à laquelle la case appartient est multiplié par le total de la colonne à laquelle la case appartient et ce produit est divisé par le total général du tableau.

Didier Castille

Questa è la traduzione effettuata con Google Translator:

Un quadro teorico viene calcolato. Per ciascuno dei 144 casi, il totale della linea a cui appartiene il caso viene moltiplicato per il totale della colonna a cui appartiene il caso e questo è diviso per il totale della tabella.

Mentre una traduzione un po' più chiara potrebbe essere la seguente:

Viene calcolata una tabella con i valori attesi. Per ciascuna delle 144 caselle, il totale delle riga a cui appartiene la casella viene moltiplicato per il totale della colonna a cui appartiene la casella, e il prodotto così ottenuto viene diviso per il totale della tabella.

In realtà questo non è il metodo Didier Castille, ma è il metodo che viene utilizzato dagli statistici - Didier Castille è laureato in statistica - per calcolare i valori attesi in questo tipo di statistica.

Ad esempio, anche David Voas che ha compiuto una ricerca analoga ha adottato lo stesso metodo:

Expected frequencies are calculated as the product of the two marginal totals
divided by the grand total.

Le frequenze attese sono calcolate come il prodotto dei due totali marginali divisi per il gran totale.

Pagina 10 della voasastrology.





Ma vediamo in cosa consiste questa regola con un esempio:


Questa è una tabella che indica i risultati trovati elaborando i dati contenuti nel file denominato "Lille" da Michel Gauquelin. Per vedere in dettaglio come è stata ottenuta questa tabella clicca qui.

Questa tabella contiene 144 caselle in cui ci sono il numero delle coppie di figli e di padri per ciascuna combinazione dell'ascendente dei figli con il segno solare dei padri.

Il numero delle coppie totali è 2935, che è un numero molto inferiore al numero dei soggetti contenuti nel file lille, perché stiamo analizzando solo il rapporto tra il segno ascendente dei figli e il segno solare dei padri, e quindi le madri non compaiono in questo studio, così come non compaiono i figli che sono orfani del padre, o di cui non era conosciuto il padre.

Per cui questo totale rappresenta il numero dei figli presenti nella statistica di cui era nota la paternità.

Ovviamente si tratta di paternità presunta, perché come sappiamo la madre di un bambino è sempre certa, ma per i padri questa certezza non c'è. Questo non è un problema per la statistica, perché la maggior parte dei padri dovrebbe comunque essere autentica, per cui la presenza di alcuni padri "finti", potrebbe al massimo rendere i risultati meno evidenti, ma se esistono delle correlazioni tra l'ascendente dei figli e il segno solare dei padri, queste correlazioni dovrebbero emergere dalla statistica.

Il numero dei padri è invece minore di 2935 perché un padre può avere diversi figli, e in questo caso viene conteggiato più volte, perché stiamo considerando le coppie di figli e di padri. Se ad esempio un padre ha tre figli, che si chiamano Antonio, Biagio, e Carlo, il suo segno solare viene conteggiato 3 volte, perché viene messo in relazione con il segno ascendente dei suoi tre figli.

Ma veniamo al metodo Castille.

Nella casella Ariete-Ariete ci sono 11 coppie, questo è il numero delle coppie trovate, ma come facciamo a trovare il numero delle coppie attese?

Dobbiamo moltiplicare i totali marginali intercettati dalle varie caselle dello stesso ascendente/segno e dividerli per il gran totale.

Ariete-Ariete = 109 * 279 / 2935 = 10,36150

Toro/Toro = 140 * 236 / 2935 = 11,25724

Gemelli/Gemelli  = 230 * 230  / 2935 = 18,02385

Cancro/Cancro = 309 * 222  / 2935 = 23,37240

Leone/Leone = 356 * 214  / 2935 = 25,95707

Vergine/Vergine = 337 * 256  / 2935 = 29,39421

Bilancia/Bilancia = 318 * 231  / 2935 = 25,02828

Scorpione/Scorpione = 347 * 232  / 2935 = 27,42896

Sagittario/Sagittario = 293 * 235  / 2935 = 23,45997

Capricorno/Capricorno = 223 * 263  / 2935 = 19,98262

Aquario/Aquario = 156 * 279  / 2935 = 14,82930

Pesci/Pesci = 117 * 258  / 2935 = 10,28484

Sommando i risultati ottenuti per ciascuna di queste caselle, otteniamo il numero delle coppie previste sulla diagonale centrale, ossia sulla diagonale formata dalle coppie di figli e di padri con lo stesso ascendente/segno.

10,36150 +
11,25724 +
18,02385 +
23,37240 +
25,95707 +
29,39421 +
25,02828 +
27,42896 +
23,45997 +
19,98262 +
14,82930 +
10,28484
-------------
239,38024

Questo è il numero di coppie previste di figli e di padri con lo stesso ascendente/segno.


Quante sono invece le coppie trovate?

Ariete-Ariete = 11

Toro/Toro = 10

Gemelli/Gemelli  = 22

Cancro/Cancro = 24

Leone/Leone = 25

Vergine/Vergine = 29

Bilancia/Bilancia = 27

Scorpione/Scorpione = 36

Sagittario/Sagittario = 22

Capricorno/Capricorno = 23

Aquario/Aquario = 18

Pesci/Pesci = 14

11 +
10 +
22 +
24 +
25 +
29 +
27 +
36 +
22 +
23 +
18 +
14
-----------
261

Le coppie trovate sono 261 e quelle previste sono 239, su un totale di 2935 coppie.

Quelli poco ferrati con la matematica e le statistiche, possono interrompere qui la lettura di questo post, il cui scopo principale era quello di mostrare come in questo tipo di statistica non fosse affatto necessario generare un gruppo di controllo in modo casuale.



Nel file Lille ci sono 22 coppie in più del previsto, ma questi numeri sono statisticamente significativi?

Io per calcolare la significatività statistica utilizzo la pagina che ho creato, in cui inserisco il numero delle coppie totali, il numero delle coppie attese, e il numero delle coppie trovate.


Ma siccome potreste non fidarvi del mio calcolatore di significatività, allora vi suggerisco di calcolarla con il metodo del chi-quadrato.

Chi-quadrato= (Osservati - Previsti)^2  /  Previsti

Chi-quadrato= (261-239)^2  /  239 = 2,025

Il valore del chi-quadrato ottenuto va poi inserito in una tabella che calcola il P value.


In questa tabella bisogna osservare il primo rigo, dove ci sono i valori del chi-quadrato relativi ad 1 grado di libertà. Il valore del chi-quadrato che abbiamo appena calcolato 2,025 si colloca tra il valore 1,642 e il valore 2,706 per cui la probabilità corrispondente è tra 0,20 e 0,10 e questo conferma la correttezza del P value da me calcolato che è  0,1466.

Un P value pari a 0,1466 secondo i criteri convenzionali adottati dagli statistici non è statisticamente significativo, perché il valore minimo per poter definire una deviazione significativa è pari a 0,05.

Ricordo che tanto più il valore del P value è piccolo tanto più la significatività statistica è grande.

In questo caso avendo trovato che il P value ha un valore compreso tra 0,20 e 0,10, significa che la probabilità di trovare una deviazione come quella riscontrata di 22 coppie, o maggiore di essa, è circa del 10% o del 20% ed è troppo elevata per parlare di significatività statistica.

In altre parole, se dovessimo ripetere questa statistica con un nuovo campione, la probabilità di riscontrare una deviazione come questa di 22 coppie o anche maggiore, è circa del 10% o del 20% e tutto questo soltanto sulla base delle leggi del caso, senza la necessità di ipotizzare un influsso astrologico.

Bisogna però specificare che quello che è stato calcolato è il P value (two tailed) ossia con due "code", che significa che la probabilità che è stata calcolata si riferisce alla deviazione tra i valori osservati e quelli previsti.

Se invece avessimo scommesso che avremmo trovato una deviazione di segno più, ossia se avessimo scommesso che avremmo trovato un eccesso di coppie piuttosto che un deficit, allora il valore del P value va dimezzato. Ma anche se consideriamo un P value dimezzato e quindi pari a 0,0733 si tratterebbe comunque di un valore troppo alto per parlare di significatività statistica.


Da notare infine, che il file Lille è quello che mostra l'eccesso maggiore tra i sei file della statistica, ed è quindi quello che sarebbe più favorevole alla tesi di Discepolo, ma nonostante questo sia il risultato migliore tra quelli trovati non raggiunge la significatività statistica.

L'unico file che mostra una significatività statistica è quello denominato Bourges, solo che si tratta di una significatività "negativa", perché in questo caso, le coppie di figli e di padri con l'ascendente e il segno solare uguali, sono meno del previsto, e non più del previsto come affermato da Ciro Discepolo.



giovedì 31 ottobre 2013

L'uomo che vedeva l'invisibile


I figli con l'ascendente uguale al segno solare dei padri sono 6 in meno del previsto, su un campione di oltre 80.000 soggetti.

Discepolo invece sosteneva che i figli con l'ascendente uguale al segno solare dei padri erano molti di più del previsto. Nel suo libro on line: "Astrologia si, e no" compare un grafico in cui questi figli risultano essere circa il 30% in più del previsto su un campione di 47.000 soggetti.

Siccome il numero previsto per questo tipo di coppie figli/padri sull'intero campione della ricerca è 2034, praticamente Discepolo avrebbe trovato 610 coppie in più del previsto.

Ma come ha fatto a vedere queste 610 coppie in più quando in realtà ci sono 6 coppie in meno?

Discepolo si definisce il massimo esperto mondiale delle rivoluzioni solari, e sostiene che spostandosi in certe località nel giorno del compleanno sia possibile modificare il proprio destino.

Lui dice di aver avuto innumerevoli conferme della validità delle sue teorie, dobbiamo credergli?

Non potrebbe essere che i decantati benefici delle rivoluzioni solari mirate siano del tutto inesistenti, così come è inesistente il surplus di figli con l'ascendente uguale al segno del padre?


martedì 29 ottobre 2013

Challenged

Ciro Discepolo

La pagina di Astro.com dedicata a Ciro Discepolo, è stata recentemente modificata da Alois Treindl.

Nella vecchia versione si leggeva:

Since the beginning of his interest in astrology, he has conducted statistical research. At the beginning of the '90s, he obtained solid results with researches on astral heredity on a sample of over 75,000 subjects. 

Questa frase si legge ancora, ma ad essa è stata aggiunta la frase che segue:

Some of his results and methods have later been challenged by other publications. 

Quindi adesso è ufficiale, è in atto una sfida, come intende rispondere Discepolo a questa sfida?

Insultare lo sfidante come ha sempre fatto non è una risposta accettabile.

Io ho replicato la statistica di Discepolo utilizzando in gran parte gli stessi dati che aveva utilizzato lui, perché questi dati erano stati raccolti da Michel Gauquelin.

Ho trovato i seguenti risultati:


Complessivamente i figli che hanno come ascendente il segno solare del padre sono appena un po' meno di quello che dovrebbero essere, mentre secondo Discepolo dovrebbero essere molti di più.

Io non mi limito a dire che questi sono i risultati che ho trovato, ma mostro anche le pagine che sono servite a calcolare questi risultati, e che contengono tutti i Temi Natale dei soggetti della statistica.


Il metodo che ho utilizzato per calcolare i valori attesi è lo stesso metodo utilizzato da Didier Castille nella sua statistica sui matrimoni. 

Didier Castille


Discepolo però insisteva dicendo che per calcolare i valori attesi bisognava mischiare le famiglie, e allora ho deciso di accontentarlo creando una pagina che calcola i valori attesi mischiando le famiglie come suggerito da Discepolo.

Questo metodo è molto più laborioso del metodo di Didier Castille, ma presenta qualche vantaggio rispetto a questo. Il metodo Didier Castille ci permette di trovare con facilità il numero atteso, però non ci dice se la variazione tra i valori attesi e i valori trovati sia significativa oppure no.

Invece il metodo di mischiare le famiglie ci permette di trovare automaticamente il valore del P value, ossia ci permette di sapere se una deviazione è significativa, e se lo è, anche in che misura lo è.



venerdì 18 ottobre 2013

Basta con le statistiche

Astrological Coach


Alle persone che capitano sul mio blog le statistiche non interessano. Ho notato che più io insisto nel parlare di statistiche tanto più diminuiscono i frequentatori del mio blog. La cosa non mi fa piacere, però non ho alcuna intenzione di cambiare argomento, perché questo è il mio blog e mi piace parlare delle cose che mi interessano, e non posso mica mettermi a parlare di calcio, visto che il calcio non mi interessa per nulla.

Comunque credo che chi abbia letto un po' delle cose che ho scritto, abbia capito che le statistiche di Discepolo siano sbagliate, e che non era vero che queste statistiche fossero state certificate dai professori universitari, come diceva Discepolo.

Però chi credeva nelle teorie astrologiche di Discepolo continua a crederci anche adesso.

Credo che i seguaci di Discepolo non diano molta importanza alle statistiche di Discepolo, e che anche se queste statistiche sono sbagliate, lo giustificano, perché Discepolo è un astrologo e non è uno statistico, per cui anche se ha sbagliato con le sue statistiche, la cosa non ha molta importanza.

Però le cose non stanno in questo modo, perché gli errori commessi da Discepolo con le statistiche, non sono imputabili alla scarsa conoscenza di Discepolo delle statistiche, ma a qualcosa d'altro.

Quando Discepolo ripete la randomizzazione delle famiglie che aveva fatto inizialmente una sola volta, per altre 100 volte, e si accorge che il risultato che inizialmente era stato archiviato come significativo, con questi nuovi 100 confronti, risulta essere significativo solo due o tre volte, perché continua a ritenerlo significativo?

Lui trova 97 o 98 risultati che gli danno torto, ma nonostante questo continua a ritenere valido il risultato che aveva trovato all'inizio.

Come mai Discepolo non tiene conto di questi 97 o 98 risultati su 100 che smentiscono quello che credeva di aver trovato inizialmente?

Questo errore è imputabile ad una scarsa conoscenza dei metodi statistici? Discepolo sbaglia perché ignora qualche formula che invece conoscono gli esperti di statistica?

Non si tratta di questo, Discepolo sbaglia perché lui non prende mai in considerazione i risultati che contraddicono le sue teorie, e questo lo fa sia quando si occupa di statistiche, sia quando interpreta gli oroscopi.

In questi giorni sul blog di Discepolo c'è una donna che scrive che sebbene avesse fatto una rivoluzione solare mirata consigliatela dallo stesso Discepolo, nel corso dell'anno le è venuta una malattia agli occhi che le provoca un grande fastidio e che la preoccupa molto.

Discepolo le risponde che nonostante la malattia si sia manifestata solo recentemente, potrebbe aver avuto inizio tempo fa, ad esempio nell'anno precedente quando questa persona non è partita per la rivoluzione mirata.

Discepolo ha ragione, perché potrebbe essere come dice lui, la malattia potrebbe aver avuto origine nell'anno in cui c'era una cattiva RS, per poi manifestarsi nel corso di una buona RS.

Però potrebbe anche non essere così, perché si può anche ipotizzare che questa persona si sia ammalata perché la RSM non ha funzionato, o perché quella RSM era errata, o perché le rivoluzioni solari non funzionano per nulla.

Come mai Discepolo queste ipotesi non le prende nemmeno in considerazione?

Siete sicuri che non sta facendo qualcosa di simile a quello che ha fatto con le statistiche quando ha trovato che c'erano 97 risultati che gli davano torto e 3 che gli davano ragione, e ha concluso che aveva ragione?

Discepolo ha ragione nel dire che la malattia potrebbe essere iniziata nell'anno delle cattiva RS, però si tratta di una ipotesi, e le ipotesi andrebbero verificate.

Anche le 11 coppie in più trovate nella statistica paris12, sebbene non fossero statisticamente significative potevano portare ad ipotizzare l'esistenza di un influsso astrale che fa nascere i figli con l'ascendente uguale al segno del padre, solo che poi questa ipotesi non è stata confermata.

Il motivo per cui Discepolo usa il condizionale nel dire che la malattia sarebbe iniziata in un anno precedente, è perché c'è una ipotesi alternativa che è che l'orario di nascita di questa persona potrebbe essere sbagliato, però lui non prende nemmeno in considerazione l'ipotesi che potrebbero essere sbagliate le sue teorie sulle rivoluzioni solari.

giovedì 17 ottobre 2013

Attenti a quei transiti


Clicca sull'immagine per leggere il testo

Il testo riportato nell'immagine qui sopra è tratto dal libro di Ciro Discepolo: "Osservazioni politematiche sulle ricerche Discepolo/Miele". 

Discepolo a questo punto delle sue ricerche si è reso (finalmente) conto, che utilizzando i numeri random o meglio i numeri pseudo random generati dal computer, ottiene dei risultati che variano di volta, in volta, e quindi si domanda esisterà un metodo oggettivo per scegliere quale tra questi risultati è quello giusto?

Bisognerà tener conto dei transiti del ricercatore? 

Ci rendiamo conto allora, che stiamo trattando una materia di confine tra la scienza e verità esoteriche non ancora chiaramente decifrabili. E forse questa potrebbe essere una spiegazione del fatto che occorrerebbe individuare un metodo "oggettivo" per portare avanti valori di ricerca statistica, assicurandosi che i transiti del ricercatore, in quel momento, non saranno determinanti, alla fine, per il risultato della ricerca.


Pazzesco!

Il metodo "oggettivo" cercato da Discepolo c'è, anzi di metodi ce ne sono almeno due.

Uno di questi metodi si basa proprio sull'utilizzo dei numeri casuali. Quello che probabilmente Discepolo non ha capito, è che una procedura basata sui numeri casuali può portare ad un risultato certo e per nulla casuale.

Il trucco qual è?

Invece di prendere un singolo risultato casuale ottenuto mischiando le famiglie, i risultati vanno presi TUTTI.

Quello che interessa sapere, non è quello che avviene in una singola randomizzazione, ma quello che succede in una serie di randomizzazioni, in modo da poter disegnare una curva che indica la frequenza con cui si ripetono i risultati e quindi la loro probabilità.

Se ad esempio prendiamo 100 risultati casuali ottenuti mischiando le famiglie del file paris12, e costruiamo un grafico con questi risultati, otteniamo la curva a campana che si vede sulla copertina del libro di Discepolo.


Sull'asse delle x ci sono i risultati ottenuti, mentre quello delle y indica la frequenza con cui questi risultati si ripetono.Questa curva ci dice che ci sono dei risultati che sono più frequenti e altri che sono meno frequenti.
I risultati più frequenti si trovano sull'asse delle x in corrispondenza del dosso della curva al centro dell'immagine, mentre a mano a mano che ci si allontana dal centro in una direzione o nell'altra, i risultati sono via, via, meno frequenti.

Una volta disegnata questa curva possiamo vedere il risultato ottenuto con le coppie vere in che punto del grafico si colloca. Se il risultato ottenuto con le coppie vere si trova nella zona centrale del grafico non è significativo, se invece si trova in una delle due estremità di questa curva è statisticamente significativo.

Se invece si mischiano le famiglie una sola volta, come aveva fatto inizialmente Discepolo, non è possibile disegnare la curva che si vede nel grafico, perché per disegnare questa curva, abbiamo bisogno di una serie di risultati casuali.

Forse a qualcuno la cosa potrebbe sembrare strana, ma se si procede in questo modo, utilizzando delle procedure che utilizzano i numeri random del computer, il risultato finale non è affatto random.

Perché se ad esempio ripetiamo questa procedura basata su una serie di 100 randomizzazioni per 10 volte, il risultato indicato come più probabile sarà lo stesso in ciascuna di queste 10 simulazioni. 
Se questo non dovesse accadere, allora abbiamo bisogno di aumentare il numero delle randomizzazioni, e invece di effettuarne 100 ne effettueremo 1000. 

Con un congruo numero di randomizzazioni, che non occorre definire in anticipo ma che si può stabilire sulla base dei risultati ottenuti, il risultato finale è sempre lo stesso.

Per cui questo è il metodo oggettivo auspicato da Discepolo, e che non risente affatto dei transiti che sta avendo il ricercatore in quel momento.

martedì 15 ottobre 2013

I numeri della statistica


I numeri nella tabella qui sopra riassumono i risultati totali della statistica da me condotta per verificare l'affermazione di Ciro Discepolo secondo cui nascerebbero più figli della media con l'ascendente uguale al segno solare del padre.

I dati che sono serviti per elaborare la statistica erano stati raccolti da Michel Gauquelin, e sono gli stessi dati utilizzati da Discepolo nelle sue ricerche, con l'eccezione dei dati contenuti nel file bourges, o almeno così credo, perché Discepolo scrivendo a proposito di un'altra statistica riguardante le coppie sposate, cita tutti questi file eccetto quello denominato bourges.

Nella tabella si legge il nome dei file da cui sono stati ricavati i risultati, il numero delle coppie figli/padre considerati, che ovviamente è un numero inferiore al totale dei soggetti contenuti in ciascun file, il numero delle coppie osservate in cui il figlio ha come ascendente il segno solare del padre, il numero previsto per questo tipo di coppie, e la differenza tra il numero di coppie osservate e il numero delle coppie previste.

Come si vede nell'ultima colonna della tabella, la differenza tra le coppie osservate e quelle previste è molto piccola, fatta eccezione per il file bourges che mostra però un valore negativo. Le coppie di figli e di padri con lo stesso ascendente/segno, in questo file risultano essere meno del previsto, e lo sono in maniera statisticamente significativa.

Ma, come dicevo, probabilmente Discepolo questo file non lo possedeva quando ha elaborato la sua statistica, per cui decidiamo di non considerarlo, sebbene il file bourges con 56 coppie in meno del previsto, da solo, capovolge il risultato della intera statistica, perché il totale della colonna Oss.-Pre. è di segno meno. 

Le coppie di figli e di padri con lo stesso ascendente/segno che secondo Discepolo dovrebbero essere molto più numerose del previsto, sono invece appena, appena meno del previsto.

11 + 4 + 11 + 2 + 0 - 56 + 22 =  - 6

Ma anche se non consideriamo le 56 coppie in meno trovate per bourges, la differenza tra le coppie osservate e quelle previste, è comunque una differenza molto piccola e priva di qualsiasi significatività statistica.

11 + 4 + 11 + 2 + 0 + 22 =  50

Sommiamo il totale delle coppie di ciascun file escludendo bourges:

2739 +
2311 +
3528 +
4870 +
3485 +
2935 =
------------
19868

Sommiamo le coppie osservate (bourges escluso):

234 +
196 +
303 +
404 +
287 +
261 =
-----------
1685

E sommiamo le coppie previste (bourges escluso):

223 +
192 +
292 +
402 +
287 +
239 =
----------
1635

Inseriamo questi numeri nel calcolatore di significatività:


Il risultato è che le coppie in più del previsto che sono 50, sono circa il 3,06% in più, e che questo surplus non è statisticamente significativo. Quindi, anche considerando soltanto i file che mostrano un incremento delle coppie, senza considerare il file che mostra un deficit delle coppie, cosa che non andrebbe mai fatta, perché non si possono escludere dai risultati quelli che non ci "piacciono", il risultato finale è che non è affatto dimostrato che i figli nascono più spesso della media con l'ascendente uguale al segno del padre.

Discepolo invece di pubblicare sul suo blog i miei numeri di telefono per farmi dispetto, perché non pubblica i numeri della sua statistica?

domenica 13 ottobre 2013

Il valore dello Zeta ricalcolato da Discepolo


Il valore dello Zeta calcolato per le coppie formate da figli che hanno come segno ascendente il segno solare dei padri è 2.64, ma che significa questo numero?

Per saperlo abbiamo bisogno della tabella che segue:


Da questa tabella ricaviamo che ad un valore di Zeta uguale a 2.64 corrisponde un P-value(one tailed) uguale a 0.004.

In altre parole, la probabilità che l'eccesso riscontrato per le coppie di figli e di padri considerati fosse dovuto ad un caso era uguale a 4 su mille, ovvero a 1 probabilità su 250.

Se questo valore dello Zeta fosse stato ben calcolato, si sarebbe trattato quindi di un risultato interessante, perché essendo il P-value piuttosto basso, questo ci avrebbe indotti a credere che non si trattasse di un risultato casuale, e quindi a ritenere che ci fosse qualcosa (una legge astrologica?), che facesse si, che i figli nascono più spesso della media con l'ascendente uguale al segno solare del padre. 

Solo che questo valore dello Zeta era stato calcolato in modo errato, perché si basava sul confronto tra il numero delle coppie di questo tipo trovate nel file paris12, e un numero generato mischiando le famiglie una unica volta, mentre Discepolo avrebbe dovuto mischiare le famiglie almeno un centinaio di volte e fare la media dei risultati ottenuti per ottenere il valore atteso per questo tipo di coppie.

Ma come faccio a dire che Discepolo ha commesso questo errore?

Discepolo scrive di me, che farei finta di fare dei calcoli di statistica e che di statistiche non ci capisco nulla.

Quindi potrebbe aver ragione lui e quel valore dello Zeta potrebbe essere stato ben calcolato?

No, non è questo il caso, perché è lo stesso Discepolo che nel libro on line: "Osservazioni politematiche sulle ricerche Discepolo/Miele", spiega che inizialmente aveva calcolato il valore atteso randomizzando le famiglie una unica volta, e che solo in un secondo tempo ha pensato di ripetere queste randomizzazioni per 100 volte. 



Da queste righe si evince che Discepolo aveva calcolato il valore atteso prendendo il primo risultato ottenuto mischiando le famiglie un'unica volta, e questo non andava fatto, perché come ho spiegato nel mio post precedente, mischiando le famiglie si ottiene quasi sempre un risultato diverso, e quindi non adatto ad essere usato come termine di paragone.

Però oltre a questa ammissione dell'errore iniziale, Discepolo ci fornisce un risultato perché scrive:

"Ma la cosa strana fu che nel 90 per cento dei confronti, la coppia vera era sempre più alta della coppia falsa" e poi leggete nel punto in cui scrive: "Sul fatto, poi, come detto, che il 90 per cento delle successive estrazioni ci dava un numero vero superiore a quello falso, statisticamente non aveva alcun valore.".

Discepolo non se rende conto, ma ha calcolato la vera significatività statistica per questo tipo di coppie.

Se nel 90% dei casi il valore calcolato mischiando le famiglie risultava essere inferiore al numero di coppie trovate nel file originale, questo significa che nel 10% dei casi il numero ottenuto casualmente era uguale o superiore al numero delle coppie reali.

Per cui la significatività statistica per queste coppie è pari a P(one-tailed)=0.10 e non a P(one-tailed)=0.004 come aveva inizialmente trovato.

Infatti il P-value è proprio questo che ci dice, perché ci dice quante sono le probabilità di trovare casualmente un valore uguale o maggiore a quello effettivamente trovato.

Quindi il valore del P-value calcolato dallo stesso Discepolo per queste coppie è pari a 0.10, ossia c'è una probabilità su 10 di ottenere questo stesso valore o uno superiore per puro caso.

Un valore così alto del P-value è ritenuto non significativo, per cui è lo stesso Discepolo che smentisce se stesso, sebbene lui non se ne renda conto.

Quindi è perfettamente inutile che lui insista nel dire che le tabelle delle Zeta sono state calcolate dai professori di statistica e che riportano le loro impronte digitali.

Lo Zeta corrispondente ad un P-value uguale a 0.10 si può leggere nella tabella di conversione che ho riportato.

Zeta= 1.28 (secondo i calcoli di Discepolo) NON SIGNIFICATIVO

lunedì 7 ottobre 2013

Un metodo sbagliato

Falsa significatività (Expected = 198)

Non ha risposto nessuno alla domanda che vi avevo posto nel post precedente, eppure si trattava di una domanda semplicissima. Credo che sia un tipo di domanda che non è ammessa nei tribunali, perché chiedevo di dire quale sarebbe stata la scelta di Discepolo. Però qui non siamo in un tribunale, per cui qualcuno avrebbe potuto rispondere lo stesso. Cosa avreste dovuto fare? Avreste dovuto notare che il numero di coppie presenti sulla diagonale centrale, è diverso nella tabella originale e in ciascuna delle quattro tabelle random, cosa che vi avevo già detto io, e che quindi Discepolo avrebbe scelto la tabella n.4 come termine di paragone, perché in questa tabella il numero di coppie sulla diagonale centrale è minore rispetto alle altre.

Tabella Reale:
10 + 20 + 17 + 29 + 17 + 31 + 25 + 18 + 25 + 18 + 15 + 9 = 234

Tabelle Random:
7 + 13 + 15 + 17 + 28 + 30 + 18 +16 + 27 + 11 +18 + 8 = 208

8 + 8 + 12 + 22 + 24 + 36 + 15 + 26 + 28 + 18 + 11 + 6 = 214

10 + 13 + 17 + 19 + 28 + 34 + 16 + 15 + 24 + 12 + 14 + 7 = 209

9 + 17 + 13 + 16 + 25 + 26 + 16 + 20 + 20 + 17 + 11 + 8 = 198

Se ogni volta che si mischiano le famiglie si ottiene un numero diverso è EVIDENTE che non si può utilizzare questo numero per confrontarlo con il numero trovato nella tabella con i dati reali.

E' come pretendere di prendere le misure di un mobile con un metro che a volte è lungo 120 cm, altre volte 80 cm, altre volte 90 cm ecc. ecc.

Il numero delle coppie sulla diagonale centrale della tabella con i dati reali rimane sempre lo stesso, queste coppie sono 234, ma con quale di questi 4 numeri trovati nelle tabelle random andrebbe confrontato?

Se si confronta 234 con 198, allora il risultato trovato appare essere molto significativo, ma se si confronta con gli altri tre numeri no.

Se invece calcoliamo la media tra i quattro risultati ottenuti mischiando le famiglie, otteniamo un valore più vicino al vero valore atteso.

Media = (208 + 214 + 209 + 198) / 4 = 207

In realtà anche questo valore è piuttosto lontano dal valore atteso che è 223, ma questo succede perché abbiamo usato solo quattro tabelle random, mentre ne occorrerebbero un centinaio, e perché siamo stati "sfortunati" perché il valore trovato per la quarta tabella è molto raro.

Quello che è importante sottolineare è l'assurdità del metodo di Discepolo che consisteva nel prendere come valore atteso il primo valore che otteneva mischiando le famiglie una unica volta.

Nessun professore universitario di statistica certificherebbe la validità del metodo di Discepolo, ed infatti i professori universitari non hanno mai detto che questo metodo era valido.

Io credo che i professori universitari abbiano dato per scontato che Discepolo avesse calcolato la media su un centinaio di randomizzazioni diverse, ed è per questo che hanno calcolato i valori di significatività basandosi sui numeri che gli erano stati forniti da Discepolo, altrimenti non l'avrebbero fatto.

Quando l'equivoco è stato chiarito, i professori universitari hanno detto a Discepolo che doveva calcolare la media su 100 randomizzazioni per trovare il valore atteso, ma Discepolo ha pensato di ignorare i loro consigli e di continuare con il metodo utilizzato all'inizio.

In alto vedete una immagine che indica la significatività statistica se si utilizza come valore atteso il valore più basso tra le quattro randomizzazioni. In realtà il valore del P-Value non è esatto perché le formule che ho utilizzato non sono adatte a questo tipo di problema. 

Qualche tempo fa, dicevo che il P-Value calcolato con queste formule fosse esatto, in realtà non è proprio così. Queste formule permettono di trovare con una buona approssimazione il P-Value, ma non di calcolarlo esattamente. La cosa non è importante da un punto di vista pratico, perché anche se il P-Value è leggermente diverso da quello calcolato, il risultato non cambia.  

Ad esempio nel grafico si legge che il P-Value è 0,00881 ma anche se fosse invece uguale a 0,009 o a 0,007 da un punto di vista pratico non cambierebbe nulla. Il P-Value ci dice qual è la probabilità di trovare un certo risultato per caso, e se questa probabilità è di sette casi su mille, di otto casi su mille, o di nove casi su mille, non cambia praticamente nulla, perché in tutti e tre i casi si tratta di una probabilità molto scarsa.

Credo che l'unico modo per calcolare in modo esatto il valore del P-Value in questo tipo di problema, sia proprio quello di calcolarlo per mezzo di simulazioni che facciano ricorso a dei numeri random, e sto lavorando su questo. 

Non ci provo nemmeno a spiegarvi perché il calcolo del P-Value effettuato con le mie formule sebbene fornisca una buona approssimazione non sia da considerarsi esatto, perché ho visto che non mi seguite nelle cose più semplici, e questo tanto semplice da capire non è.

Quello che invece dovrebbero capire TUTTI, è che il metodo di Discepolo di prendere come valore atteso il primo valore che si ottiene mischiando le famiglie, è un metodo assurdo, perché mischiando le famiglie si ottengono ogni volta dei risultati diversi.

Questa cosa in realtà l'ha capita lo stesso Discepolo, molto prima che fossi io a spiegargliela.

E' allo stesso Discepolo che a un certo punto è venuto in mente di controllare che cosa succedeva se invece di mischiare le famiglie una unica volta le mischiava per 100 volte.

E' lo stesso Discepolo che ha constatato che ripetendo queste randomizzazioni per 100 volte otteneva quasi sempre dei risultati diversi, per cui lui stesso si sarebbe dovuto rendere conto che il metodo utilizzato all'inizio non era valido.

Perché allora non ha corretto il suo errore?

Non significativo (expected= 223)


venerdì 4 ottobre 2013

Il metodo Discepolo

Dati Reali Paris-12



Random 1

Random 2

Random 3

Random 4


La prima di queste tabelle mostra i risultati reali estratti dal file Paris-12. Il file Paris-12 contiene le date di nascita di gruppi familiari raccolte originariamente da Michel Gauquelin in un quartiere di Parigi. Il numero totale delle date di nascita di questa statistica era di circa 8.000 soggetti. Le coppie figli/padri sono invece 2739, mentre le coppie figli/madri sono state analizzate separatamente.

Nella prima tabella, sulla diagonale evidenziata in giallo, ci sono le coppie figli/padri che sono formate da figli il cui ascendente risultava essere uguale al segno solare del padre.

Nella tabella leggiamo che delle 2739 coppie di figli e di padri, ce ne sono 10 formate da figli ascendente Ariete, che hanno un padre del segno dell'Ariete, 20 formate da figli ascendente Toro che hanno un padre del segno del Toro, ecc.

Il totale delle coppie presenti sulla diagonale è:

10 + 20 + 17 + 29 + 17 + 31 + 25 + 18 + 25 + 18 + 15 + 9 = 234

Discepolo sostiene (sosteneva?) che il numero delle coppie figli/padri presenti su questa diagonale è molto maggiore del previsto.

Ma qual è il numero delle coppie previste su questa diagonale?

Il numero di coppie previsto su questa diagonale è facilmente calcolabile moltiplicando i totali parziali in corrispondenza di ciascuna casella e dividendoli per il totale dei soggetti.

Ad esempio, se vogliamo sapere qual è il numero di coppie previste per la casella figlio ascendente Ariete/ Padre Sole in Ariete, dobbiamo moltiplicare il totale dei figli ascendente Ariete per il totale dei padri Ariete e dividere per il totale di tutte le coppie.

Ariete/Ariete= 98 * 256 / 2739 = 9.16

Proseguendo nello stesso modo calcoliamo anche le coppie previste per la combinazione Toro/Toro, Gemelli/Gemelli ecc.

Per cui le coppie previste sulla diagonale centrale risultano essere 223, undici in meno delle coppie trovate che erano 234.

Discepolo però, non adotta questo metodo, che era già stato adottato da Didier Castille in una statistica del tutto analoga, perché pensa che bisogna utilizzare una procedura random per calcolare il numero previsto per queste coppie.


Dall’insieme di questo tema, se lo sapete leggere, avete il quadro di un essere cattivo, depresso, vendicativo, ottuso, che ripete idiozie all’infinito, che vorrebbe obbligare i Professori che hanno certificato la mia ricerca a trovare i dischetti nei loro archivi per farli esaminare a lui: lo Sceriffo, il più grande ignorante di questa Terra che continua a dire che la ricerca descritta nel libro che conoscete andava fatta senza il campione random e non gl’interessa che i Professori dicano il contrario: esso (dato il nome che si è dato), che ha prodotto zero in tutta la vita, ne sa di più dei Professori di statistica coautori del libro dove è scritto che tutti i calcoli e le analisi statistiche furono rifatti in sede universitaria! 
Ciro Discepolo

Discepolo ha torto, non è vero che in questa statistica fosse necessario ricorrere ad un campione random, così come non è vero che i professori universitari abbiano certificato la sua statistica.

Comunque ho deciso di seguire anch'io il metodo di Discepolo che consisteva nel mischiare le famiglie, utilizzando la funzione random presente nei linguaggi di programmazione, facendo si che fosse il computer ad abbinare casualmente a ciascun padre un figlio qualsiasi tra i figli presenti nel database.

Ho ottenuto così quattro nuove tabelle che mostrano i risultati ottenuti mischiando le famiglie in modo casuale.

Per prima cosa notiamo che i totali parziali e il totale generale rimangono invariati anche in queste quattro tabelle random. Infatti è proprio così che deve essere, perché i soggetti della statistica sono sempre gli stessi, per cui il numero dei figli Arieti rimane invariato, così come il numero dei padri Ariete ecc.ecc..

Quello che cambia, in queste quattro tabelle, è il numero delle coppie riferito a ciascuna delle 144 caselle, per cui, di conseguenza, anche sulle diagonali centrali troviamo dei numeri diversi da quelli originali.

La somma delle coppie presenti sulla diagonale centrale, varia da tabella a tabella, come era naturale aspettarsi visto che gli abbinamenti figli/padri sono stati ottenuti in modo casuale.



Allora chiedo direttamente a Discepolo:

Signor Discepolo, tra le quattro tabelle random, quale bisogna prendere come termine di confronto con la tabella originale?

La 1, la 2, la 3, o la 4?

Discepolo, come al solito, non risponderà, però potete rispondere voi al suo posto, e quindi propongo a voi la domanda.

Quale tra queste tabelle generate in modo casuale verrà utilizzata da Discepolo?

La 1, la 2, la 3, o la 4?


giovedì 3 ottobre 2013

Falsi Successi

Giuliano Gemma nato a Roma il 2.9.1938 alle ore 3.50

Secondo Ciro Discepolo la morte di Giuliano Gemma confermerebbe le sue teorie astrologiche perché la sua ultima rivoluzione solare presentava delle configurazioni negative secondo le regole della astrologia attiva.

L'indice di pericolosità dell'anno calcolato per Cerveteri:
  • 2009.....78
  • 2010.....26
  • 2011.....78
  • 2012.....38
  • 2013.....56
Eppure l'indice di pericolosità dell'anno, calcolato sul sito di Discepolo, mostra che nel 2009 e nel 2011 l'indice di pericolosità dell'anno era molto più alto di quello del 2013.

Se qualcuno avesse chiesto a Discepolo di prevedere in quale di questi cinque anni Giuliano Gemma sarebbe potuto morire, lui che cosa avrebbe risposto? Avrebbe previsto che Giuliano Gemma sarebbe morto nel 2013? Oppure avrebbe indicato gli anni 2009 e 2011 come più probabili?


sabato 28 settembre 2013

Una teoria basata sul nulla


L'immagine riporta un breve testo presente nel libro di Discepolo intitolato "La ricerca della Verità" in cui Discepolo continua a mentire. Comunque rispetto al passato ci sono alcuni miglioramenti perché Discepolo chiarisce che l'aiuto dei professori universitari riguardava solo uno spezzone di 8.400 nascite e non il totale di 75.000 nascite dell'intera statistica, ed inoltre Discepolo chiarisce che i risultati delle sue statistiche non hanno una valenza scientifica perché lui ha preferito non seguire il consiglio dei professori e non ha eseguito le ulteriori ricerche che sarebbero state necessarie.

Queste non sono le cose che diceva prima. perché lui ha affermato più volte che le sue statistiche erano state controllate dai professori nel loro insieme su 75.000 soggetti, ed inoltre diceva che i risultati delle sue statistiche erano stati certificati dalla Scienza Ufficiale.

Qui e qui trovate qualche esempio di ciò che diceva Discepolo qualche tempo fa:

Fate attenzione a ciò che dice Discepolo nel video, specialmente all'inizio quando risponde alla domanda della conduttrice del programma:

Si, io ho condotto questa ricerca che mi appassionava molto e che ha appassionato anche personaggi come Keplero, su 75.000 temi di nascita di genitori e figli, e quando ho terminato questa ricerca, diciamo che non mi sono gloriato dei risultati ottenuti, ma li ho sottoposti a verifica, cioè li ho dati all'istituto di statistica, quindi l'ho pregato di esaminare questo lavoro.

Discepolo affermava di aver consegnato la sua ricerca su 75.000 temi di nascita all'istituto di statistica, una volta ultimata, mentre in realtà la statistica consegnata ai professori universitari riguardava solo un piccolo spezzone delle statistiche relativo a 8.400 nascite.

Inoltre non è nemmeno vero che i professori universitari abbiano certificato l'assenza di errori nemmeno relativamente a queste 8.400 nascita, perché l'errore lo avevano trovato.



Il merito di questi cambiamenti è mio. Sono io che ho pubblicato sul mio blog le email intercorse tra Discepolo e il professore di statistica, in cui Discepolo ammetteva - rivolgendosi al professore - che la collaborazione dei professori riguardava soltanto un primo spezzone della statistica e non l'intera statistica come in più occasioni aveva fatto credere ai suoi lettori e persino ad André Barbault.

Penso che dovrei ritenermi soddisfatto del risultato che ho ottenuto, ed infatti lo sono.

Discepolo continua comunque a mentire dicendo che i professori universitari hanno ripetuto i suoi calcoli e ne hanno verificato la sua correttezza relativamente allo spezzone di 8.400 nascite.

In realtà i professori hanno notato che Discepolo aveva sbagliato metodo e gli hanno consigliato di modificarlo.

Lo Z altissimo non è mai esistito nemmeno relativamente a questo spezzone della statistica su 8.400 soggetti.


Si, è vero, nel libro on line di Discepolo ci sono due tabelle disegnate dai professori che riportano un Z alto in corrispondenza di due variabili, o se preferite della stessa variabile riferita sia al rapporto figli/padri che a quello figli/madri, ma questi valori dello Z sono errati.

Forse i professori hanno agito con leggerezza, perché sarebbe stato meglio se avessero accertato la validità del metodo con cui Discepolo calcolava i valori attesi, prima di calcolare la significatività statistica. Però i professori come avrebbero potuto immaginare l'uso improprio che Discepolo avrebbe fatto dei loro calcoli?

L'errore dei professori è stato quello di accordare fiducia a Discepolo, che con il suo comportamento ha dimostrato di non meritarla.

Infatti, non appena i professori si sono accorti che il metodo utilizzato da Discepolo era errato, l'hanno detto a Discepolo e l' hanno consigliato di non limitarsi a randomizzare le famiglie una sola volta, ma di eseguire questa operazione per 100 volte e di utilizzare come valore atteso, la media dei risultati ottenuti.

Discepolo se fosse stato il cercatore di verità che finge di essere, avrebbe dovuto pregare i professori di calcolare nuovamente i valori dello Z, dopo aver corretto il suo errore, e avrebbe dovuto pubblicare una nuova tabella con i valori giusti dello Z che rettificava quella precedente.

Discepolo invece preferisce sbandierare la vecchia tabella completamente sbagliata, come prova di un risultato che non è mai esistito.

Ma anche se lo Z calcolato dai professori fosse stato veramente alto, questo non cambierebbe nulla. Una rondine non fa primavera, e un risultato statistico ha bisogno di ulteriori conferme. 

Quindi è perfettamente inutile che Discepolo citi questo apparente risultato positivo ottenuto in una frazione della sua statistica, se non mostra i risultati delle statistiche compiute sul totale dei soggetti.

Dove sono le relazioni su queste altre ricerche compiute da Discepolo?

Da nessuna parte, per cui io potrei anche fare a meno di contestare i risultati della statistica sugli 8.400 soggetti, perché comunque quei risultati non sono la prova di nulla.

Credo invece che sia meglio puntualizzare che anche quella frazione dell'intera statistica è errata, perché credo sia importante capire che Discepolo ha costruito la sua teoria sulla ereditarietà astrale basandosi sul nulla.

Qualcuno potrebbe pensare che magari Discepolo non è riuscito ad ottenere una certificazione scientifica delle sue teorie, ma che ci si sia avvicinato. Forse non ci sono le prove scientifiche di queste teorie, ma per lo meno ci sono degli indizi che fanno pensare che queste teorie possano essere valide.

No, le cose non stanno affatto così.



Non c'è proprio nulla che possa far credere che nascono più figli della media che ereditano come segno ascendente il segno solare del padre.


Qualcuno potrebbe pensare che questo tipo di coppie di figli e di padri, siano effettivamente più numerose del previsto, ma non tanto più numerose da escludere che si possa essere trattato di un caso, e che sia per questa ragione che non ci sia una validazione scientifica di questo fenomeno.

Ma non è così, dagli archivi Gauquelin che sono serviti ad elaborare queste statistiche, di questo fenomeno non risulta nemmeno l'ombra.

Le coppie di figli e di padri che secondo Discepolo dovrebbero essere molto più numerose del previsto, sono in realtà leggermente meno del previsto.



Allora Discepolo come ha fatto a prendere un abbaglio del genere?

Credo che non ci sia nessuno che crede fino in fondo alle teorie di Discepolo. Però la gente è portata a credere, che considerando la convinzione con cui Discepolo espone queste teorie, almeno una parte di vero in esse ci deve essere. Magari avere Marte in prima casa nell'oroscopo di rivoluzione, non è una cosa così negativa come afferma Discepolo, però se lo afferma con tanta convinzione, almeno qualcosa di vero ci deve essere, e allora perché rischiare, non è meglio trascorrere il compleanno da qualche altra parte?

Con la stessa convinzione Discepolo diceva anche di aver conseguito degli importanti risultati statistici che avevano ricevuto l'avallo della Scienza Ufficiale, ma non c'era nulla di vero.

Traete voi le vostre conclusioni.