domenica 3 novembre 2013
venerdì 1 novembre 2013
Il metodo Didier Castille
Didier Castille
In questo post parlo di cose che per alcuni potrebbero essere un po' complicate, per cui se non l'avete già fatto, vi consiglio invece di leggere il mio post precedente che è di più facile comprensione.
Ciro Discepolo
Dall’insieme di questo tema, se lo sapete leggere, avete il quadro di un essere cattivo, depresso, vendicativo, ottuso, che ripete idiozie all’infinito, che vorrebbe obbligare i Professori che hanno certificato la mia ricerca a trovare i dischetti nei loro archivi per farli esaminare a lui: lo Sceriffo, il più grande ignorante di questa Terra che continua a dire che la ricerca descritta nel libro che conoscete andava fatta senza il campione random e non gl’interessa che i Professori dicano il contrario: esso (dato il nome che si è dato), che ha prodotto zero in tutta la vita, ne sa di più dei Professori di statistica coautori del libro dove è scritto che tutti i calcoli e le analisi statistiche furono rifatti in sede universitaria!
Ciro Discepolo
Secondo Ciro Discepolo, Didier Castille sarebbe il più grande ricercatore statistico al mondo, mentre io sarei un imbecille perché dico che la ricerca di Discepolo sull'ereditarietà andava fatta senza il campione random.
Ma Didier Castille ha fatto la sua ricerca statistica sulla mortalità senza ricorrere ad un campione random.
Questa storia mi ricorda quella sulla quadratura tra Mercurio e Saturno che è presente nel mio oroscopo e in quello del padre di Discepolo. La stessa quadratura fa di me un mentecatto dal cervello piatto, mentre nel caso di suo padre, questa quadratura è un aspetto che indicherebbe la genialità.
Leggete cosa scrive Didier Castille nelle pagina linkata:
Un tableau théorique est ensuite calculé. Pour chacune des 144 cases, le total de la ligne à laquelle la case appartient est multiplié par le total de la colonne à laquelle la case appartient et ce produit est divisé par le total général du tableau.
Didier Castille
Questa è la traduzione effettuata con Google Translator:
Un quadro teorico viene calcolato. Per ciascuno dei 144 casi, il totale della linea a cui appartiene il caso viene moltiplicato per il totale della colonna a cui appartiene il caso e questo è diviso per il totale della tabella.
Mentre una traduzione un po' più chiara potrebbe essere la seguente:
Viene calcolata una tabella con i valori attesi. Per ciascuna delle 144 caselle, il totale delle riga a cui appartiene la casella viene moltiplicato per il totale della colonna a cui appartiene la casella, e il prodotto così ottenuto viene diviso per il totale della tabella.
In realtà questo non è il metodo Didier Castille, ma è il metodo che viene utilizzato dagli statistici - Didier Castille è laureato in statistica - per calcolare i valori attesi in questo tipo di statistica.
Ad esempio, anche David Voas che ha compiuto una ricerca analoga ha adottato lo stesso metodo:
Expected frequencies are calculated as the product of the two marginal totals
divided by the grand total.
Le frequenze attese sono calcolate come il prodotto dei due totali marginali divisi per il gran totale.
Pagina 10 della voasastrology.
Ma vediamo in cosa consiste questa regola con un esempio:
Questa è una tabella che indica i risultati trovati elaborando i dati contenuti nel file denominato "Lille" da Michel Gauquelin. Per vedere in dettaglio come è stata ottenuta questa tabella clicca qui.
Questa tabella contiene 144 caselle in cui ci sono il numero delle coppie di figli e di padri per ciascuna combinazione dell'ascendente dei figli con il segno solare dei padri.
Il numero delle coppie totali è 2935, che è un numero molto inferiore al numero dei soggetti contenuti nel file lille, perché stiamo analizzando solo il rapporto tra il segno ascendente dei figli e il segno solare dei padri, e quindi le madri non compaiono in questo studio, così come non compaiono i figli che sono orfani del padre, o di cui non era conosciuto il padre.
Per cui questo totale rappresenta il numero dei figli presenti nella statistica di cui era nota la paternità.
Ovviamente si tratta di paternità presunta, perché come sappiamo la madre di un bambino è sempre certa, ma per i padri questa certezza non c'è. Questo non è un problema per la statistica, perché la maggior parte dei padri dovrebbe comunque essere autentica, per cui la presenza di alcuni padri "finti", potrebbe al massimo rendere i risultati meno evidenti, ma se esistono delle correlazioni tra l'ascendente dei figli e il segno solare dei padri, queste correlazioni dovrebbero emergere dalla statistica.
Il numero dei padri è invece minore di 2935 perché un padre può avere diversi figli, e in questo caso viene conteggiato più volte, perché stiamo considerando le coppie di figli e di padri. Se ad esempio un padre ha tre figli, che si chiamano Antonio, Biagio, e Carlo, il suo segno solare viene conteggiato 3 volte, perché viene messo in relazione con il segno ascendente dei suoi tre figli.
Ma veniamo al metodo Castille.
Nella casella Ariete-Ariete ci sono 11 coppie, questo è il numero delle coppie trovate, ma come facciamo a trovare il numero delle coppie attese?
Dobbiamo moltiplicare i totali marginali intercettati dalle varie caselle dello stesso ascendente/segno e dividerli per il gran totale.
Toro/Toro = 140 * 236 / 2935 = 11,25724
Gemelli/Gemelli = 230 * 230 / 2935 = 18,02385
Cancro/Cancro = 309 * 222 / 2935 = 23,37240
Leone/Leone = 356 * 214 / 2935 = 25,95707
Vergine/Vergine = 337 * 256 / 2935 = 29,39421
Bilancia/Bilancia = 318 * 231 / 2935 = 25,02828
Scorpione/Scorpione = 347 * 232 / 2935 = 27,42896
Sagittario/Sagittario = 293 * 235 / 2935 = 23,45997
Capricorno/Capricorno = 223 * 263 / 2935 = 19,98262
Aquario/Aquario = 156 * 279 / 2935 = 14,82930
Pesci/Pesci = 117 * 258 / 2935 = 10,28484
Sommando i risultati ottenuti per ciascuna di queste caselle, otteniamo il numero delle coppie previste sulla diagonale centrale, ossia sulla diagonale formata dalle coppie di figli e di padri con lo stesso ascendente/segno.
11,25724 +
18,02385 +
23,37240 +
25,95707 +
29,39421 +
25,02828 +
27,42896 +
23,45997 +
19,98262 +
14,82930 +
10,28484
-------------
239,38024
Questo è il numero di coppie previste di figli e di padri con lo stesso ascendente/segno.
Quante sono invece le coppie trovate?
Toro/Toro = 10
Gemelli/Gemelli = 22
Cancro/Cancro = 24
Leone/Leone = 25
Vergine/Vergine = 29
Bilancia/Bilancia = 27
Scorpione/Scorpione = 36
Sagittario/Sagittario = 22
Capricorno/Capricorno = 23
Aquario/Aquario = 18
Pesci/Pesci = 14
11 +
10 +
22 +
24 +
25 +
29 +
27 +
36 +
22 +
23 +
18 +
14
-----------
261
Le coppie trovate sono 261 e quelle previste sono 239, su un totale di 2935 coppie.
Quelli poco ferrati con la matematica e le statistiche, possono interrompere qui la lettura di questo post, il cui scopo principale era quello di mostrare come in questo tipo di statistica non fosse affatto necessario generare un gruppo di controllo in modo casuale.
Nel file Lille ci sono 22 coppie in più del previsto, ma questi numeri sono statisticamente significativi?
Io per calcolare la significatività statistica utilizzo la pagina che ho creato, in cui inserisco il numero delle coppie totali, il numero delle coppie attese, e il numero delle coppie trovate.
Ma siccome potreste non fidarvi del mio calcolatore di significatività, allora vi suggerisco di calcolarla con il metodo del chi-quadrato.
Quelli poco ferrati con la matematica e le statistiche, possono interrompere qui la lettura di questo post, il cui scopo principale era quello di mostrare come in questo tipo di statistica non fosse affatto necessario generare un gruppo di controllo in modo casuale.
Nel file Lille ci sono 22 coppie in più del previsto, ma questi numeri sono statisticamente significativi?
Io per calcolare la significatività statistica utilizzo la pagina che ho creato, in cui inserisco il numero delle coppie totali, il numero delle coppie attese, e il numero delle coppie trovate.
Chi-quadrato= (Osservati - Previsti)^2 / Previsti
Chi-quadrato= (261-239)^2 / 239 = 2,025
Il valore del chi-quadrato ottenuto va poi inserito in una tabella che calcola il P value.
In questa tabella bisogna osservare il primo rigo, dove ci sono i valori del chi-quadrato relativi ad 1 grado di libertà. Il valore del chi-quadrato che abbiamo appena calcolato 2,025 si colloca tra il valore 1,642 e il valore 2,706 per cui la probabilità corrispondente è tra 0,20 e 0,10 e questo conferma la correttezza del P value da me calcolato che è 0,1466.
Un P value pari a 0,1466 secondo i criteri convenzionali adottati dagli statistici non è statisticamente significativo, perché il valore minimo per poter definire una deviazione significativa è pari a 0,05.
Ricordo che tanto più il valore del P value è piccolo tanto più la significatività statistica è grande.
In questo caso avendo trovato che il P value ha un valore compreso tra 0,20 e 0,10, significa che la probabilità di trovare una deviazione come quella riscontrata di 22 coppie, o maggiore di essa, è circa del 10% o del 20% ed è troppo elevata per parlare di significatività statistica.
In altre parole, se dovessimo ripetere questa statistica con un nuovo campione, la probabilità di riscontrare una deviazione come questa di 22 coppie o anche maggiore, è circa del 10% o del 20% e tutto questo soltanto sulla base delle leggi del caso, senza la necessità di ipotizzare un influsso astrologico.
Bisogna però specificare che quello che è stato calcolato è il P value (two tailed) ossia con due "code", che significa che la probabilità che è stata calcolata si riferisce alla deviazione tra i valori osservati e quelli previsti.
Se invece avessimo scommesso che avremmo trovato una deviazione di segno più, ossia se avessimo scommesso che avremmo trovato un eccesso di coppie piuttosto che un deficit, allora il valore del P value va dimezzato. Ma anche se consideriamo un P value dimezzato e quindi pari a 0,0733 si tratterebbe comunque di un valore troppo alto per parlare di significatività statistica.
Da notare infine, che il file Lille è quello che mostra l'eccesso maggiore tra i sei file della statistica, ed è quindi quello che sarebbe più favorevole alla tesi di Discepolo, ma nonostante questo sia il risultato migliore tra quelli trovati non raggiunge la significatività statistica.
L'unico file che mostra una significatività statistica è quello denominato Bourges, solo che si tratta di una significatività "negativa", perché in questo caso, le coppie di figli e di padri con l'ascendente e il segno solare uguali, sono meno del previsto, e non più del previsto come affermato da Ciro Discepolo.
L'unico file che mostra una significatività statistica è quello denominato Bourges, solo che si tratta di una significatività "negativa", perché in questo caso, le coppie di figli e di padri con l'ascendente e il segno solare uguali, sono meno del previsto, e non più del previsto come affermato da Ciro Discepolo.
Iscriviti a:
Post (Atom)