giovedì 4 maggio 2017

Ruscelli colpisce ancora



Gabriele Ruscelli ha pubblicato su Linguaggio Astrale n.186 la seconda parte della sua statistica sui politici. In questa nuova statistica considera gli stessi politici che aveva considerato la volta precedente, ma invece di confrontare le loro date di nascita solo con le date della vittorie elettorali, questa volta decide di considerarle anche in rapporto con le date d'inizio del loro mandato. 

Ho riportato qui in alto il grafico disegnato da Ruscelli relativo ai politici di sesso maschile che dovrebbe descrivere la distribuzione di elezioni ed inizi mandati nei 10 settori che si riferiscono alla fasi del ciclo di Giove, come spiegato nei post precedenti.

Uno si aspetterebbe che questi nuovi risultati dovrebbero essere il doppio di quelli della statistica precedente, ma non è così, perché la volta precedente le vittorie elettorali dei politici di sesso maschile erano 2340, mentre in questa nuova statistica tra dati relativi alle elezioni e inizi di mandati, i risultati considerati sono 4060.

Se ad ogni vittoria elettorale seguisse un inizio mandato, i dati raccolti dovrebbero essere 2340 * 2 = 4680, cosa è successo ai 620 politici mancanti? Ruscelli non lo spiega nella sua relazione, forse questi dati non ci sono perché non è riuscito a trovare le date degli inizi mandati. 

La linea rossa che si vede nell'immagine sono stata io ad aggiungerla e rappresenta la distribuzione delle vittorie elettorale della vecchia statistica di Ruscelli. Naturalmente siccome la scala del vecchio grafico differisce da quella del nuovo, prima di disegnare la nuova curva in rosso, ho dovuto adattare i vecchi valori al nuovo grafico.

Questa operazione è semplicissima, bisogna moltiplicare i vecchi valori per 1,735.

1,735 è dato da 4060 / 2340

Per cui moltiplicando i vecchi valori per 1,735 sappiamo dove collocarli sul nuovo grafico.

Le due curve che si osservano nel grafico sono piuttosto simili.

Nelle fasi: 1, 2, 3, 5, 7, 8 sono quasi coincidenti. 

Mentre si osservano delle differenze nelle fasi: 0, 4, 6, e forse 9.

Il fatto che queste due curve si somigliano, vuol dire che non ci sono stati cambiamenti sostanziali tra i risultati della vecchia statistica e quella nuova.

Ed infatti, non c'era motivo di credere che aggiungendo le date di inizio mandato la curva sarebbe cambiata in modo notevole.

Questo perché si tratta sempre degli stessi soggetti e vittorie della statistica precedente, anche se a questi dati sono stati aggiunte anche le date degli inizio mandati.

Naturalmente le date di inizio mandato seguono di qualche giorno quelle delle vittorie elettorali, non sono due variabili indipendenti, perché è la data della vittoria elettorale che condiziona quella dell'inizio mandato. Di solito il numero di giorni che passa dalla vittoria elettorale all'inizio mandato è abbastanza breve, con qualche rara eccezione. Negli Stati Uniti credo che le elezioni si tengano a novembre e il nuovo presidente inizi il suo mandato a febbraio. Ma questa è un'eccezione, perché di norma dalle elezioni all'inizio mandato passano solo pochi giorni, per cui se l'elezione è stata fatta durante una certa fase del ciclo di Giove di un politico, è molto probabile che anche la fase dell'inizio mandato corrisponda alla stessa fase.

La somiglianza dei due grafici dimostra che è proprio questo ciò che avviene.

Ma veniamo al punto. L'eccesso relativo alla fase n. 1 che già si era visto nella statistica precedente, è praticamente rimasto invariato anche in questo rifacimento della statistica.

La percentuale dell'eccesso è rimasta la stessa, solo che sono raddoppiati o quasi i numeri coinvolti,

Situazione precedente:

Totale: 2340 Attesi: 234 Trovati: 278

Situazione attuale:

Totale: 4060 Attesi: 406 Trovati: 486

E' naturale che se si calcola la significatività statistica di questi nuovi risultati, questa significatività è enormemente maggiore di quella precedente. Ma questo calcolo non si può fare, perché i risultati sono stati gonfiati artificialmente con l'introduzione dell'inizio mandato.

Invece Ruscelli scrive imperterrito che la significatività calcolata per la fase n. 1 corrisponde ad una probabilità dello 0,0001.

Come fa a non capire che è stato lui stesso a creare artificialmente questo risultato?

Ruscelli perché oltre alla data della vittoria e quella dell'inizio del mandato, non introduci una terza data, del giorno intermedio tra queste due date?

Sono sicuro che troveresti dei risultati ancora migliori.


Gabriele Ruscelli: genio incompreso


2 commenti:

Astromauh ha detto...

Mi è stato riferito che non sono stato molto chiaro nella mia esposizione, e che non si capisce in che consiste la mia contestazione alla statistica di Ruscelli.

Proverò a spiegarmi meglio con un esempio.

Supponiamo di voler testare le capacità di un sensitivo che sostiene di riuscire ad indovinare l'esito del lancio di una monetina più spesso della media.

Lanciamo la monetina per 10 volte e il sensitivo indovina l'esito dei lanci 8 volte su 10.

Si tratta indubbiamente di un buon risultato, ma nonostante ciò non possiamo concludere che il soggetto riesca veramente ad indovinare l'esito dei lanci più spesso del dovuto, perché potrebbe esservi riuscito per caso, perché è stato semplicemente fortunato.

La matematica ci viene in aiuto e ci permette di calcolare esattamente quale era la probabilità di riuscire ad indovinare l'esito del lancio 8 volte su 10.

Questa probabilità si può calcolare sulla mia pagina. basso

Questa probabilità si legge nell'immagine in basso a destra P = 0,0547 ossia P = 5,47%.

Per cui circa 5 volte su 100 si riesce ad indovinare almeno 8 volte su 10 per puro caso.

Questo significa che se ripetessimo l'esperimento per 20 volte, dovrebbe capitare circa una volta che i soggetti dell'esperimento indovinano 8 risultati su 10.

Per cui, nell'unico esperimento che abbiamo fatto realmente, potremmo essere incappati nel caso che si ripete 1 volta su 20 in cui capita di indovinare almeno 8 risultati su 10.

Sulla base di questa probabilità diciamo che la performance del sensitivo pur essendo stata buona, è insufficiente per poter dire che sia effettivamente un sensitivo in grado di indovinare l'esito del lancio di una monetina.

Decidiamo quindi di ripetere l'esperimento, solo che in questo caso chiediamo al sensitivo di cercare di indovinare l'esito di 20 lanci.

Il sensitivo indovina l'esito dei lanci 16 volte.

Per cui la percentuale dei lanci indovinati è sempre la stessa, perché 8/10 = 16/20

Ma in questo esperimento basato su 20 lanci qual'era la probabilità di riuscire ad indovinare almeno 16 lanci su 20?

Ricorriamo nuovamente al nostro calcolatore di probabilità.

Questa volta, sempre in basso a destra, leggiamo P = 0,00591 ossia P = 0,591%

Questo significa che se ripetessimo questo esperimento per 200 volte, ci aspetteremmo che circa 1 volta il sensitivo indovini almeno 16 esiti su 20.

Sulla base di questa probabilità possiamo incominciare a pensare che forse il sensitivo sia veramente tale, perché riteniamo improbabile che siamo incappati proprio in quell'unico caso su 200 in cui si riesce ad indovinare 16 esiti su 20.

In entrambi gli esperimenti il sensitivo ha indovinato la stessa percentuale di lanci,
solo che il secondo test prova le sue capacità in misura molto maggiore di quanto non faccia il primo test.

continua...


Astromauh ha detto...

In che consiste l'errore o il trucco di Ruscelli?

Il suo trucco consiste nel voler far passare un esperimento con 10 lanci di monetine come se si fosse trattato di un esperimento basato su 20 lanci, e così facendo altera la significatività statistica del suo esperimento.

E' come se Ruscelli prendesse 20 monetine e le incollasse a due a due, facendo in modo che la coppia di monetine mostri 2 teste se viste da un lato e 2 croci se viste dall'altro.

Per cui ogni volta che si lancia una coppia di monetine incollate, o escono due teste, o escono due croci.

Ruscelli effettua il suo esperimento con questa coppia di monetine incollate, e il sensitivo indovina l'80% dei lanci. Ruscelli calcola la significatività statistica, ma invece di farlo come se si fosse trattato di un esperimento basato su 10 lanci, fa i calcoli come se l'esperimento fosse basato su 20 lanci.

Non può farlo, questo a casa mia si chiama barare.

Io non saprei dire se lo faccia consapevolmente oppure no, resta il fatto che lui bara, non riesce ad essere imparziale nei suoi giudizi, si lascia influenzare da quelle che sono le sue aspettative, manipolando i dati, forse senza accorgersene.

I due eventi presi in considerazione nella sua statistica, la data delle elezioni, e la data dell'insediamento, sono due eventi connessi tra di loro, come lo sono le due monetine incollate del mio esempio.

1) La data dell'insediamento segue sempre quella dell'elezione.

2) Nella maggioranza tra il giorno dell'elezione e quello dell'insediamento passano pochi giorni. Meno dei 40 giorni che è la durata di una fase di Giove.

Ruscelli invece li considera come se fossero due eventi indipendenti, falsando in questo modo il valore della significatività statistica.P =

La statistica è sempre la stessa. Ruscelli in questa versione della statistica, ha utilizzati gli stessi dati della prima, aggiungendovi però anche quelli dell'insediamento.

Ma la significatività statistica è la stessa che aveva calcolato in precedenza.

Lui infatti aveva già calcolato il P-value per l'eccesso che si vede nella fase n.1 che se non sbaglio era P = 0,002 mentre adesso sostiene che lo stesso eccesso corrisponderebbe un P.value P = 0,0001.

Ma la statistica non è cambiata, sta usando gli stessi dati che aveva usato prima, solo che adesso li ha indebitamente raddoppiati.

Non si può fare. E' illegale.

E' un'idiozia.