giovedì 11 maggio 2017

LE FONTI DEI DATI



Ruscelli riferisce che la fonte dei suoi dati sono delle pagine di Wikipedia, come ad esempio questa:

https://en.wikipedia.org/wiki/Category:Politicians_by_nationality


Ma è veramente possibile trovare i dati che dice di aver utilizzato nelle sue statistiche da delle pagine di Wikipedia?

Io stamattina c'ho provato un po', ma la cosa non è affatto agevole, perché quando si arriva alle pagine personali dei vari politici, si legge la loro data di nascita, ma di solito non si legge la data in cui sono stati eletti.

Ma eletti a quale carica?

Essere eletti al senato della Repubblica equivale ad essere eletti a presidente della Repubblica?

Negli articoli di Ruscelli non ho mai letto i criteri a cui si è attenuto, per decidere chi dovesse entrare nelle sue statistiche e chi no. Per cui presumo che per lui vada bene qualsiasi vittoria elettorale, senza alcuna distinzione.

Ma questo è un criterio valido?

E per quanto riguarda invece le vittorie sportive?

Vincere una medaglia d'oro alle olimpiadi, equivale a vincere una corsa podistica a livello provinciale?

Io ho l'impressione che per Ruscelli tutto fa brodo.

Se una squadra di calcio che gioca in serie A viene retrocessa in serie B, le vittorie che ottiene nel campionato successivo hanno lo stesso valore delle vittorie che avrebbe ottenuto se la squadra fosse rimasta in serie A?

La logica vorrebbe che queste vittorie contino di meno, visto che sono state ottenute contro degli avversari meno forti.

Ruscelli ha fatto delle statistiche sugli sport individuali, ma il principio è lo stesso. Se un atleta scende di categoria, e ottiene delle vittorie contro degli avversari meno bravi, questi successi sportivi contano alla stessa maniera delle vittorie ottenute dallo stesso atleta nella categoria superiore?

Tutto questo non è dato sapere, perché Ruscelli non lo spiega.

Secondo me questo approccio alle statistiche è sbagliato, perché bisogna procurarsi un campione omogeneo, come ho fatto nella mia statistica sui politici. I miei politici, non erano politici presi a casaccio dalle pagine di Wikipedia, ma erano tutti politici che sono stati eletti al Senato della Repubblica Italiana, nel corso delle 17 legislature che si sono succedute da quando è nata la Repubblica Italiana.

Per cui i politici del mio database hanno tutti una caratteristica in comune, che è quella di essere stati eletti almeno una volta senatori della repubblica. Partendo da questa base comune, possiamo poi andare a vedere se sono stati eletti più frequentemente durante alcune fasi del loro ciclo personale di Giove, o qualsiasi altra cosa.

Io credo che qualsiasi statistica dovrebbe partire da un campione omogeneo.

Essere eletto alle elezioni presidenziali francesi, non equivale ad essere eletto come consigliere comunale al comune di Rocca Cannuccia.

La categoria utilizzata da Ruscelli : "Politici che hanno vinto una elezione" è troppo generica.

Dal link fornito da Ruscelli, si può tirar fuori quello che si vuole.

Mi piacerebbe fare un esperimento, ma temo che non ci siano volontari.

C'è qualcuno che vuol provare ad estrarre da quel link, il nome dei politici, la loro data di nascita, e le date in cui sono stati eletti?

Non preoccupatevi del calcolo della fase di Giove, a quello penserei io.

Esempio:

Nome, data di nascita, data vittoria elettorale

AGOSTINO Rocco Vincenzo,30/01/1897,08/04/1930
ALBERGANTI Giuseppe,24/07/1898,15/02/1938
ALBERTI Giuseppe,04/03/1902,15/02/1938
AMADEO Ezio,26/06/1894,15/02/1938
AMIGONI Pietro,13/01/1904,15/07/1928
ANGELILLI Ugo,29/05/1897,19/03/1929

Se qualcuno accettasse di partecipare a questo test, e mi inviasse via email la sua lista di politici, con le date di nascita e quelle delle vittorie elettorali, sono quasi certo che si otterrebbero dei risultati diversi per ogni lista.

Scommettiamo?






1 commento:

Anonimo ha detto...

Ruscelli deve rispondere, deve motivare il suo lavoro. Il confronto tra studiosi è l'unico modo per fare progredire la ricerca.