Con questo articolo si vogliono introdurre i concetti di base della Statistica descrittiva al fine di cominciare ad acquisire quelle conoscenze in ambito statistico che permetteranno di poter affrontare la lettura degli articoli di approfondimento concernenti l’applicazione pratica dei concetti introdotti in via puramente descrittiva e, soprattutto, la finalità rincorsa da parte dello scrivente è quella di diffondere la corretta logica, ed il corretto linguaggio,sulla quale si basa la metodologia statistica.
Come diceva Galileo Galilei : questo grandissimo libro che continuamente ci sta aperto innanzi a gli occhi (io dico universo), ma non si può intendere se prima non s’impara a intender la lingua, e conoscere i caratteri né quali è scritto. Egli è scritto in lingua matematica, e i caratteri son triangoli, cerchi, ed altre figure geometriche, senza i quali mezzi è impossibile a intenderne umanamente parola; senza questi è un aggirarsi vanamente per un oscuro laberinto .
Questo percorso, assai arduo, deve necessariamente partire con l’introduzione di una definizione della Statistica, la sua collocazione in ambito scientifico e le fasi che compongono una analisi statistica.
DEFINIZIONE E BREVE EVOLUZIONE STORICA
L’etimologia della parola Statistica non tutti sanno che deriva dal vocabolo italiano Stato , e si riferisce alla constatazione per cui le prime informazioni raccolte, in base all’osservazione di fenomeni reali, sia per motivi religiosi, economici, militari, sociali, ecc …, venivano organizzate e successivamente elaborate ed utilizzate proprio da parte di organismi statali.
La prima apparizione del vocabolo Statistica, in questa accezione, viene fatta risalire all’italiano Ghislini che nel 1589 afferma : la Statistica è la descrizione delle qualità che caratterizzano e degli elementi che compongono uno Stato .
Tuttavia l’evoluzione storica della Statistica nasconde due anime che si ritrovano ancora oggi, dopo oltre quattrocento anni, nella didattica, nella ricerca, nel pensare comune dei non addetti ai lavori e, quindi nel linguaggio dei mass-media, provocando confusione in quanto tale disciplina, spesso e volentieri, viene confusa con le statistiche , dati, tabelle, indici, grafici, medie.
Ciò provoca qualche confusione nell’opinione pubblica e genera spesso una certa marcata diffidenza verso le deduzioni derivate dall’analisi dei dati statistici.
Ma vediamo di illustrare brevemente queste due anime prima accennate :
– la prima anima della Statistica è connaturata all’Homo Sapiens, che durante il suo lungo processo evolutivo tende a prendere sempre più coscienza del mondo reale e dei suoi simili e nella eterna lotta per la sopravvivenza elabora ed affina tecniche e comportamenti ottimali al fine di nutrirsi, difendersi, riprodursi. Tali strategie comportano nel tempo, alternate da sconfitte e successi, la diffusione e l’acquisizione di usi, costumi e perfino di scienza e cultura. Dal momento che tali convinzioni si codificano e si stratificano nella vita dei clan, delle tribù, dei popoli ed infine delle nazioni, nascono quelle regole comportamentali e quindi la legge. Infine è proprio con la nascita dei grandi Stati che si attribuisce all’analisi statistica dei fenomeni collettivi un interesse pubblico che porta alla nascita di Istituti Nazionali di Statistica;
– la seconda anima della Statistica tarda a manifestarsi nel corso dei secoli in quanto nasce da una constatazione di fondo completamente diversa e strettamente legata alla fase evolutiva finale dell’Homo Sapiens : di fronte ad un mondo reale che tende sempre a mutare vi è man mano la consapevolezza che vi sono risultati che meritano più fiducia di altri perché si ripetono nel tempo con maggiore regolarità. Ciò viene percepito anzitutto proprio in rapporto al clima e all’alternanza delle stagioni ma riguarda anche il complesso dei rapporti Uomo-ambiente.
La saldatura fra queste due anime della Statistica si è potuta avere solamente quando, di fronte alla natura sempre più sperimentale della conoscenza, ci si è posti il problema della validità delle ipotesi, basata essenzialmente all’interno di una logica probabilistica.
Diceva Galileo Galilei in merito al valore del risultato sperimentale : una sola esperienza o concludente dimostrazione … basta a battere in terra questi e altri … centomila argomenti probabili .
Solo così il metodo statistico diviene nei fatti la metodologia della ricerca scientifica, essendo costantemente presente in analisi di laboratorio e nella ricerca di leggi generali, con il paradosso che la Statistica diventa prassi scientifica ancor prima di essere formalmente riconosciuta come strumento autonomo di indagine.
Oggi giorno la scienza della Statistica moderna viene classificata, a fronte di una metodologia statistica che opera mediante stadi successivi, che in seguito analizzeremo, come di seguito riportato :
– Statistica descrittiva : studia i criteri di rilevazione, classificazione e di sintesi delle informazioni relative ad una popolazione oggetto di studio. La statistica descrittiva raccoglie le informazioni sulla popolazione o su una parte di essa (campione), in distribuzioni semplici o complesse, e sintetizza attraverso famiglie di indici, quali valori medi, indici di variabilità, indici di forma, rapporti statistici e relazioni statistiche, i valori ottenuti. Essa rappresenta pertanto il momento di sintesi del metodo scientifico, cioè quel momento, ampiamente divulgato anche da Galileo Galilei, durante il quale occorre semplificare la realtà al fine di concepire meglio la complessità del fenomeno oggetto di studio;
– Statistica matematica : studia le distribuzioni teoriche, sia per misure discrete sia per misure continue, allo scopo di illustrarne le caratteristiche fondamentali, le relazioni che esistono tra esse, gli usi possibili, in una logica probabilistica. Essa rappresenta il momento induttivo del metodo scientifico, cioè quel momento durante il quale si passa dall’osservazione del fenomeno allo sviluppo di teorie ed ipotesi;
– inferenza Statistica : studia i procedimenti per la deduzione delle caratteristiche di una popolazione dall’osservazione di una parte di essa e rappresenta sia il momento deduttivo , durante il quale dalla teoria o ipotesi costruita in via induttiva se ne deducono gli effetti, sia il momento sperimentale durante il quale la teoria o ipotesi, attraverso test di controllo, diventa verità scientifica, cioè verità vicina alla realtà.
LA COLLOCAZIONE SCIENTIFICA DELLA STATISTICA
Talvolta, memori di una fase storica oramai superata, nella quale l’anima primitiva della statistica veniva esaltata, si cerca di collocare la Statistica nell’ambito dei metodi negando ingiustamente a tale disciplina il ruolo di scienza .
Diventa estremamente complicato e difficoltoso distinguere il momento creativo del metodo statistico dall’applicazione di strumenti consolidati che di volta in volta vengono utilizzati nelle discipline positive (Fisica, Biologia, Economia, ecc…).
Non dimentichiamo, anzi memorizziamo, che il metodo statistico presuppone, in analogia a quanto avviene per la Logica e per la Matematica, un rigore di analisi ed una logica ben formalizzata che conferisce alla Statistica la natura propria delle scienze deduttive .
Pertanto, come per tutte le scienze deduttive, anche la Statistica utilizza, in modo esplicito oppure implicito, alcuni criteri logico- concettuali di riferimento, che definiamo paradigmi e che servono nell’applicare la sua metodologia ai problemi reali :
– sintesi delle informazioni : il paradigma statistico di base è quello della sintesi delle informazioni in quanto, di fronte all’analisi di fenomeni complessi, caratterizzati da una pluralità di informazioni, la ricerca di un indicatore riassuntivo, pur essendo assai evidente il rischio imposto da tale semplificazione, diventa necessità quotidiana e concreta. A tal fine, la gran parte degli strumenti statistici presenti nella letteratura costituiscono proposte di sintesi che rispondono ad alcuni scopi precisi. Inevitabile risulta pertanto la ricerca di un indicatore che assuma, tramite il proprio grado di misura, il significato di rappresentanza ;
– scoperta del nuovo : un secondo criterio statistico è la scoperta del nuovo intendendo con ciò la messa in evidenza dei fatti, congetture, leggi che precedentemente non erano note o che andavano ulteriormente verificate. Tale paradigma si coniuga in modo perfetto con l’atteggiamento sperimentale della ricerca scientifica in quanto la metodologia statistica cerca di pervenire a risposte che hanno il pregio di essere associate ad una valutazione probabilistica di falsità e non di certezza matematica. La logica di base è quella del rifiuto di ipotesi piuttosto che l’accettazione di altre;
– contenimento dell’errore : questo paradigma è fortemente correlata all’aspetto probabilistico della metodologia statistica. L’analisi statistica presuppone l’esistenza di una ipotetica all’interno della quale esiste il vero legame tra i fatti ma che lo studioso non conosce e mai conoscerà e che intende approssimare e accogliere dubitativamente sino a che una nuova proposta si presenti come più pregnante di quella sposata fino a quel momento. La connessione tra le informazioni in entrata e quelle osservate in uscita è alterata da una componente, più o meno accentuata, di natura aleatoria ed erratica e l’obiettivo della ricerca scientifica è quello di ridurre la componente erratica con la consapevolezza che la sua eliminazione è solamente pura utopia o peggio ancora falsificazione;
– dialettica della conoscenza : l’ultimo paradigma, non per importanza, è rappresentato dalla dialettica della conoscenza intesa come accettazione dei risultati, lettura critica degli stessi, proposta di ipotesi alternative e studio di nuovi risultati con lo scopo di proporre, rifiutare o migliorare precedenti acquisizioni. Come diceva Galileo Galilei in merito alla necessità di una dialettica della conoscenza al fine di scoprire una verità scientifica : Le molte esperienze mi hanno insegnato quanto sia facile l’ingannarsi, e però quanto sia necessario l’andar circospetto prima che risolutamente pronunziare ed affermare alcun detto .
Alla luce di quanto esposto è chiaro che un problema reale , affinché possa essere risolto, deve diventare un problema statistico e tale passaggio, di fondamentale importanza, richiede esperienza specifica e cultura statistica e presuppone una interazione tra la scienza oggetto dell’analisi del problema reale e la scienza Statistica : nasce così la Statistica applicata , la vera e propria Statistica riconosciuta quale scienza di cui le classificazioni precedentemente riportate (Statistica descrittiva, Statistica matematica, Statistica inferenziale), ne costituiscono componenti specifiche.
FASI DI UNA ANALISI STATISTICA
Affrontiamo brevemente le fasi di cui è composta una corretta indagine statistica in quanto richiedono una accurata pianificazione alla scopo di consentire alle informazioni raccolte di essere analizzate in modo appropriato secondo metodi statistici corretti.
– definizione degli obiettivi della ricerca : la fase iniziale di una indagine statistica è costituita dalla definizione degli obiettivi che devono risultare molto particolareggiati al fine di individuare con estrema cura le informazioni da ricercare, evitando la raccolta di informazioni non coerenti con l’obiettivo, evitando equivoci nelle definizioni, circoscrivendo con cura ed esattezza il territorio ed il periodo della indagine, fornendo inoltre soluzioni alternative nei casi di mancate o errate risposte;
– rilevazione dei dati : una volta terminata la definizione degli obiettivi occorre procedere con la rilevazione dei dati che può essere completa, qualora si esaminano tutti gli elementi oggetto di studio, o, come spesso accade nella ricerca scientifica, parziale, cioè quando per necessità ci si deve limitare a studiare un campione di dati rappresentativi del fenomeno oggetto di studio;
– elaborazione metodologica : una volta terminata l’acquisizione dei dati occorre procedere con l’applicazione di schemi formali di natura logico-induttiva ed inferenziale-deduttiva, entrambi di derivazione matematica, cioè occorre applicare ai dati gli strumenti di analisi propri dell’scienza statistica. Ricordiamo che allo statista è data facoltà, oltre all’utilizzo delle metodologie più idonee riconosciute, di fronte a problemi nuovi e complessi, sviluppare metodologie completamente innovative;
– presentazione ed interpretazione dei risultati : una presentazione poco efficace può vanificare sia l’utilità dei risultati raggiunti sia le potenzialità del metodo utilizzato. Invece, una accurata ed adeguata illustrazione degli stessi ed una disamina particolareggiata delle implicazioni operative proprie del settore in cui si opera (ad esempio climatologia), sono elementi decisivi per il buon esito di una indagine statistica;
– utilizzazione dei risultati della ricerca : lo statistico contribuisce in questa fase ad una corretta utilizzazione operativa dei risultati di una indagine scientifica, circoscrivendo l’ambito interpretativo e richiamandosi ai vincoli entro cui essa assume validità.
L’insieme di queste fasi di programmazione dell’indagine prende il nome di disegno sperimentale .
Infine preme sottolineare come, pur in presenza di un disegno sperimentale pianificato con cura sotto ogni aspetto, regolarmente ci si trovi di fronte a situazioni non previste e alla necessita di dover modificare numerosi aspetti dell’indagine, una volta già iniziata.
Oltre a rappresentare problemi gestionali talvolta non indifferenti occorre focalizzare il connotato positivo di questo aspetto in quanto è proprio interagendo con la realtà in modo intelligente che si scoprono fatti insospettabili e nuove relazioni tra fenomeni, il che non può che produrre un arricchimento della conoscenza.
Questo articolo ha voluto essere una breve introduzione alla scienza della Statistica che proseguirà nelle prossime pubblicazioni mediante una metodologia chiara e precisa, cioè il cercar di capire una cosa alla volta perché come diceva Galileo Galilei :
quando altri avesse esperimentato una volta sola a intender perfettamente una sola cosa ed avesse gustato veramente come è fatto il sapere, conoscerebbe come dell’infinità dell’altre conclusioni niuna ne intende .
Bibliografia :
Statistica per le decisioni
Piccolo D.
Il Mulino
Statistica applicata alla ricerca biologica ed ambientale
Prof. Soliani L.
Uni Nova Editore
Opere
Galileo Galilei