La Protezione delle Informazioni

Inferenza Statistica e i vari tipi di Campionamento

Non è sempre possibile eseguire una rilevazione sull’intera popolazione statistica, pertanto si effettua l’indagine sul campione piuttosto che sull’intero universo. A tal proposito l’inferenza statistica , ossia un insieme di metodi con cui si cerca di trarre una conclusione sulla popolazione in base ad informazioni ricavate da un campione, ci è di aiuto, in quanto riusciamo, attraverso l’effettuazione di stime sul campione estratto, ad individuare il valore di un parametro ϑ, ovvero un valore costante caratteristico della popolazione .

Le ragioni per cui si preferisce un’indagine campionaria sono diverse e tra le tante sicuramente si tiene conto della maggiore analiticità , del risparmio dei costi di gestione e di tempo.

Ma vediamo come si sviluppa un’ indagine campionaria.
Dopo aver effettuato le estrazione del campione, occorre procedere alla elaborazione attraverso dei stimatori, cioè dei valori riferiti ai parametri dell’universo oggetto di indagine contenuti nel campione (es. media del campione). Si passa poi a considerare , in base ai risultati ottenuti , ad inferire, ( dal latino inferre, tirare una conclusione) cioè a verificare quanto dei risultati ottenuti del campione si può ritenere attendibile e trasferire sull’universo.

Un aspetto fondamentale di una rilevazione campionaria è dunque, innanzitutto, la scelta del campione, che deve essere rappresentativo della popolazione ovvero un campione è rappresentativo dell’universo di cui fa parte se ne riproduce, in piccolo, le caratteristiche, con scarti «non significativi» imputabili al «caso».

Ovviamente esistono diversi metodi per la scelta di un campione, uno dei più diffusi è il campionamento casuale semplice , in cui la scelta è affidata al caso .
Le caratteristiche del campionamento casuale semplice sono:

  • tutte le unità della popolazione possono far parte del campione;
  • ogni campione di ampiezza n ha la stessa probabilità di essere formato.
La scelta di un campione casuale semplice di n elementi può essere fatta secondo due tipi di estrazioni:
Estrazione bernoulliana (o con ripetizione), si calcola come disposizioni con ripetizioni di N elementi di classe n, cioè:
      D’N,n = N n
Il valore medio della media campionaria X per un campionamento bernoulliano è uguale alla media µ e varianza σ 2 le medie dei campioni casuali di n elementi sono distribuite con media µ e varianza σ 2 n; ovvero:
        M(X)=µ      Var(X)=σ 2/n
Estrazione in blocco (o senza ripetizione), che si calcola come numero delle combinazioni semplici di N elementi di classe n, cioè:
      N!/n!(N-n)!
Il valore medio della media campionaria X per un campionamento con estrazione in blocco è uguale alla media µ della popolazione ovvero:
        M(X)=µ      Var(X)=(σ 2/n)* (N-n)/(N-1)

Vi sono, però, altre tecniche di campionamento: alcune danno campioni probabilistici, altre danno campioni non probabilistici.

Campionamento per Stratificazione:
Si è visto che nel campionamento casuale l’errore di campionamento dipende dalla variabilità della popolazione. Per ridurre la variabilità, si suddivide la popolazione in strati, omogenei, e da ciascun strato si estrae un certo numero di elementi in modo casuale. Il metodo del campione stratificato viene spesso usato nelle indagini di tipo sociale e permette di ridurre il numero delle unità da considerare nel campione.
Esempio:
Per analizzare il consumo di carburante delle automobili conviene suddividere in strati l’insieme delle automobili secondo la cilindrata e formare un campione estraendo da ogni strato un numero di automobili proporzionale all’ampiezza dello strato.

Campionamento a più Stadi:
Se la popolazione è molto grande la si suddivide in tanti sottoinsiemi; di questi se ne sceglie un certo numero che costituisce il primo stadio.
I sottoinsiemi scelti, detti unità primarie, possono a loro volta essere suddivisi in ulteriori sottoinsiemi; se ne scelgono alcuni, detti unità secondarie, che costituiscono il secondo stadio. Questo tipo di campionamento permette una notevole riduzione dei costi e dei tempi. Un altro caso particolare di questo campionamento è il campionamento detto a grappolo. Si tratta di un campionamento a stadi ne quale, all’ultimo stadio, invece di estrarre casualmente le unità statistiche per formare il campione, se ne estrae un intero sottoinsieme e si esaminano tutte le unità di questo sotto insieme.
Esempio:
Se si fa un indagine sulle spese per l’alimentazione delle famiglie italiane, si può considerare come primo stadio la scelta di un certo numero di provincie, che costituiscono le unità primarie; il secondo stadio potrà essere costituito da un certo numero di comuni, le unità secondarie, appartenenti alle provincie del primo stadio; il terzo stadio sarà formato da un certo numero di famiglie domiciliate nei comuni del secondo stadio.

Campionamento Sistematico:
Il campionamento sistematico consiste nell’elencare tutte le unità statistiche della popolazione e, partendo da una prima unità scelta a caso, estrarre, successivamente, un unità ogni k unità. Questo tipo di campionamento è molto utilizzato per tenere sotto controllo la produzione.
Esempio:
Da una popolazione di 5000 elementi si vuole costruire un campione di 200 elementi prendendo un elemento ogni 25. Dopo aver scelto a caso un elemento tra i primi 25 si seguirà prendendo elementi ogni 25 partendo da quello dato.

Campionamento non Probabilistico:
Un campionamento di questo tipo non permette di stimare l’errore probabile.
Si suddivide in Campionamento ragionato ovvero ottenuto su suggerimento di esperti; Questo campione potrebbe anche essere rappresentativo, ma non esiste un criterio per misurare il grado di fiducia. Campionamento per quote cioè gli elementi del campione vengono scelti secondo il sesso, l’età, lo stato sociale ecc.. Si è dimostrato che il campionamento cosi formato è un campionamento distorto.
Esempio:
In un sondaggio di opinioni all'interno di una piccola azienda con 200 impiegati si vuole studiare la valutazione attribuita alla qualità della mensa. A questo scopo si decide di esaminare un campione composto da 20 persone. Per motivi di convenienza, si intervistano le prime 20 persone che si presentano in sala mensa. Questo criterio é molto pratico, in quanto non bisogna attendere l'arrivo di tutti i dipendenti; tuttavia, si esamineranno impiegati di livello più basso: i dipendenti più impegnati o comunque meno "affamati" non entreranno a far parte del campione. Questo campione, è dunque viziato da un errore sistematico. D'altra parte, l'errore si sarebbe evitato scegliendo una persona ogni 8 - 10 fra quelle che varcano la porta d'uscita.