ETFFIN Finance >> Finanza personale corso >  >> Financial management >> finanza

Campionamento casuale stratificato

Che cos'è il campionamento casuale stratificato?

Il campionamento casuale stratificato è un metodo di campionamento che prevede la divisione di una popolazione in sottogruppi più piccoli noti come strati. Nel campionamento casuale stratificato, o stratificazione, gli strati sono formati sulla base di attributi o caratteristiche condivisi dai membri come il reddito o il livello di istruzione.

Il campionamento casuale stratificato è anche chiamato campionamento casuale proporzionale o campionamento casuale per quote.

Punti chiave

  • Il campionamento casuale stratificato consente ai ricercatori di ottenere una popolazione campione che rappresenta al meglio l'intera popolazione oggetto di studio.
  • Il campionamento casuale stratificato comporta la divisione dell'intera popolazione in gruppi omogenei chiamati strati.
  • Il campionamento casuale stratificato differisce dal campionamento casuale semplice, che comporta la selezione casuale di dati da un'intera popolazione, quindi ogni possibile campione ha la stessa probabilità di verificarsi.
1:40

Campionamento casuale stratificato

Come funziona il campionamento casuale stratificato

Quando si completano analisi o ricerche su un gruppo di entità con caratteristiche simili, un ricercatore può scoprire che la dimensione della popolazione è troppo grande per completare la ricerca. Per risparmiare tempo e denaro, un analista può assumere un approccio più fattibile selezionando un piccolo gruppo dalla popolazione. Il piccolo gruppo è indicato come dimensione del campione, che è un sottoinsieme della popolazione utilizzato per rappresentare l'intera popolazione. Un campione può essere selezionato da una popolazione in vari modi, uno dei quali è il metodo di campionamento casuale stratificato.

Un campionamento casuale stratificato comporta la divisione dell'intera popolazione in gruppi omogenei chiamati strati (plurale per strato). Campioni casuali vengono quindi selezionati da ogni strato. Per esempio, considera un ricercatore accademico che vorrebbe conoscere il numero di studenti MBA nel 2007 che hanno ricevuto un'offerta di lavoro entro tre mesi dalla laurea.

Il ricercatore scoprirà presto che c'erano quasi 200, 000 laureati MBA per l'anno. Potrebbero decidere di prendere solo un semplice campione casuale di 50, 000 laureati ed eseguire un sondaggio. Meglio ancora, potrebbero dividere la popolazione in strati e prelevare un campione casuale dagli strati. Per fare questo, creerebbero gruppi di popolazione basati sul genere, fascia di età, corsa, Nazionalità, e background di carriera. Viene prelevato un campione casuale da ogni strato in un numero proporzionale alla dimensione dello strato rispetto alla popolazione. Questi sottoinsiemi degli strati vengono quindi raggruppati per formare un campione casuale.

Il campionamento stratificato viene utilizzato per evidenziare le differenze tra i gruppi di una popolazione, rispetto al semplice campionamento casuale, che tratta tutti i membri di una popolazione come uguali, con uguale probabilità di essere campionato

Esempio di campionamento casuale stratificato

Supponiamo che un team di ricerca voglia determinare il GPA degli studenti universitari negli Stati Uniti. Il team di ricerca ha difficoltà a raccogliere dati da tutti i 21 milioni di studenti universitari; decide di prelevare un campione casuale della popolazione utilizzando 4, 000 studenti.

Supponiamo ora che il team esamini i diversi attributi dei partecipanti campione e si chieda se ci sono differenze nei GPA e nelle major degli studenti. Supponiamo che trovi che 560 studenti siano laureati in inglese, 1, 135 sono laureati in scienze, 800 sono laureati in informatica, 1, 090 sono laureati in ingegneria, e 415 sono laureati in matematica. Il team vuole utilizzare un campione casuale stratificato proporzionale in cui lo strato del campione è proporzionale al campione casuale nella popolazione.

Supponiamo che il team esegua ricerche sui dati demografici degli studenti universitari negli Stati Uniti e trovi la percentuale di studenti in:12% di specializzazione in inglese, 28% laureato in scienze, 24% maggiore in informatica, 21% laureato in ingegneria, e il 15% di specializzazione in matematica. Così, cinque strati vengono creati dal processo di campionamento casuale stratificato.

Il team deve quindi confermare che lo strato della popolazione è proporzionale allo strato del campione; però, scoprono che le proporzioni non sono uguali. Il team deve quindi ripetere il campionamento 4, 000 studenti della popolazione e seleziona casualmente 480 inglesi, 1, 120 scienza, 960 informatica, 840 ingegneria, e 600 studenti di matematica.

Con quelli, ha un campione casuale stratificato proporzionato di studenti universitari, che fornisce una migliore rappresentazione delle major universitarie degli studenti negli Stati Uniti. I ricercatori possono quindi evidenziare uno strato specifico, osservare i vari studi degli studenti universitari statunitensi e osservare le varie medie dei voti.

Campioni casuali semplici contro campioni casuali stratificati

Campioni casuali semplici e campioni casuali stratificati sono entrambi strumenti di misurazione statistica. Un semplice campione casuale viene utilizzato per rappresentare l'intera popolazione di dati. Un campione casuale stratificato divide la popolazione in gruppi più piccoli, o strati, sulla base di caratteristiche condivise.

Il campione casuale semplice viene spesso utilizzato quando sono disponibili pochissime informazioni sulla popolazione dei dati, quando la popolazione dei dati ha troppe differenze da dividere in vari sottoinsiemi, o quando c'è solo una caratteristica distinta tra la popolazione dei dati.

Ad esempio, un'azienda di caramelle potrebbe voler studiare le abitudini di acquisto dei suoi clienti per determinare il futuro della sua linea di prodotti. Se sono 10, 000 clienti, può utilizzare scegliere 100 di quei clienti come campione casuale. Può quindi applicare ciò che trova da quei 100 clienti al resto della sua base. A differenza della stratificazione, campionirà 100 membri in modo puramente casuale senza alcun riguardo per le loro caratteristiche individuali.

Stratificazione proporzionale e sproporzionata

Il campionamento casuale stratificato garantisce che ciascun sottogruppo di una data popolazione sia adeguatamente rappresentato all'interno dell'intera popolazione campione di uno studio di ricerca. La stratificazione può essere proporzionata o sproporzionata. In un metodo stratificato proporzionato, la dimensione del campione di ogni strato è proporzionale alla dimensione della popolazione dello strato.

Per esempio, se il ricercatore volesse un campione di 50, 000 laureati per fascia di età, il campione casuale stratificato proporzionale sarà ottenuto utilizzando questa formula:(dimensione del campione/dimensione della popolazione) x dimensione dello strato. La tabella seguente presuppone una dimensione della popolazione di 180, 000 laureati MBA all'anno.


Fascia di età



24-28



29-33



34-37



Totale



Numero di persone nello strato



90, 000



60, 000



30, 000



180, 000



Dimensione del campione degli strati



25, 000



16, 667



8, 333



50, 000


La dimensione del campione per strati per i laureati MBA nella fascia di età da 24 a 28 anni è calcolata come (50, 000/180, 000) x 90, 000 =25, 000. Stesso metodo per le altre fasce di età. Ora che la dimensione del campione degli strati è nota, il ricercatore può eseguire un semplice campionamento casuale in ogni strato per selezionare i partecipanti al sondaggio. In altre parole, 25, 000 laureati della fascia di età 24-28 anni saranno selezionati casualmente dall'intera popolazione, 16, Dalla popolazione saranno selezionati in modo casuale 667 laureati della fascia di età 29-33 anni, e così via.

In un campione stratificato sproporzionato, la dimensione di ogni strato non è proporzionale alla sua dimensione nella popolazione. Il ricercatore può decidere di campionare 1/2 dei laureati nella fascia di età 34-37 anni e 1/3 dei laureati nella fascia di età 29-33 anni.

È importante notare che una persona non può adattarsi a più strati. Ogni entità deve rientrare in un solo strato. Avere sottogruppi sovrapposti significa che alcuni individui avranno maggiori possibilità di essere selezionati per il sondaggio, che nega completamente il concetto di campionamento stratificato come tipo di campionamento probabilistico.

I gestori di portafoglio possono utilizzare il campionamento casuale stratificato per creare portafogli replicando un indice come un indice obbligazionario.

Vantaggi del campionamento casuale stratificato

Il vantaggio principale del campionamento casuale stratificato è che cattura le caratteristiche chiave della popolazione nel campione. Simile a una media ponderata, questo metodo di campionamento produce caratteristiche nel campione che sono proporzionali alla popolazione complessiva. Il campionamento casuale stratificato funziona bene per popolazioni con una varietà di attributi, ma è altrimenti inefficace se non è possibile formare sottogruppi.

La stratificazione fornisce un errore di stima minore e una precisione maggiore rispetto al semplice metodo di campionamento casuale. Maggiori sono le differenze tra gli strati, maggiore è il guadagno in precisione.

Svantaggi del campionamento casuale stratificato

Sfortunatamente, questo metodo di ricerca non può essere utilizzato in ogni studio. Lo svantaggio del metodo è che devono essere soddisfatte diverse condizioni affinché possa essere utilizzato correttamente. I ricercatori devono identificare ogni membro di una popolazione studiata e classificare ciascuno di essi in uno, e solo uno, sottopopolazione. Di conseguenza, il campionamento casuale stratificato è svantaggioso quando i ricercatori non possono classificare con sicurezza ogni membro della popolazione in un sottogruppo. Anche, trovare un elenco esaustivo e definitivo di un'intera popolazione può essere impegnativo.

La sovrapposizione può essere un problema se ci sono argomenti che rientrano in più sottogruppi. Quando si esegue un campionamento casuale semplice, coloro che sono in più sottogruppi hanno maggiori probabilità di essere scelti. Il risultato potrebbe essere una rappresentazione errata o un riflesso impreciso della popolazione.

Gli esempi sopra lo rendono facile:laurea, laureato, maschio, e la femmina sono gruppi chiaramente definiti. In altre situazioni, però, potrebbe essere molto più difficile. Immagina di incorporare caratteristiche come razza, etnia, o religione. Il processo di smistamento diventa più difficile, rendendo il campionamento casuale stratificato un metodo inefficace e tutt'altro che ideale.