Doua probleme de esantionare: factori calitativi ce influenteaza alegerea marimii esantionului. Esantion probabilistic versus esantion neprobabilistic
In dezvoltarea designului unui studiu de piata, exista doua etape foarte sensibile. Prima este stabilirea marimii esantionului si a doua etapa este stabilirea metodei de esantionare: esantion probabilistic versus neprobabilistic. Materialul de fata trateaza aceste doua etape din perpectiva companiei de market research. In a doua etapa, doua cazuri particulare vor fi comparate: esantionarea aleatoare (simpla si startificata) si esantionare pe cote.
1. CAT DE MARE TREBUIE SA FIE ESANTIONUL INTR-UN STUDIU CANTITATIV ?
Un pas important in designul unui studiu de piata este stabilirea marimii esantionului. Marimea esantionului trebuie stabilita in functie de mai multi factori. Pe langa factorii cantitativi, cum ar fi intervalul de incredere si eroarea limita acceptata, exista si factori calitativi care trebuie luati in considerare in stabilirea marimiii esantionului. Acesti factori vor fi detaliati in continuare.
Un criteriu pentru stabilirea marimii esantionului este importanta deciziei ce urmeaza a fi luata pe baza concluziilor studiului; cu cat mai importanta este decizia ce se ia in urma studiului, cu atat precizia trebuie sa fie mai mare, deci esantionul trebuie sa fie mai mare.
Totusi, trebuie avut in vedere ca precizia nu este direct proportionala cu marimea esantionului. Gradul de precizie poate fi masurat in termeni de deviatie standard de la medie. Deviatia standard este invers proportionala cu radacina patrata din marimea esantionului. Prin urmare, incepand cu un anumit prag, o crestere a numarului de indivizi in esantion nu aduce un spor notabil de reprezentativitate.
Astfel, de la un anumit nivel, cu cat esantionul creste, fiecare unitate suplimentara de informatie este obtinuta la un cost mai mare.
Natura studiului joaca si ea un rol important in stabilirea marimii esantionului. Pentru studii exploratorii, esantionul este, de obicei, mai mic. Pentru studii descriptive care pun accent si pe cuantificarea rezultatelor, esantionul este recomandat sa fie mai mare.
Daca studiul urmareste culegerea unui volum mare de informatii (chestionarul are mai multe intrebari), sunt necesare esantioane mai mari. Efectul cumulat al erorilor de esantionare asupra variabilelor este micsorat in esantioanele mai mari.
De asemenea, daca in urma studiului se doreste realizarea unor analize mai complexe (analiza factoriala, regresie, analiza cluster...), un esantion mai mare este recomandat. Astfel, daca se doreste analiza in detaliu a informatiei, cum ar fi analiza subesantioanelor, este necesar un esantion mai mare.
De exemplu, pentru un studiu amplu cum este cel de Usage and Attitudes, in care volumul de informatii culese (reflectat in marimea esantionului) este mare, analizele ce se realizeza sunt complexe. In acelasi timp, importanta deciziilor ce se iau in urma studiului este strategica, si un esantion recomandat este de 1,000-1,200 respondenti. In cazul in care se doreste si o analiza de segmentare, se poate merge pana la un esantion de 1,200-1,600, pentru a putea analiza informatia si in interiorul segmentelor de piata identificate.
Marimea esantionului depinde si de gradul de omogenitate a populatiei ce urmeaza a fi investigata. Daca se urmareste un studiu reprezentativ national privind comportamentul de utilizare a serviciilor financiar bancare, acesta va trebui sa cuprinda persoane din toate categoriile sociale, toate categoriile de venit, care utilizeaza cel putin un serviciu financiar-bancar. Este de asteptat ca aceste persoane sa aiba un comportament foarte eterogen in utilizarea serviciilor bancare. In comparatie cu primul exemplu, daca ne intereseaza ca acest studiu sa il realizam in randul persoanelor din marile orase, cu studii superioare, cu venituri peste medie, care au luat imprumut bancar, ne asteptam la o mai mare omogenitate in cadrul grupului. Prin urmare, daca in primul caz ar trebui sa utilizam un esantion in jurul valorii de 1,200 respondenti, in al doilea caz am putea utiliza un esantion de 400-600 respondenti.
2. ESANTION PROBABILISTIC SAU NEPROBABILISTIC ?
In designul unui studiu, o etapa ce trebuie atent abordata este alegerea metodei de esantionare: utilizarea unui esantion probabilistic sau neprobabilistic.
Esantionare probabilistica este considerata cea mai precisa metoda, dand fiecarui individ aceeasi sansa de a fi inclus in esantion. Procedeul de esantionare este independent de aprecierea subiectiva a intervievatorului.
Cea mai utilizata metoda aleatoare, este cea stratificata (straturi in functie de regiunea geografica, marimea localitatii, etc.). Esantionarea stratificata aleatoare presupune o cunoastere a priori a distributiei subpopulatiilor in populatia totala (de exemplu, daca se doreste o stratificare pe marimea localitatii, trebuie sa se stie procentul de populatie care locuieste in diferitele tipuri de localitati: mici, medii, mari). Se foloseste doar atunci cand caracteristica de interes este corelata cu cea dupa care se face stratificarea (de exemplu, daca se anticipeaza ca utilizarea cardului bancar este diferit pe grupe de varsta, pentru a avea un esantion reprezentativ trebuie sa aplicam cote in functie de distributia populatiei pe grupe de varsta). Dintre doua esantioane cu volum egal, cel obtinut prin stratificare e probabil sa ofere o estimare mai precisa.
Aceasta metoda se foloseste cel mai mult in cadrul studiilor de tip Omnibus sau Usage and Attitudes.
Esantionarea neprobabilistica se bazeaza insa pe judecata intervievatorului, care poate hotara ce persoane pot face parte sau nu din esantion. Cea mai utilizata metoda de esantionare neprobabilistica este esantionarea pe cote. Astfel, structura esantionului este hotarata a priori (ex. proportie barbati/femei, procente pe grupe de varste, procente de posesori de masini pe marci, etc.), iar in alegerea respondentilor intervievatorul are o mai mare influenta (poate cauta persoanele respective in zone unde considera ca este mai probabil sa le gaseasca, nu trebuie sa revina la un domiciliu daca nu a gasit pe nimeni acasa).
De obicei, aceste cote se stabilesc in functie de procentele din populatie, in unele cazuri insa anumite subsegmente este necesar sa fie suprareprezentate pentru a putea realiza analize specifice. De exemplu, intr-un studiu despre posesorii de masini cumparate in ultimii 5 ani, daca procentul de posesori de Dacia este de 50%, acelasi procent se respecta si in esantionul final. Daca insa se vrea o analiza mai amanuntita a posesorilor unei marci de import (pe care o detin numai 5% din populatia cercetata), acest segment se suprareprezinta in esantion, pentru a avea suficiente date pentru analize. In final, pentru respectarea realitatii in analiza globala, rezultatele sunt corectate prin ponderare (subponderand la loc esantionul de posesori de aceasta marca).
Esantionarea pe cote : avantaje si dezavantaje
Dezavantaje
Deoarece esantionarea pe cote nu este o metoda probabilistica, nu se poate calcula eroarea standard. Desi structura esantionului poate fi construita astfel incat sa reproduca populatia, nu este nici o garantie ca esantionul este reprezentativ. Daca este omisa o caracteristica ce ar fi relevanta intr-o anumita situatie, esantionul nu va fi reprezentativ. Unii autori insa afirma ca eroarea standard este atat de neinsemnata in comparatie cu celelalte erori ce apar in sondaje, incat imposibilitatea de a le estima nu reprezinta o pierdere.
In lucrarea lor, ’Testing Nine Hypotheses about Quota Sampling’, C. Marsh si E. Scarbrough prezinta un experiment pe care l-au facut pentru a explora diferentele intre esantionele realizate prin metoda aleatoare si metoda pe cote. Astfel, jumatate din esantion a fost realizat prin metoda aleatoare si jumatate prin metoda pe cote. Studiul a fost realizat de NOP Research in Marea Britanie.
Principalul obiectiv a fost intelegerea modului in care libertatea lasata operatorilor de interviu influenteaza structura finala a esantionului. Ipotezele de la care au pornit au fost cele dezvoltate de Stuart si Moser ( in lucrarea ‘An experimental study of quota sampling’ – Journal of the Royal Statistical Society - 1953), cat si cele elaborate de alti autori (Politz & Simmons, Durbin & Stuart, Sudman Stephen & McCarthy, etc.).
Concluzia principala a fost ca intr-adevar, aceasta libertate este o sursa importanta de polarizare a respondentilor.
Cum actioneaza aceste influente:
Exista o polarizare catre persoanele care sunt mai usor de gasit acasa, esantionul pe cote tinde sa includa mai multe persoane care stau mai mult acasa. Mai mult decat atat, in esantionul pe cote sunt inclusi in mai mare masura acei ‘home socializers’, persoane care au mai degraba prieteni din cercul familiei sau al vecinilor, decat cei care inclina sa aiba prieteni in randul colegilor de munca.
Persoanele single au o probabilitate mai mica de a fi incluse in esantionul pe cote, dar, spre deosebire de teoria traditionala, in acest experiment s-a constatat ca numai barbatii single au sanse mai mici de a intra in esantion.
Desi se pornise de la ipoteza ca esantionul pe cote ofera gospodariilor cu copii mai multe sanse de a intra in esantion, aceasta a fost demonstrata numai in cazul femeilor cu copii, indiferent daca acestea lucrau sau nu.
S-a confirmat si rezultatul experimentului realizat cu mult timp in urma de Moser & Stuart : barbatilor li se dau sanse mai mici de a intra in esantionul pe cote decat femeilor. De aceea se recomanda in toate esantioanele pe cote sa se impuna cote si in functie de sex.
Un alt rezultat al experimentelor anterioare a fost confirmat : persoanele cu niveluri de venit extreme (foarte mici si foarte mari) sunt subreprezentate.
O ipoteza ce nu a fost confirmata de acest studiu a fost aceea ca in esantionarea pe cote populatia din clasele de jos, cu nivel de educatie redus, este subreprezentata.
Pentru a evita toate aceste influente negative ale esantionarii pe cote, autorii recomanda in finalul lucrarii ca in acest tip de esantionare sa se incerce limitarea libertatii acordate operatorilor de interviu. Aceasta inseamna ca operatorii trebuie sa fie mai bine informati despre efectele polarizarii rezultatelor, si in acest sens trebuie sa evite realizarea unui numar prea mare de chestionare in gospodarii foarte apropiate. De asemenea, este recomandat ca operatorilor sa li se dea anumite puncte de pornire in cadrul localitatii, si acestea sa nu mai fie lasate la alegerea lor. In al treilea rand, operatorii ar trebui instruiti sa faca tot posibilul sa creasca rata de succes, si sa tina evidenta acesteia in fiecare studiu.Acest studiu fiind realizat in Marea Britanie, nu exista nici o dovada ca in Romania influenta ar fi in acelasi sens. Totusi, in elaborarea esantionului pe cote este bine sa fie avute in vedere aceste potentiale surse de influentare a structurii esantionului si sa se incerce contracararea potentialelor efecte.
Avantaje:
Esantionarea pe cote este mult mai economicoasa (punctele de pornire fiind stabilite in functie de judecata cercetatorului, zonele mai putin accesibile sunt in general evitate, prin urmare exista costuri mai mici de deplasare si corespunzator un timp mai scurt).
Este mai usor de realizat (nu exista obligativitatea de a reveni la un intervievat in cazul in care nu a fost gasit acasa, in plus, nu este un pas mecanic care trebuie respectat).
In studiile de tip hall test in care respondentii sunt chemati intr-o locatie pentru a li se arata un produs/ambalaj/reclama, esantionarea aleatoare este de multe ori imposibila, de aceea se prefera esantionarea pe cote.
Eroarea de estimare in esantionarea pe cote
Exista mai multe pareri cu privire la estimarea erorii in esantionarea pe cote. Moser si Stuart, in experimentul realizat de ei (prezentat in lucrarea mai sus mentionata) au estimat si erorile standard ale unui esantion pe cote si ale unui esantion aleator. Rezultatul a fost ca, in cazul esantionarii pe cote, in medie, pentru a asigura aceeasi eroare standard, trebuie ca esantionul sa fie de (1,4)2, adica de aproape 2 ori mai mare decat esantionul folosit in esantionarea aleatoare. Pe de alta parte, Corlett & Rotham (BMRB) sustin ca esantionul pe cote are aproape acelasi nivel de acuratete ca si esantionul aleator.
Naresh Malhotra, in “ Marketing Research – An Applied Orientation”, desi admite ca in esantionarea pe cote eroarea nu poate fi estimata, observa ca in ultimul timp procedurile de esantionare sunt mult mai bine controlate pentru a reduce biasul de recrutare. Prin urmare, in anumite conditii, considera ca esantionarea pe cote duce la rezultate apropiate de cele obtinute prin metoda aleatoare conventionala.
Cand alegem esantionarea neprobabilistica si cea probabilistica ?
Atunci cand este nevoie de estimari cat mai precise (cum ar fi cota de piata, rata de penetrare in consum, etc.), cat si extrapolari la intreaga populatie, se foloseste esantionarea probabilistica.
Esantionul neprobabilistic este folosit in testarile de concept, de produs, testari de nume, in care extrapolarea la intreaga populatie nu este necesara, sau atunci cand populatia tinta este foarte mica.
Cu toate acestea, N. Malhotra sustine ca esantionarea aleatoare nu genereaza intotdeauna rezultate mai precise. El recomanda ca in situatiile in care erorile care nu sunt datorate esantionarii (eg. erori de non raspuns) sunt un factor important si se anticipeaza ca vor influenta semnificativ rezultatele, este de preferat esantionarea nealeatoare. In aceste situatii judecata cercetatorului poate sa genereze un control mai mare asupra procesului de esantionare.
Lucrarea de fata si-a propus sa improspateze o parte din informatiile de care are nevoie un cercetator de marketing in momentul in care este in fata conceperii unui nou proiect.
Pe langa formula matematica de calcul a esantionului, exista si alti factori ce pot ajuta la luarea unei decizii. Avantajele si dezavantajele esantionului probabilistic si neprobabilistic este necesar sa fie cantarite in alegerea unei metode sau a alteia.
Bibliografie :
Harvey Brightman, Harvard Schneider, Statistics for Business Problem Solving, South-Western Publishing, 1992
Traian Rotariu si Petre Iliut, Ancheta Sociologica si sondajul de opinie, Polirom, 1999
Moser, CA si Stuart A (1953), An experimental study of quota sampling, Journal of the Royal Statistical Society (Series A)
Catherine Marsh, University of Manchester, Elinor Scarbrough University of Essex, Testing Nine Hypoteses about Quota Sampling
Tom Corlett, Sampling Error in Practice, The British Research Bureau
Naresh K. Malhotra & David F. Birks, Marketing Research, An Aplied Approach, Prentice Hall
Adina Nic, Research Manager Mercury Research