Sampol ng kinatawan. Sampling, mga uri at katangian nito

Ang sample ay isang set ng data na kinuha gamit ang ilang partikular na pamamaraan mula sa isang populasyon para sa eksplorasyong pagsusuri. Ang pagiging kinatawan ay ang pag-aari ng pagpaparami ng ideya ng kabuuan sa pamamagitan ng bahagi nito. Sa madaling salita, ito ang posibilidad ng pagpapalawak ng ideya ng isang bahagi sa kabuuan, na kinabibilangan ng bahaging ito.

Ang pagiging kinatawan ng isang sample ay isang tagapagpahiwatig na ang sample ay dapat na ganap at mapagkakatiwalaang sumasalamin sa mga katangian ng populasyon kung saan ito ay bahagi. Maaari din itong tukuyin bilang pag-aari ng isang sample upang lubos na kumatawan sa mga katangian ng populasyon na makabuluhan mula sa punto ng view ng layunin ng pag-aaral.

Ipagpalagay natin na ang pangkalahatang populasyon ay lahat ng mga mag-aaral sa paaralan (900 tao mula sa 30 klase, 30 tao sa bawat klase). Ang layunin ng pag-aaral ay ang saloobin ng mga mag-aaral sa paninigarilyo. Ang isang sample na populasyon na binubuo ng 90 mga mag-aaral ay kakatawan lamang sa buong populasyon na mas masahol pa kaysa sa isang sample ng parehong 90 mga mag-aaral, na kinabibilangan ng 3 mga mag-aaral mula sa bawat klase. Ang pangunahing dahilan ay ang hindi pantay na pamamahagi ng edad. Kaya, sa unang kaso, ang pagiging kinatawan ng sample ay magiging mababa. Sa pangalawang kaso - mataas.

Sa sosyolohiya ay sinasabi nila na mayroong pagiging kinatawan ng isang sample at ang pagiging hindi kinatawan nito.

Ang isang halimbawa ng isang hindi kinatawan na sample ay isang klasikong kaso na naganap noong 1936 sa Estados Unidos sa panahon ng halalan sa pagkapangulo.

Ang Literary Digest, na naging napakatagumpay sa paghula ng mga resulta ng mga nakaraang halalan, ay mali sa mga hula nito sa pagkakataong ito, bagama't nagpadala ito ng ilang milyong nakasulat na tanong sa mga subscriber at sa mga respondent na pinili nila mula sa mga phone book at listahan ng pagpaparehistro ng sasakyan. Sa 1/4 ng mga balota na naibalik na natapos, ang mga boto ay ipinamahagi tulad ng sumusunod: 57% ay nagbigay ng kagustuhan sa kandidatong Republikano na pinangalanang Alf Landon, at 41% ay ginusto ang kasalukuyang Presidente, ang Democrat na si Franklin Roosevelt.

Sa katunayan, nanalo si F. Roosevelt sa halalan, na nakakuha ng halos 60% ng boto. Ang pagkakamali ng Literary Digest ay ang mga sumusunod. Nais nilang dagdagan ang pagiging kinatawan ng sample . At dahil alam nila na karamihan sa kanilang mga subscriber ay kinilala bilang mga Republican, nagpasya silang palawakin ang sample para isama ang mga respondent na pinili nila mula sa mga phone book at listahan ng pagpaparehistro ng sasakyan. Ngunit hindi nila isinaalang-alang ang mga umiiral na katotohanan at aktwal na pumili ng higit pang mga tagasuporta ng Republikano, dahil sa panahong ang gitna at mataas na uri ay kayang magkaroon ng mga kotse at telepono. At ang mga ito ay halos mga Republikano, hindi mga Demokratiko.

Mayroong iba't ibang uri ng sampling: simpleng random, serial, tipikal, mekanikal at pinagsama.

Ang simpleng random sampling ay binubuo ng pagpili mula sa buong populasyon ng mga yunit na pinag-aaralan nang random nang walang anumang sistema.

Ginagamit ang mekanikal na sampling kapag may kaayusan sa pangkalahatang populasyon, halimbawa, mayroong isang tiyak na pagkakasunud-sunod ng mga yunit ng mga manggagawa, mga listahan ng elektoral, mga numero ng telepono ng mga sumasagot, mga bilang ng mga apartment at bahay, atbp.).

Ginagamit ang karaniwang pagpili kapag ang buong populasyon ay maaaring hatiin sa mga pangkat ayon sa uri. Kapag nagtatrabaho sa populasyon, ang mga ito ay maaaring, halimbawa, pang-edukasyon, edad, mga pangkat ng lipunan; kapag nag-aaral ng mga negosyo - isang industriya o isang hiwalay na organisasyon, atbp.

Maginhawa ang pagpili ng serial kapag pinagsama ang mga unit sa maliliit na serye o mga grupo. Ang ganitong serye ay maaaring mga batch ng mga natapos na produkto, mga klase sa paaralan, at iba pang mga grupo.

Kasama sa pinagsamang sampling ang paggamit ng lahat ng nakaraang uri ng sampling sa isa o ibang kumbinasyon.

Ang konsepto ng "representativeness" na may kaugnayan sa mga sociological survey - public opinion poll - ay may halos mahiwagang epekto sa mga tao. Ang terminong "representasyon" mismo, bilang karagdagan sa pang-agham na kahulugan nito, ay mayroon ding malinaw na pampulitikang kahulugan.

Ano ang dahilan? Ang buong punto ay ipinapalagay na ang isang sample (isang pangkat ng mga taong pinili para sa isang survey) ay maaaring kumatawan (kumakatawan) sa buong populasyon. Ang pangkalahatang populasyon sa kaso ng all-Russian survey ay ang buong populasyon ng bansa. Ngayon isipin natin na pinag-uusapan natin ang isang pampulitikang desisyon - pagsuporta sa isang panukalang batas o pagboto sa isang halalan. Sa tulong ng isang sample na survey, nakakakuha tayo ng mahusay na mekanismo ng representasyong pampulitika - isang mekanismo kung saan ang isang maliit na grupo ng mga tao ay maaaring kumatawan sa opinyon o posisyon ng buong populasyon ng bansa. Kaya naman ang pagiging kinatawan ng pag-aaral ay binibigyan ng isang mahalagang lugar.

Ang konsepto ng pagiging kinatawan, siyempre, ay ginagamit hindi lamang sa pampulitikang pananaliksik. Ang termino ay halos palaging ginagamit kapag pinag-uusapan ang malakihang pananaliksik, maging ito sa larangan ng marketing, pang-ekonomiyang pag-uugali o edukasyon.

Pamamaraan ng survey ng kinatawan

Paano, pagkatapos makapanayam ng 1,500 katao, makakagawa ng mga konklusyon ang isang tao tungkol sa lahat ng mga Ruso, kung saan mayroong higit sa 140 milyon (at higit pa sa 110 milyong mga botante)? Ang teknolohiya sa likod ng mga survey na kinatawan ay batay sa mga batas sa istatistika. Ang pinakamalapit na batayan ay ang batas ng malalaking numero, o ang theorem ni Bernoulli.

Sa pinasimpleng paraan, ang kahulugan nito ay maaaring ipahiwatig tulad ng sumusunod. Ipagpalagay na mayroon tayong ilang katangian, halimbawa, ang dami ng pag-ulan bawat araw sa Yekaterinburg noong ikadalawampu siglo. Kung isusulat natin ang lahat ng mga halaga nito kasama ang kanilang dalas (ito ay tinatawag na pamamahagi), at pagkatapos ay random na kumuha ng isang malaking sapat na bilang ng mga kaso (iyon ay, hindi lahat ng mga araw sa ika-20 siglo, ngunit medyo marami), pagkatapos ay makikita natin na ang pamamahagi sa ating sample ay magiging halos kapareho ng pamamahagi para sa buong ikadalawampu siglo. Kaya, kung pipili tayo ng ilang mga yunit mula sa isang populasyon, maaari nga silang kumakatawan sa buong populasyon, at sa katunayan ay hindi na kailangang mangolekta ng data sa lahat ng mga kaso.

Gayunpaman, mayroong isang pangunahing kundisyon: ito ay totoo lamang kung ang pagpili ay mahigpit na random. Ang tanging problema dito ay maaaring paglihis mula sa randomness. Kaya, kung kukuha lamang kami ng data ng pag-ulan para sa mga nakaraang taon (halimbawa, dahil mas madaling mahanap ang data na ito) o pakikipanayam ang 1,500 taong kilala namin (dahil mas madaling makipag-ugnayan sa kanila) kaysa sa mga random na tao, kung gayon ang sample, siyempre, hindi magiging kinatawan.

Isipin na sa 143.5 milyong Ruso ay random mong pinipili ang 1,500 tao na kailangan mo. Pagkatapos, halimbawa, ang proporsyon ng mga gitnang tagapamahala sa kanila ay magiging humigit-kumulang katumbas ng proporsyon ng mga panggitnang tagapamahala sa populasyon, na nagpapakita na ang iyong sample ay maaaring kumatawan sa buong populasyon. Maaaring ang dalawang tagapagpahiwatig na ito ay magkaiba? Halimbawa, sa mga Ruso ito ay 14%, ngunit sa sample ito ay magiging 1% lamang? Sa teorya, posible ito, ngunit ang posibilidad na ito ay napakaliit na maaari itong mapabayaan (tulad ng pagkikita ng isang dragon sa kalye).

Bukod dito, ang pinakamagandang bagay tungkol sa posibilidad na ito ay hindi kahit na ito ay maliit, ngunit para sa mga random na proseso ay maaaring kalkulahin ang posibilidad na ito. Masasabi natin kung gaano malamang na lumihis ang ating sample na halaga mula sa halaga ng populasyon ng 13% (tulad ng sa halimbawa sa itaas), at kung gaano ito malamang na lumihis, halimbawa, mula sa populasyon ng 2.5%. Kadalasan, gayunpaman, ginagawa nila ang kabaligtaran: una nilang tinutukoy ang posibilidad kung saan nais nating ang ating halaga ay hindi lumihis mula sa halaga sa pangkalahatang populasyon (kadalasan ito ay naayos sa antas na 95%), at pagkatapos ay tinitingnan nila kung ano ang magnitude ng deviation ay para sa isang partikular na sample ng laki. Ang paglihis na ito ay tinatawag na confidence interval, minsan tinatawag na sampling error o statistical error, at kadalasang nakalista sa tabi ng mga resulta ng survey.

Kaya, ang posibilidad ng paglihis, ang magnitude ng paglihis (confidence interval) at ang laki ng sample ay magkakaugnay. Batay dito, ang formula para sa pagkalkula ng laki ng sample ay ang mga sumusunod:

kung saan ang n ay ang sample size, ang Δ ay ang confidence interval, ang z ay ang value ng normal distribution function para sa isang naibigay na probabilidad ng deviation (para sa isang 5% probability ang value na ito ay 1.96).

Ito ay isang pinasimpleng formula; ang mga totoong survey ay gumagamit ng bahagyang mas kumplikadong mga formula. Ang formula na ito ay maaari ding mabigo kung ang halaga ng indicator ay ibang-iba sa 50% (kaya, halimbawa, ang formula na ito ay hindi magiging angkop para sa pagtantya ng proporsyon ng mga pasyente na may isang bihirang sakit sa isang bansa).

Ito ang mangyayari kung papalitan mo ang ilang mga halaga sa formula na ito:

Sa madaling salita, kung kumuha kami ng isang random na sample ng mga Ruso na 1,600 katao at tinasa ang ilang tagapagpahiwatig, halimbawa, ang pagpayag na bumoto para sa isang partikular na pulitiko, kung gayon na may posibilidad na 95% ang aming pagtatasa ay hindi mag-iiba mula sa pagpayag na bumoto para sa siya sa lahat ng mga Ruso ng higit sa 2. 45%.

Laki ng sample

Kaya, kung mas malaki ang sukat ng sample, mas malamang na mas malapit tayo sa proporsyon ng populasyon. Mukhang nangangahulugan ito na kailangan nating subukang dalhin ang sample na mas malapit sa 143.5 milyon. Sa katunayan, tulad ng makikita mula sa talahanayan, ang likas na katangian ng mga random na proseso ay tulad na mula sa isang tiyak na sandali ang posibilidad na mahulog sa pagitan nagsisimula nang tumaas nang napakabagal (at ang sandaling ito ay dumarating nang medyo mabilis). Pagkatapos naming mag-sample ng 1,500 units, gaano man natin dinadagdagan ang sample size, ang posibilidad na mahulog ang sample value natin sa population value ay tataas nang napakabagal.

Sa katunayan, halos walang pagkakaiba sa pagitan ng 1,500 at 10,000 respondents. Sa paligid ng 1500, maaari na nating sabihin na ang ating mga pagtatantya ay mag-iiba mula sa bahagi sa pangkalahatang populasyon ng 2–3%. Kung dagdagan pa natin ang sample, bababa ang posibleng error na ito, ngunit napakaliit. Sa madaling salita, ang isang sample ng 100,000 ay mas mahusay kaysa sa isang sample ng 2,500, ngunit ang pagkakaiba ay napakaliit na ito ay walang kahulugan at, sa kaso ng mga social survey, hindi makatwiran sa ekonomiya. Karaniwang mahal ang pagpapalaki ng sample, kaya hindi makatuwirang palakihin ito upang makakuha ng isang porsyentong punto sa laki ng agwat ng kumpiyansa.

Mahalaga na ang laki ng populasyon ay hindi lilitaw sa formula. Ang punto ay kapag ang populasyon ay malaki (higit sa 20,000), halos walang epekto ito sa laki ng sample. Kaya, hindi namin kailangang malaman kung gaano karaming mga tao ang nakatira sa Russia upang bumuo ng isang kinatawan na sample. Malinaw na ang pagpili ng 1500 sa 2000 ay malamang na hindi makatuwiran - mas madaling suriin ang 2000 at makakuha ng tumpak na pagtatantya. Ngunit sa pamamagitan ng paggawa ng sample, kung kinakailangan, nakakakuha tayo ng pagkakataon na gawing pangkalahatan ang mga resulta nito sa pangkalahatang populasyon. At sa parehong dahilan, ang laki ng sample ay hindi mag-iiba para sa malalaki at maliliit na bansa.

Pagkakatawan at katumpakan

Upang maunawaan ang kahulugan ng konsepto ng "pagkakatawan," isaalang-alang natin ang isang sample ng 15 tao. Kakatwa, kung hindi mo sinasadya, kinatawan din ito. Bukod dito, maaari kang gumawa ng isang sample ng isang yunit. Isipin ang isang kahon ng mga bola kung saan random kang gumuhit ng isang bola. Kung ito ay isang random na piniling bola, ito rin ay kumakatawan sa lahat ng mga bola na nasa kahon na ito. Kakatawanin lang niya sila hindi eksakto. Bakit? Dahil napakataas ng posibilidad na magkamali. Sa susunod na maaari tayong maglabas ng ibang bola at makakuha ng ibang ideya ng mga bola sa kahon. Ang ibig sabihin ng hindi tumpak na pagkatawan ay magkaroon ng malawak na hanay ng mga pagtatantya.

Sa parehong paraan, 15 tao ang kumakatawan sa anumang pangkalahatang populasyon, ngunit hindi nila ito kinakatawan nang tumpak, dahil ang error at confidence interval ay napakalaki. Kakailanganin nating magdagdag ng +/- 33% para makakuha ng 95% na pagkakataon na mahuhulog tayo sa pagitan. Kung handa tayong payagan ito, kukuha tayo ng 15 tao, alamin na 7 sa kanila ay mga middle manager, at pagkatapos ay makakakuha tayo ng pagtatantya na 7/15 ng kabuuan, iyon ay, 47% +/- 33%, ay ang pagtatantya ng bahagi ng mga tagapamahala sa pangkalahatang populasyon, at ito ay isang ganap na tamang konklusyon. Wala lang itong halaga. Masasabi natin ito nang walang pagsusuri. Samakatuwid, kapag nagpaplano ng sample, makatuwirang makamit ang laki ng sample na may katuturan mula sa pananaw sa pagiging epektibo sa gastos.

Ang lahat ng nasabi ay naglalayong maghatid ng isang simpleng ideya, na kadalasang hindi napagtanto: Ang laki ng sample ay hindi nauugnay sa pagiging kinatawan nito.

Ang isang maliit na sample ay hindi tumpak, ngunit maaari pa rin itong maging kinatawan. Ang mga sukat ng sample na ginagamit ngayon sa mga mass survey sa Russia ay halos palaging may medyo mataas na katumpakan.

Ang nagbabanta sa pagiging kinatawan ng sample ay hindi ang laki nito, ngunit bias, iyon ay, paglihis mula sa prinsipyo ng randomness.

Paglabag sa prinsipyo ng randomness

Kung magsisimula kaming pumili ng mga yunit sa isang hindi random na paraan, ang sample ay magiging hindi kinatawan. Halimbawa, kung may pumipigil sa amin na piliin ang mga ito nang random. Isipin natin na gusto nating pumili ng mga bola mula sa ating kahon nang random, ngunit lumalabas na ang ilan sa mga bola ay kumagat. Ang isang mekanismo na kung saan ang mga bola lamang na ibinigay sa amin ay kukunin lamang namin ay isang mekanismo na lumalabag sa randomness at samakatuwid ay lumalabag sa pagiging kinatawan. Sa kasong ito, gaano man karaming mga marbles ang kinuha natin mula sa kahon (kahit na kunin natin ang lahat ng mga marbles na hindi kumagat), magkakaroon tayo ng isang hindi kinatawan na sample, dahil hindi natin isasaalang-alang ang alinman sa mga kumagat - sila ay lampasan lamang ang aming sample.

Ang pinakamalaking problema sa pagkagat ng mga bola ay maaaring magkaiba ang mga ito sa mga dumarating sa ating mga kamay, at naiiba sa eksaktong paraan kung saan tayo interesado. Ang sitwasyong ito ay tinatawag na sampling bias.

Kinakailangang makilala ang sitwasyon ng hindi tumpak na representasyon, na inilarawan namin sa itaas, mula sa sitwasyon ng hindi pagkatawan. Ito ay iba't ibang mga problema, at mayroon silang iba't ibang mga solusyon. Hindi mo malulutas ang isa sa kanila sa pamamagitan ng paglutas sa isa pa. Kung ang sample ay walang representasyon, walang saysay na dagdagan ito. Bukod dito, ang malalaking sample sa mga social survey ay may posibilidad na makaipon ng mga error, kaya ang malalaking sample na laki ay maaari lamang magpalala sa problema sa representasyon.

Bakit imposible ang pagiging kinatawan

Sa mga tala sa mga talahanayan na may mga resulta ng survey, madalas mong makikita na "ang laki ng sample ay 1,600 tao, ang sample ay kumakatawan sa kasarian at edad." Mula sa itaas, malinaw na ang mga ito ay dalawang magkaibang mga parameter: ang indikasyon ng pagiging kinatawan ay hindi nauugnay sa laki ng sample. Ang talagang ibig sabihin nito ay ang ilang mga pamamaraan ay sinundan upang matiyak ang isang tugma sa pagitan ng sample at ng populasyon. Halimbawa, upang matiyak ang pagiging kinatawan ayon sa kasarian, ang mga lalaki at babae ay kinukuha sa sample sa parehong mga proporsyon tulad ng umiiral sa mga Russian ayon sa data ng census. Ngunit ang pagiging kinatawan ayon sa kasarian ay hindi nangangahulugan ng pagiging kinatawan, halimbawa, sa pamamagitan ng mga pananaw sa pulitika.

Bakit kailangan nating i-equalize ang sample ayon sa kasarian at iba pang socio-demographic na kategorya? Dahil ang tunay na pagiging kinatawan ay masisiguro lamang ng isang random na sample, at imposibleng ipatupad ito sa pagsasanay para sa iba't ibang dahilan. Kapag sinubukan mong gawin ito, makakatagpo ka ng maraming problema - kahit anong paraan ang pipiliin mong gamitin. Ang ilang mga sumasagot ay magiging ganap na hindi maa-access sa iyong pamamaraan (halimbawa, para sa mga personal na panayam, ang mga bahay na may intercom at seguridad ay isang malaking problema), ang isa pang bahagi ay wala, hindi sumasagot, o mas gugustuhin na isipin ang kanilang sariling negosyo. May mga taong may problema sa wika at hindi makausap sa amin. May mga taong hindi maintindihan kung bakit kailangan ito, at ayaw nila tayong kausapin. Ang lahat ng ito ay malubhang paglabag sa randomness na ginagawang imposible ang pagpapatupad nito.

Yaong mga nagpapababa sa problema ng representasyon sa mga mass survey sa mga istatistika ay nakakalimutan na ang mga tao ay napaka-espesipikong mga blobs. May mga bolang tumatakbo at nagtatago. May mga bolang kumagat. Hindi sila passive object, lumalaban sila. Sabi nila, "Ayaw kong kunin ang iyong survey," sa gayon ay lumalabag sa randomness. Samakatuwid, sa mahigpit na kahulugan ng salita, ang pagiging kinatawan sa mga survey ng masa ay, siyempre, imposible sa anumang anyo.

Ang isang mekanismo ay binuo kung saan ang hitsura ng pagiging kinatawan ay karaniwang tinitiyak: inihanay namin ang sample sa ilang mga kategorya at nagpapanggap na ito ay nakahanay din sa lahat ng iba pang posibleng mga kategorya. Sa katunayan, wala tayong dahilan para sabihin ito. Ngunit ang problema ay walang paraan upang suriin ito - muli dahil sa katotohanan na ang ilang mga bola ay kumagat. Para masuri ang bias, kailangang pumunta ang reviewer sa mga hindi namin nainterbyu at kapanayamin sila. Ngunit sila, tulad ng naaalala natin, ay hindi nais na tanungin sa lahat. Imposibleng makapanayam ang mga tiyak na hindi sumasagot. Samakatuwid, gumagana ang lahat sa pagpapalagay na kung binalanse natin ang sample kasama ang dalawa o tatlong parameter, ito ay kinatawan ng buong populasyon, kahit na walang magandang batayan para sa pagpapalagay na ito.

Ang representative sampling ay isang teknolohiyang hiniram ng mga sosyologo mula sa mga istatistika. Samakatuwid, hindi maiiwasang naglalaman ito ng mga elemento ng isang matematikal at istatistikal na larawan ng mundo. Marahil ang pinakamatibay na palagay ay ang mismong sample na survey ay pampulitika at sosyolohikal na neutral: ang paglahok at hindi paglahok sa survey ay hindi nagdadala ng pampulitikang kahulugan at hindi nauugnay sa iba pang mahahalagang parameter sa sosyolohikal. Ngunit ngayon, ang mga botohan ay naging isa sa mga pangunahing institusyong pampulitika at naging pangunahing tagapamagitan sa pagitan ng malalaking korporasyon at mga mamimili. Sa ilalim ng mga kundisyong ito, hindi na posibleng maniwala sa kanilang kawalang-kilos sa pulitika. Gayunpaman, kakaunti pa rin ang alam natin tungkol sa kung paano nauunawaan ang mga survey sa mga modernong lipunan at kung ano talaga ang kinakatawan ng mga ito.

Ang kabuuang bilang ng mga bagay ng pagmamasid (mga tao, sambahayan, negosyo, pamayanan, atbp.) na may isang tiyak na hanay ng mga katangian (kasarian, edad, kita, numero, turnover, atbp.), Limitado sa espasyo at oras. Mga halimbawa ng populasyon

Lahat ng residente ng Moscow (10.6 milyong tao ayon sa 2002 census)
Mga Lalaking Muscovite (4.9 milyong tao ayon sa census noong 2002)
Mga legal na entity ng Russia (2.2 milyon sa simula ng 2005)
Mga retail outlet na nagbebenta ng mga produktong pagkain (20 thousand sa simula ng 2008), atbp.

Sample (Sample na Populasyon)

Isang bahagi ng isang populasyon na pinili para sa pag-aaral upang makagawa ng mga konklusyon tungkol sa buong populasyon. Upang ang konklusyon na nakuha sa pamamagitan ng pag-aaral ng sample ay mapalawak sa buong populasyon, ang sample ay dapat magkaroon ng pag-aari ng pagiging kinatawan.

Pagkakatawan ng sample

Ang pag-aari ng isang sample upang maipakita nang tama ang populasyon. Ang parehong sample ay maaaring maging kinatawan at hindi kinatawan para sa iba't ibang populasyon.
Halimbawa:

Ang isang sample na ganap na binubuo ng mga Muscovite na nagmamay-ari ng kotse ay hindi kumakatawan sa buong populasyon ng Moscow.
Ang isang sample ng mga negosyong Ruso na may hanggang 100 empleyado ay hindi kumakatawan sa lahat ng mga negosyo sa Russia.
Ang isang sample ng Muscovite na namimili sa merkado ay hindi kumakatawan sa pag-uugali sa pagbili ng lahat ng Muscovite.

Kasabay nito, ang mga sample na ito (napapailalim sa iba pang mga kundisyon) ay maaaring ganap na kumatawan sa mga Muscovite na nagmamay-ari ng mga kotse, maliliit at katamtamang laki ng mga negosyong Ruso, at mga mamimili na bumibili sa mga merkado, ayon sa pagkakabanggit.
Mahalagang maunawaan na ang pagiging kinatawan ng sample at error sa sampling ay magkaibang phenomena. Ang pagiging kinatawan, hindi katulad ng pagkakamali, ay hindi nakadepende sa anumang paraan sa laki ng sample.
Halimbawa:
Gaano man natin dagdagan ang bilang ng mga Muscovite na may-ari ng sasakyan na na-survey, hindi namin magagawang katawanin ang lahat ng Muscovite gamit ang sample na ito.

Sampling error (confidence interval)

Ang paglihis ng mga resultang nakuha gamit ang sample observation mula sa totoong data ng pangkalahatang populasyon.
Mayroong dalawang uri ng error sa sampling - istatistika at sistematiko. Ang error sa istatistika ay depende sa laki ng sample. Kung mas malaki ang sample size, mas mababa ito.
Halimbawa:
Para sa isang simpleng random na sample na 400 units, ang maximum statistical error (na may 95% confidence level) ay 5%, para sa sample na 600 units - 4%, para sa sample na 1100 units - 3% Kadalasan, kapag pinag-uusapan nila ang sampling error, ang ibig nilang sabihin ay statistical error .
Ang sistematikong pagkakamali ay nakasalalay sa iba't ibang salik na patuloy na nakakaimpluwensya sa pag-aaral at pinapakiling ang mga resulta ng pag-aaral sa isang tiyak na direksyon.
Halimbawa:

Ang paggamit ng anumang mga sample ng posibilidad ay maliitin ang proporsyon ng mga taong may mataas na kita na namumuno sa isang aktibong pamumuhay. Nangyayari ito dahil sa ang katunayan na ito ay mas mahirap na makahanap ng gayong mga tao sa anumang partikular na lugar (halimbawa, sa bahay).
Ang problema ng mga sumasagot na tumatangging sagutin ang mga tanong (ang bahagi ng mga "refuseniks" sa Moscow, para sa iba't ibang mga survey, ay mula 50% hanggang 80%)

Sa ilang mga kaso, kapag ang tunay na mga distribusyon ay nalaman, ang sistematikong error ay maaaring i-level out sa pamamagitan ng pagpapakilala ng mga quota o muling pagtimbang ng data, ngunit sa karamihan ng mga tunay na pag-aaral, maaari itong maging medyo problemado kahit na tantiyahin ito.

Mga uri ng sample

Ang mga sample ay nahahati sa dalawang uri:

probabilistiko
hindi probabilistiko

1. Mga sample ng probabilidad
1.1 Random sampling (simple random sampling)
Ipinapalagay ng naturang sample ang homogeneity ng populasyon, ang parehong posibilidad ng pagkakaroon ng lahat ng elemento, at ang pagkakaroon ng kumpletong listahan ng lahat ng elemento. Kapag pumipili ng mga elemento, bilang panuntunan, ginagamit ang isang talahanayan ng mga random na numero.
1.2 Mechanical (systematic) sampling
Isang uri ng random na sample, na inayos ayon sa ilang katangian (alphabetical order, numero ng telepono, petsa ng kapanganakan, atbp.). Ang unang elemento ay pinili nang random, pagkatapos, sa hakbang na 'n', ang bawat 'k' na elemento ay pinili. Ang laki ng populasyon, sa kasong ito – N=n*k
1.3 Stratified (na-zoned)
Ginagamit ito sa kaso ng heterogeneity ng populasyon. Ang pangkalahatang populasyon ay nahahati sa mga pangkat (strata). Sa bawat stratum, ang pagpili ay isinasagawa nang random o mekanikal.
1.4 Serial (cluster o cluster) sampling
Sa serial sampling, ang mga yunit ng pagpili ay hindi ang mga bagay mismo, ngunit mga grupo (mga kumpol o pugad). Ang mga pangkat ay pinili nang random. Ang mga bagay sa loob ng mga grupo ay sinusuri nang maramihan.

2. Non-probability sample
Ang pagpili sa naturang sample ay isinasagawa hindi ayon sa mga prinsipyo ng randomness, ngunit ayon sa subjective na pamantayan - availability, typicality, pantay na representasyon, atbp.
2.1. Pagsa-sample ng quota
Sa una, ang isang bilang ng mga pangkat ng mga bagay ay nakilala (halimbawa, mga lalaki na may edad na 20-30 taon, 31-45 taon at 46-60 taong gulang; mga taong may kita hanggang 30 libong rubles, na may kita mula 30 hanggang 60 libong rubles at na may kita na higit sa 60 libong rubles ) Para sa bawat pangkat, ang bilang ng mga bagay na dapat suriin ay tinukoy. Ang bilang ng mga bagay na dapat mahulog sa bawat isa sa mga pangkat ay kadalasang itinakda alinman sa proporsyon sa dating kilalang bahagi ng pangkat sa pangkalahatang populasyon, o pareho para sa bawat pangkat. Sa loob ng mga grupo, ang mga bagay ay random na pinipili. Ang quota sampling ay madalas na ginagamit.
2.2. Paraan ng snowball
Ang sample ay itinayo bilang mga sumusunod. Ang bawat respondente, simula sa una, ay hinihingan ng impormasyon sa pakikipag-ugnayan ng kanyang mga kaibigan, kasamahan, kakilala na akma sa mga kundisyon sa pagpili at maaaring makilahok sa pag-aaral. Kaya, maliban sa unang hakbang, ang sample ay nabuo na may partisipasyon ng mga bagay sa pananaliksik mismo. Ang pamamaraan ay kadalasang ginagamit kapag kinakailangan upang mahanap at makapanayam ang mga mahirap abutin na grupo ng mga respondent (halimbawa, mga respondent na may mataas na kita, mga respondent na kabilang sa parehong propesyonal na grupo, mga respondent na may katulad na libangan/interes, atbp.)
2.3 Spontaneous sampling
Ang pinaka-naa-access na mga respondente ay sinusuri. Ang mga karaniwang halimbawa ng mga kusang sample ay nasa mga pahayagan/magazine, na ibinibigay sa mga respondent para sa sariling pagkumpleto, at karamihan sa mga online na survey. Ang laki at komposisyon ng mga kusang sample ay hindi alam nang maaga, at tinutukoy lamang ng isang parameter - ang aktibidad ng mga sumasagot.
2.4 Sample ng mga tipikal na kaso
Pinipili ang mga yunit ng pangkalahatang populasyon na may average (karaniwang) halaga ng katangian. Pinapataas nito ang problema sa pagpili ng isang tampok at pagtukoy sa karaniwang halaga nito.

Kurso ng mga lektura sa teorya ng istatistika

Ang mas detalyadong impormasyon sa mga sample na obserbasyon ay maaaring makuha sa pamamagitan ng pagtingin.

Mga elementong sakop ng eksperimento (obserbasyon, survey).

Mga halimbawang katangian:

Mga katangian ng husay ng sample - kung ano ang eksaktong pipiliin namin at kung anong mga pamamaraan ng sampling ang ginagamit namin para dito.
Mga katangian ng dami ng sample - kung gaano karaming mga kaso ang pipiliin namin, sa madaling salita, laki ng sample.

Kailangan ng Sampling:

Ang object ng pag-aaral ay napakalawak. Halimbawa, ang mga mamimili ng mga produkto ng isang pandaigdigang kumpanya ay isang malaking bilang ng mga market na nagkalat sa heograpiya.
May pangangailangang mangolekta ng pangunahing impormasyon.

Encyclopedic YouTube

1 / 5

✪ Sampling: pagkalkula ng dami. Ang pagiging maaasahan at kapangyarihan ng pag-aaral. Biostatistics.

✪ 02 - Mat. mga istatistika. Sampling. Sample space. Mga halimbawa

✪ Mga Pangunahing Kaalaman sa SQL para sa Mga Nagsisimula | Pagkuha ng mga halaga mula sa database

✪ SQL for Beginners (DML): Pagpili mula sa isang Table (MySql), Aralin 4!

✪ Produksyon ng mga panel ng SIP. Bahagi 2. Paggupit at paghugis ng hugis. Pagpili ng mga grooves. Lahat nasa isip mo

Mga subtitle

Laki ng sample

Laki ng sample - ang bilang ng mga kaso na kasama sa sample na populasyon.

Maaaring hatiin ang mga sample sa malaki at maliit, dahil iba't ibang diskarte ang ginagamit sa mga istatistika ng matematika depende sa laki ng sample. Ito ay pinaniniwalaan na ang mga sample na mas malaki sa 30 ay maaaring mauri bilang malaki.

Dependent at independiyenteng mga sample

Kapag naghahambing ng dalawa (o higit pang) sample, isang mahalagang parameter ang kanilang pagtitiwala. Kung ang isang homomorphic na pares ay maaaring maitatag (iyon ay, kapag ang isang kaso mula sa sample X ay tumutugma sa isa at isang kaso lamang mula sa sample Y at vice versa) para sa bawat kaso sa dalawang sample (at ang batayan ng relasyon na ito ay mahalaga para sa katangiang sinusukat sa mga sample), ang mga naturang sample ay tinatawag umaasa. Mga halimbawa ng dependent sample:

pares ng kambal,
dalawang sukat ng anumang katangian bago at pagkatapos ng eksperimentong pagkakalantad,
mag-asawa
at iba pa.

Kung walang ganoong ugnayan sa pagitan ng mga sample, isasaalang-alang ang mga sample na ito malaya, Halimbawa:

lalaki at babae ,
mga psychologist at mathematician.

Alinsunod dito, ang mga dependent na sample ay palaging may parehong laki, habang ang laki ng mga independent sample ay maaaring magkaiba.

Ang paghahambing ng mga sample ay ginawa gamit ang iba't ibang pamantayan sa istatistika:

Pearson criterion (χ 2 )
t-test ng mag-aaral ( t )
Pagsusulit sa Wilcoxon ( T )
Mann-Whitney criterion ( U )
Pag-sign criterion ( G )
at iba pa.

pagiging kinatawan

Ang sample ay maaaring ituring na kinatawan o hindi kinatawan. Ang sample ay magiging kinatawan kapag sinusuri ang isang malaking grupo ng mga tao, kung sa loob ng pangkat na ito ay may mga kinatawan ng iba't ibang mga subgroup, ito ang tanging paraan upang makagawa ng mga tamang konklusyon.

Halimbawa ng sample na hindi kinatawan

Isang pag-aaral na may mga pang-eksperimentong at kontrol na grupo, na inilalagay sa iba't ibang kundisyon.
- Mag-aral kasama ang mga pang-eksperimentong at kontrol na grupo gamit ang isang pairwise na diskarte sa pagpili
Isang pag-aaral na gumagamit lamang ng isang pangkat - isang eksperimental.
Isang pag-aaral gamit ang isang halo-halong (factorial) na disenyo - lahat ng mga grupo ay inilalagay sa iba't ibang mga kondisyon.

Mga uri ng sample

Ang mga sample ay nahahati sa dalawang uri:

probabilistiko
hindi probabilistiko

Mga sample ng posibilidad

Simpleng probability sampling:
- Simpleng resampling. Ang paggamit ng naturang sample ay nakabatay sa palagay na ang bawat respondent ay pantay na malamang na mapabilang sa sample. Batay sa listahan ng pangkalahatang populasyon, pinagsama-sama ang mga card na may mga numero ng respondent. Ang mga ito ay inilalagay sa isang deck, binabalasa at ang isang card ay kinuha nang random, ang numero ay isinulat, at pagkatapos ay ibinalik. Susunod, ang pamamaraan ay paulit-ulit nang maraming beses sa laki ng sample na kailangan namin. Disadvantage: pag-uulit ng mga yunit ng pagpili.

Ang pamamaraan para sa pagbuo ng isang simpleng random na sample ay kinabibilangan ng mga sumusunod na hakbang:

1) kinakailangang makakuha ng kumpletong listahan ng mga miyembro ng pangkalahatang populasyon at bilangin ang listahang ito. Ang nasabing listahan, pagpapabalik, ay tinatawag na sampling frame;

2) tukuyin ang inaasahang laki ng sample, iyon ay, ang inaasahang bilang ng mga sumasagot;

3) kunin ang pinakamaraming numero mula sa talahanayan ng mga random na numero gaya ng kailangan namin ng mga sample unit. Kung dapat mayroong 100 tao sa sample, 100 random na numero ang kukunin mula sa talahanayan. Ang mga random na numerong ito ay maaaring mabuo ng isang computer program.

4) piliin mula sa base na listahan ang mga obserbasyon na ang mga numero ay tumutugma sa nakasulat na mga random na numero

Ang simpleng random sampling ay may malinaw na mga pakinabang. Ang pamamaraang ito ay napakadaling maunawaan. Ang mga resulta ng pag-aaral ay maaaring gawing pangkalahatan sa populasyon na pinag-aaralan. Karamihan sa mga diskarte sa statistical inference ay kinabibilangan ng pagkolekta ng impormasyon gamit ang isang simpleng random na sample. Gayunpaman, ang simpleng random sampling na paraan ay may hindi bababa sa apat na makabuluhang limitasyon:

1) Madalas mahirap gumawa ng sampling frame na magbibigay-daan para sa isang simpleng random na sample.

2) ang resulta ng paggamit ng isang simpleng random na sample ay maaaring isang malaking populasyon, o isang populasyon na ibinahagi sa isang malaking heograpikal na lugar, na makabuluhang nagpapataas ng oras at gastos ng pagkolekta ng data.

3) ang mga resulta ng paggamit ng isang simpleng random na sample ay madalas na nailalarawan sa pamamagitan ng mababang katumpakan at isang mas malaking karaniwang error kaysa sa mga resulta ng paggamit ng iba pang mga probabilistikong pamamaraan.

4) bilang resulta ng paggamit ng SRS, maaaring mabuo ang isang hindi kinatawan na sample. Bagama't ang mga sample na nakuha sa pamamagitan ng simpleng random sampling, sa karaniwan, ay sapat na kumakatawan sa populasyon, ang ilan sa mga ito ay lubhang maling representasyon ng populasyon na pinag-aaralan. Ang posibilidad na ito ay lalong mataas na may maliit na sukat ng sample.

Simpleng hindi paulit-ulit na sampling. Ang sampling procedure ay pareho, tanging ang mga card na may mga respondent number ay hindi ibinalik sa deck.

Systematic probability sampling. Ito ay isang pinasimpleng bersyon ng simpleng probability sampling. Batay sa listahan ng pangkalahatang populasyon, pinipili ang mga respondente sa isang tiyak na pagitan (K). Ang halaga ng K ay random na tinutukoy. Ang pinaka-maaasahang resulta ay nakakamit sa isang homogenous na populasyon, kung hindi man ang laki ng hakbang at ilang panloob na cyclic pattern ng sample ay maaaring magkasabay (sampling mixing). Mga disadvantages: kapareho ng sa isang simpleng probability sample.
Serial (cluster) sampling. Ang mga yunit ng pagpili ay serye ng istatistika (pamilya, paaralan, koponan, atbp.). Ang mga napiling elemento ay napapailalim sa isang kumpletong pagsusuri. Ang pagpili ng mga istatistikal na yunit ay maaaring isaayos bilang random o sistematikong sampling. Disadvantage: Posibilidad ng higit na homogeneity kaysa sa pangkalahatang populasyon.
Regional sampling. Sa kaso ng isang heterogenous na populasyon, bago gumamit ng probability sampling sa anumang pamamaraan ng pagpili, inirerekomenda na hatiin ang populasyon sa mga homogenous na bahagi, ang naturang sample ay tinatawag na district sampling. Ang mga grupo ng pag-zone ay maaaring magsama ng parehong mga natural na pormasyon (halimbawa, mga distrito ng lungsod) at anumang tampok na bumubuo sa batayan ng pag-aaral. Ang katangian sa batayan kung saan isinasagawa ang paghahati ay tinatawag na katangian ng stratification at zoning.
Sampol ng "Kaginhawaan". Ang pamamaraan ng sampling na "kaginhawaan" ay binubuo ng pagtatatag ng mga contact na may "maginhawa" na mga sampling unit - isang pangkat ng mga mag-aaral, isang koponan sa palakasan, mga kaibigan at kapitbahay. Kung gusto mong makakuha ng impormasyon tungkol sa mga reaksyon ng mga tao sa isang bagong konsepto, ang ganitong uri ng sampling ay medyo makatwiran. Ang convenience sampling ay kadalasang ginagamit upang paunang subukan ang mga questionnaire.

Mga sample na hindi maaaring mangyari

Ang pagpili sa naturang sample ay isinasagawa hindi ayon sa mga prinsipyo ng randomness, ngunit ayon sa subjective na pamantayan - availability, typicality, pantay na representasyon, atbp.

Quota sampling - ang sample ay binuo bilang isang modelo na nagpaparami ng istruktura ng pangkalahatang populasyon sa anyo ng mga quota (proporsyon) ng mga katangiang pinag-aaralan. Ang bilang ng mga sample na elemento na may iba't ibang kumbinasyon ng mga pinag-aralan na katangian ay tinutukoy upang ito ay tumutugma sa kanilang bahagi (proporsyon) sa pangkalahatang populasyon. Kaya, halimbawa, kung ang ating pangkalahatang populasyon ay binubuo ng 5,000 katao, kung saan 2,000 ay babae at 3,000 ay lalaki, kung gayon sa sample ng quota magkakaroon tayo ng 20 babae at 30 lalaki, o 200 babae at 300 lalaki. Ang mga sample ng quota ay kadalasang nakabatay sa pamantayan ng demograpiko: kasarian, edad, rehiyon, kita, edukasyon, at iba pa. Mga disadvantages: kadalasan ang mga naturang sample ay hindi kinatawan, dahil imposibleng isaalang-alang ang ilang mga social parameter nang sabay-sabay. Mga kalamangan: madaling magagamit na materyal.
Paraan ng snowball. Ang sample ay itinayo bilang mga sumusunod. Ang bawat respondent, simula sa una, ay hinihingan ng impormasyon sa pakikipag-ugnayan ng kanyang mga kaibigan, kasamahan, kakilala na akma sa mga kundisyon sa pagpili at maaaring makilahok sa pag-aaral. Kaya, maliban sa unang hakbang, ang sample ay nabuo na may partisipasyon ng mga bagay sa pananaliksik mismo. Ang pamamaraan ay kadalasang ginagamit kapag kinakailangan upang mahanap at makapanayam ang mga mahirap abutin na grupo ng mga respondent (halimbawa, mga respondent na may mataas na kita, mga respondent na kabilang sa parehong propesyonal na grupo, mga respondent na may katulad na libangan/interes, atbp.)
Spontaneous sampling - sampling ng tinatawag na "first person you meet". Madalas na ginagamit sa mga botohan sa telebisyon at radyo. Ang laki at komposisyon ng mga kusang sample ay hindi alam nang maaga, at tinutukoy lamang ng isang parameter - ang aktibidad ng mga sumasagot. Mga disadvantage: imposibleng matukoy kung aling populasyon ang kinakatawan ng mga respondent, at bilang resulta, imposibleng matukoy ang pagiging kinatawan.
Route survey - kadalasang ginagamit kung ang unit ng pag-aaral ay ang pamilya. Sa mapa ng lokalidad kung saan isasagawa ang survey, lahat ng kalye ay binibilang. Gamit ang talahanayan (generator) ng mga random na numero, pinipili ang malalaking numero. Ang bawat malaking numero ay itinuturing na binubuo ng 3 bahagi: numero ng kalye (2-3 unang numero), numero ng bahay, numero ng apartment. Halimbawa, ang numerong 14832: 14 ay ang numero ng kalye sa mapa, 8 ang numero ng bahay, 32 ang numero ng apartment.
Regional sampling na may pagpili ng mga tipikal na bagay. Kung, pagkatapos ng zoning, ang isang tipikal na bagay ay pinili mula sa bawat pangkat, iyon ay, isang bagay na malapit sa average sa mga tuntunin ng karamihan sa mga katangian na pinag-aralan sa pag-aaral, ang naturang sample ay tinatawag na zoned na may pagpili ng mga tipikal na bagay.
Modal sampling.
Expert sampling.
Heterogenous sample.

Mga Istratehiya sa Pagbuo ng Grupo

Ang pagpili ng mga grupo para sa pakikilahok sa isang sikolohikal na eksperimento ay isinasagawa gamit ang iba't ibang mga estratehiya upang matiyak na ang panloob at panlabas na bisa ay pinananatili sa pinakamaraming posibleng lawak.

Randomization

Randomization, o random na pagpili, ay ginagamit upang lumikha ng mga simpleng random na sample. Ang paggamit ng naturang sample ay batay sa pag-aakalang ang bawat miyembro ng populasyon ay pantay na malamang na mapabilang sa sample. Halimbawa, upang makagawa ng random na sample ng 100 estudyante sa unibersidad, maaari kang maglagay ng mga piraso ng papel na may mga pangalan ng lahat ng mga estudyante sa unibersidad sa isang sumbrero, at pagkatapos ay kumuha ng 100 piraso ng papel mula dito - ito ay magiging random na seleksyon (Goodwin J ., p. 147)....

Pairwise na pagpili

Pairwise na pagpili- isang diskarte para sa pagbuo ng mga sampling na grupo, kung saan ang mga pangkat ng mga paksa ay binubuo ng mga paksa na katumbas sa mga tuntunin ng pangalawang parameter na makabuluhan para sa eksperimento. Ang diskarte na ito ay epektibo para sa mga eksperimento na gumagamit ng mga pang-eksperimentong at kontrol na grupo, na ang pinakamagandang opsyon ay ang paggamit ng kambal na pares (mono- at dizygotic).

Stratometric sampling

Stratometric sampling- randomization na may paglalaan ng strata (o mga kumpol). Sa pamamaraang ito ng sampling, ang pangkalahatang populasyon ay nahahati sa mga grupo (strata) na may ilang mga katangian (kasarian, edad, kagustuhan sa politika, edukasyon, antas ng kita, atbp.), at ang mga paksa na may kaukulang mga katangian ay pinili.

Tinatayang Pagmomodelo

Tinatayang Pagmomodelo- pagguhit ng mga limitadong sample at pag-generalize ng mga konklusyon tungkol sa sample na ito sa mas malawak na populasyon. Halimbawa, sa partisipasyon ng mga 2nd year university students sa pag-aaral, ang data ng pag-aaral na ito ay nalalapat sa "mga taong may edad 17 hanggang 21 taon". Ang pagiging matanggap ng naturang mga generalization ay lubhang limitado.

Ang tinatayang pagmomodelo ay ang pagbuo ng isang modelo na, para sa isang malinaw na tinukoy na klase ng mga sistema (mga proseso), ay naglalarawan sa gawi nito (o ninanais na mga phenomena) na may katanggap-tanggap na katumpakan.

Sample - Ito:

1) ang kabuuan ng mga elementong iyon ng object ng pananaliksik na direktang pag-aaralan;

2) mga pamamaraan at pamamaraan para sa pagpili ng mga elemento ng object ng pananaliksik.

Populasyon – isang kumpletong hanay ng mga bagay na may kaugnayan sa problemang pinag-aaralan. Sa sosyolohikal na pananaliksik bilang G.S. kadalasan ang mga ito ay pinagsama-samang mga indibidwal - ang populasyon (lungsod, bansa, atbp.), isang panlipunang grupo (kabataan, walang trabaho, negosyante, atbp.), ang madla ng mass media (MSC), atbp. Gayunpaman, sa maraming mga kaso G.S. maaaring binubuo ng mas malalaking elemento (mga bagay) - mga pamilya (mga sambahayan), mga grupong pang-akademiko, mga negosyo, mga komunidad ng relihiyon, mga indibidwal na lokalidad o estado, atbp.

Sampol na populasyon - isang bahagi ng mga bagay mula sa isang populasyon na pinili para sa pag-aaral upang makagawa ng mga konklusyon tungkol sa buong populasyon.

Upang ang konklusyon na nakuha sa pamamagitan ng pag-aaral ng sample ay mapalawak sa buong populasyon, ang sample ay dapat magkaroon ng pag-aari ng pagiging kinatawan.

pagiging kinatawan ay ang kakayahan ng isang sample na kumatawan sa populasyon na pinag-aaralan. Kung mas tumpak na kinakatawan ng komposisyon ng sample ang populasyon sa mga isyung pinag-aaralan, mas mataas ang pagiging kinatawan nito.

HALIMBAWA: Ang pagiging representatibo ay maaaring ilarawan ng sumusunod na halimbawa. Ipagpalagay natin na ang populasyon ay lahat ng mga mag-aaral ng paaralan (600 tao mula sa 20 klase, 30 tao sa bawat klase). Ang paksa ng pag-aaral ay saloobin sa paninigarilyo. Ang isang sample na binubuo ng 60 mag-aaral sa high school ay kumakatawan sa populasyon na mas masahol pa kaysa sa isang sample ng parehong 60 tao, na magsasama ng 3 mag-aaral mula sa bawat klase. Ang pangunahing dahilan nito ay ang hindi pantay na pamamahagi ng edad sa mga klase. Dahil dito, sa unang kaso, ang pagiging kinatawan ng sample ay mababa, at sa pangalawang kaso, ang pagiging kinatawan ay mataas (lahat ng iba pang bagay ay pantay).

Mga uri ng sample

1.Random na sampling.

1.1.Simple random na pagpili.

1.2 Systematic (o mekanikal) na paraan ng sampling.

1.3 Serial (cluster o cluster) sampling.

1.4 Stratified sampling.

2. Non-random sampling (non-probability).

2.2. Spontaneous sampling.

2.3. Multi-stage at single-stage sampling.

1.Random na sampling.

Ang kakaiba ng isang random na sample ay ang lahat ng mga yunit sa populasyon ay may pantay na posibilidad na mapabilang sa sample na populasyon. Sa kaso ng random sampling ito ay isinasagawa prinsipyo ng randomness. Ang sampling na batayan ay maaaring mga listahan ng mga empleyado ng negosyo, mga direktoryo ng telepono, mga listahan ng pagpaparehistro ng mga may-ari ng kotse, mga listahan ng mga botante sa mga istasyon ng botohan, mga rehistro ng bahay, pati na rin ang iba't ibang mga listahan na pinagsama-sama ng sosyologo mismo, depende sa mga layunin ng pag-aaral (isang listahan ng mga kalye kung saan pipiliin ang mga respondente).

Karaniwang ginagamit ang random sampling sa mga poll ng opinyon ng publiko bago ang halalan, mga referendum at iba pang pampublikong kaganapan.

Dagdag pa Ang pamamaraang ito ay upang ganap na sumunod sa prinsipyo ng randomness at, bilang resulta, upang maiwasan ang mga sistematikong pagkakamali.

Mga kawalan ng pamamaraang ito:

– Ang pangangailangang magkaroon ng listahan ng mga elemento ng populasyon.

– Kahirapan sa pagsasagawa ng survey.

– Medyo malaki ang sample size.