Илюстративен образец. Проба, нейните видове и характеристики

Извадката е набор от данни, взети с помощта на определени процедури от обща популация за проучвателен анализ. Представителността е свойството за възпроизвеждане на представянето на цялото в неговата част. С други думи, това е възможността за разширяване на идеята за част към цялото, което включва тази част.

Представителността на извадката е показател, че извадката трябва да отразява пълно и достоверно характеристиките на съвкупността, от която е част. Може да се определи и като свойството на извадката най-пълно да представя характеристиките на генералната съвкупност, които са значими от гледна точка на целта на изследването.

Да приемем, че генералната съвкупност е всички ученици на училището (900 души от 30 класа, по 30 души във всеки клас). Обект на изследването е отношението на учениците към тютюнопушенето. Извадка от 90 ученици само ще представи цялата популация много по-зле от извадка от същите 90 ученици, която ще включва 3 ученици от всеки клас. Основната причина е неравномерното разпределение по възраст. Така в първия случай представителността на извадката ще бъде ниска. Във втория случай - високо.

В социологията казват, че има представителност на извадката и нейната непредставителност.

Пример за непредставителна извадка е класически случай от 1936 г. в САЩ по време на президентските избори.

Literary Digest, който досега беше много успешен в прогнозирането на резултатите от предишни избори, този път сгреши, въпреки че изпрати няколко милиона писмени въпроса на абонати, както и на респонденти, избрани от телефонни указатели и списъци с регистрации на автомобили. В 1/4 от бюлетините, които се върнаха попълнени, гласовете бяха разпределени както следва: 57% гласуваха за републиканския кандидат на име Алф Ландън, а 41% предпочетоха действащия демократ Франклин Рузвелт.

Всъщност Ф. Рузвелт печели изборите с почти 60% от гласовете. Грешката на „Literary Digest“ беше следната. Те искаха да увеличат представителността на извадката . И тъй като знаеха, че по-голямата част от техните абонати се идентифицират като републиканци, те решиха да разширят извадката с респонденти, избрани от тях от телефонните указатели и списъците с регистрации на автомобили. Но те не взеха предвид съществуващите реалности и всъщност избраха още повече привърженици на републиканците, защото тогава средната и висшата класа можеха да си позволят да имат коли и телефони. И те бяха предимно републиканци, а не демократи.

Има различни видове вземане на проби: просто произволно, серийно, типично, механично и комбинирано.

Простата случайна извадка се състои в избиране от цялата популация на изследваните единици на случаен принцип без никаква система.

Механичната извадка се използва, когато има ред в генералната съвкупност, например има определена последователност от единици работници, избирателни списъци, телефонни номера на респондентите, номера на апартаменти и къщи и др.).

Типичният подбор се използва, когато цялата популация може да бъде разделена на групи според видовете. При работа с населението това могат да бъдат например образователни, възрастови, социални групи; при изучаване на предприятията те могат да бъдат индустрия или отделна организация и др.

Сериен избор е полезен, когато единиците са групирани в малки серии или групи. Такава серия може да бъде партиди от готови продукти, училищни класове и други групи.

Комбинираното вземане на проби включва използването на всички предишни видове вземане на проби в една или друга комбинация.

Понятието "представителност" по отношение на социологическите проучвания - проучванията на общественото мнение - има почти магически ефект върху хората. Самият термин "представителство" има освен научен и ясно политически смисъл.

Каква е причината? Работата е там, че се предполага, че извадката (група от хора, избрани за проучването) може да представлява (представлява) цялата популация. Общата съвкупност в случая на общоруските проучвания е цялото население на страната. Сега нека си представим, че говорим за политическо решение – подкрепа на законопроект или гласуване на избори. С помощта на извадково проучване получаваме отличен механизъм на политическо представителство - механизъм, при който малка група хора могат да представят мнението или позицията на цялото население на страната. Затова на представителността на изследването се отрежда толкова важно място.

Концепцията за представителност се използва, разбира се, не само в политическите изследвания. Терминът почти винаги се използва, когато говорим за големи изследвания, независимо дали в областта на маркетинга, икономическото поведение или образованието.

Методология на представителните проучвания

Как след проучване на 1500 души може да се направят изводи за всички руснаци, които са повече от 140 милиона (и дори гласоподаватели повече от 110 милиона)? Технологията зад представителните анкети се основава на статистически закони. Най-близката причина е законът за големите числа или теоремата на Бернули.

Опростено, значението му може да се предаде по следния начин. Да предположим, че имаме някаква характеристика, например количеството на валежите на ден в Екатеринбург през 20 век. Ако напишем всички негови стойности заедно с тяхната честота (това се нарича разпределение) и след това произволно вземем достатъчно голям брой случаи (тоест не всички дни през двадесети век, но доста), тогава ще видим, че разпределението в нашата извадка ще бъде много подобно на разпределението за целия двадесети век. По този начин, ако изберем някои единици от съвкупността, те наистина могат да представляват цялата съвкупност и всъщност не е необходимо да се събират данни за всички случаи.

Има обаче едно ключово условие: това е вярно само ако изборът е строго случаен. Единственият проблем тук може да бъде отклонението от случайността. Така че, ако вземем само данни за валежите за последните години (например, защото тези данни се намират по-лесно) или интервюираме 1500 наши познати (защото е по-лесно да се свържем с тях), а не случайни хора, тогава извадката със сигурност няма да бъде представителен.

Представете си, че от 143,5 милиона руснаци избирате произволно 1500 души, от които се нуждаете. Тогава, например, делът на средните мениджъри сред тях ще бъде приблизително равен на дела на средните мениджъри в общата съвкупност, което показва, че вашата извадка може да представлява цялата съвкупност. Може ли да се случи тези два показателя да са много различни? Например сред руснаците е 14%, но в извадката ще бъде само 1%? Теоретично това е възможно, но вероятността за това е толкова малка, че може да бъде пренебрегната (като среща с дракон на улицата).

Освен това най-приятното в тази вероятност дори не е, че е малка, а че за случайни процеси тази вероятност може да бъде изчислена. Можем да кажем с каква вероятност стойността на нашата извадка ще се отклони от стойността в генералната съвкупност с 13% (както в примера по-горе) и с каква, да речем, с 2,5%. Обикновено обаче те правят обратното: първо определят вероятността, с която искаме нашата стойност да не се отклонява от стойността в общата съвкупност (най-често тя е фиксирана на ниво от 95%), а след това разглеждат големината на отклонението за проби с определен размер. Това отклонение се нарича доверителен интервал, понякога наричан извадкова грешка или статистическа грешка, и често се посочва заедно с резултатите от проучването.

И така, вероятността за отклонение, количеството на отклонението (доверителният интервал) и размерът на извадката са свързани. Въз основа на това формулата за изчисляване на размера на извадката е следната:

където n е размерът на извадката, Δ е доверителният интервал, z е стойността на функцията на нормалното разпределение за дадена вероятност за отхвърляне (за вероятност от 5%, тази стойност е 1,96).

Това е опростена формула, реалните проучвания използват малко по-сложни формули. Тази формула също може да се провали, ако стойността на индикатора е много различна от 50% (така например тази формула не е подходяща за оценка на дела на пациентите с рядко заболяване в дадена страна).

Ето какво се случва, ако замените някои стойности в тази формула:

С други думи, ако вземем произволна извадка от руснаци с размер от 1600 души и изчислим някакъв показател, например желанието да гласуват за определен политик, тогава с вероятност от 95% нашата оценка няма да се различава от желанието да гласуват за него сред всички руснаци с повече от 2, 45%.

Размер на извадката

Така че, колкото по-голям е размерът на извадката, толкова по-вероятно е да сме по-близо до дял в популацията. Изглежда, че това означава, че трябва да се опитаме да доближим извадката до 143,5 млн. Всъщност, както можете да видите от таблицата, природата на случайните процеси е такава, че от определен момент вероятността да попаднат в интервала започва да се увеличава много бавно (и този момент идва доста бързо). След като вземем извадка от 1500 единици, без значение колко увеличаваме размера на извадката, вероятността стойността на нашата извадка да попадне в стойността на съвкупността ще нараства много, много бавно.

Всъщност почти няма разлика между 1500 и 10 000 анкетирани. Някъде към 1500 г. вече можем да кажем, че нашите оценки ще се различават от дела в общата съвкупност с 2-3%. Ако увеличим допълнително извадката, тогава тази възможна грешка ще намалее, но много леко. С други думи, извадка от 100 000 е по-добра от извадка от 2500, но разликата е толкова малка, че няма смисъл и в случая на социални проучвания не е икономически оправдана. Обикновено увеличаването на извадката е скъпо и следователно няма смисъл да се увеличава, за да спечели един процентен пункт в стойността на доверителния интервал.

Важно е размерът на генералната съвкупност изобщо да не фигурира във формулата. Факт е, че когато популацията е голяма (повече от 20 000), това почти няма ефект върху размера на извадката. По този начин не е необходимо да знаем колко хора живеят в Русия, за да изградим представителна извадка. Ясно е, че изборът на 1500 от 2000 най-вероятно няма смисъл - по-лесно е да разгледате 2000 и да получите точна оценка. Но, ако е необходимо, като направим извадка, получаваме възможност да обобщим резултатите от нея за общата съвкупност. И поради същата причина размерът на извадката няма да се различава за големите и малките страни.

Представителност и точност

За да разберем значението на понятието „представителност“, нека разгледаме извадка от 15 души. Колкото и да е странно, ако сте го направили случайно, той също е представителен. Освен това можете да направите проба от една единица. Представете си кутия с топки, от която на случаен принцип изтегляте една топка. Ако това е произволно избрана топка, тогава тя също ще представлява всички топки, които са в тази кутия. Той просто ще ги представлява. не точно. Защо? Защото има много голяма вероятност да сгрешите. Следващият път можем да изтеглим друга топка и да добием различна представа за топките в кутията. Да представиш неточно означава да имаш широк диапазон от оценки.

По същия начин 15 души представляват всяка генерална съвкупност, но те я представят неточно, защото грешката, доверителният интервал, е много голяма. Ще трябва да добавим +/- 33%, за да получим 95% шанс да попаднем в интервала. Ако сме готови да признаем това, тогава вземаме 15 души, откриваме, че 7 от тях са средни мениджъри и тогава получаваме оценка, че 7/15 от общия брой, тоест 47% +/- 33%, е прогнозния дял на мениджърите в общата съвкупност и това е абсолютно правилен извод. Просто няма стойност. Това можем да кажем и без проверка. Следователно, когато планирате извадка, има смисъл да постигнете обем, който ще бъде подходящ от гледна точка на рентабилност.

Всичко по-горе има за цел да предаде една проста идея, която много често не се реализира: размерът на извадката не е свързан с нейната представителност.

Малка извадка е неточна, но все пак може да бъде представителна. Размерите на извадката, които се използват днес в масови проучвания в Русия, почти винаги имат доста висока точност.

Представителността на извадката е застрашена не от нейния размер, а от пристрастност, тоест отклонение от принципа на случайността.

Нарушаване на принципа на случайността

Ако започнем да избираме единици неслучайно, извадката става непредставителна. Например, ако нещо ни пречи да ги изберем на случаен принцип. Представете си, че искаме да изберем произволно топки от нашата кутия, но след това се оказва, че някои от топките хапят. Механизмът, по който ще вземем само тези топчета, които са ни дадени, е механизъм, който нарушава произволността и следователно нарушава представителността. В този случай, колкото и топчета да вземем от кутията (дори да вземем всички топчета, които не хапят), ще имаме непредставителна извадка, защото няма да броим нито едно от хапещите - те просто заобикалят нашата извадка.

Най-големият проблем с хапещите топки е, че те могат да бъдат различни от тези, които идват в ръцете ни, и се различават точно по начина, по който ни интересува. Тази ситуация се нарича отклонение на извадката.

Необходимо е да се разграничи ситуацията на неточно представителство, която описахме по-горе, от ситуацията на непредставителство. Това са различни проблеми и те имат различни решения. Не можете да разрешите едно от тях, като решите другото. Ако извадката не е представителна, няма смисъл да се увеличава. Освен това големите извадки в социалните проучвания са склонни да натрупват грешки, така че проблемът с представителството може само да се изостри от голямо увеличение на размера на извадката.

Защо представителността е невъзможна?

В бележките към таблиците с резултатите от проучванията често може да се види, че „размерът на извадката е 1600 души, извадката е представителна по пол и възраст“. От казаното по-горе е очевидно, че това са два различни параметъра: индикацията за представителност не е свързана с размера на извадката. Всъщност тук се има предвид, че са следвани определени процедури, за да се гарантира съответствието между извадката и популацията. Например, за да се осигури представителност по пол, мъжете и жените се набират в извадката в същите пропорции, които съществуват сред руснаците според данните от преброяването. Но представителност по пол не означава представителност, например, по политически възгледи.

Защо е необходимо извадката да се подравнява по пол и други социално-демографски категории? Защото само случайна извадка може да осигури истинска представителност, а тя е невъзможно да се приложи на практика по много причини. Веднага щом се опитате да направите това, ще се натъкнете на много проблеми - без значение кой метод изберете да използвате. Някои респонденти изобщо няма да бъдат достъпни за вашия метод (например за лични интервюта домовете с домофони и охрана са голям проблем), друга част ще отсъстват, няма да отговарят или ще предпочетат да се занимават с работата си. Има хора, които имат езикови проблеми и не могат да говорят с нас. Има хора, които не разбират защо е необходимо това и не искат да говорят с нас. Всичко това са сериозни нарушения на случайността, които правят реализацията й невъзможна.

Тези, които свеждат проблема с представителността в масовите проучвания до статистика, забравят, че хората са много специфични топчета. Има топки, които бягат и се крият. Има топки, които хапят. Те не са пасивни обекти, те отвръщат на удара. Те казват: „Не искам да участвам във вашето проучване“, като по този начин нарушават случайността. Следователно, в тесния смисъл на думата, представителността в масовите проучвания, разбира се, е невъзможна под каквато и да е форма.

Разработен е механизъм, чрез който обикновено се осигурява видимостта на представителността: подравняваме извадката в някои категории и се преструваме, че тя също е подравнена във всички други възможни категории. Всъщност нямаме причина да твърдим това. Но проблемът е, че това няма как да се провери - пак поради факта, че някои топки хапят. За да провери за пристрастност, изпитващият трябва да отиде при тези, които не сме интервюирали, и да ги интервюира. Но те, както си спомняме, изобщо не искат да бъдат разпитвани. Невъзможно е да се разпитват тези, които категорично не отговарят. Следователно всички работят с предположението, че ако изравним извадката по два или три параметъра, тя представлява цялата популация, въпреки че няма сериозна основа за това предположение.

Представителната извадка е технология, заимствана от социолозите от статистиката. Следователно то неизбежно носи елементи от математико-статистическата картина на света. Може би най-силното предположение е, че самото извадково изследване е политически и социологически неутрално: участието и неучастието в изследването не носи политически смисъл и не е свързано с други социологически важни параметри. Но днес анкетите се превърнаха в една от основните политически институции и се превърнаха в ключов посредник между големите корпорации и потребителите. При тези условия вече не е възможно да се вярва в тяхната политическа стерилност. Все още обаче знаем малко за това как се разбират анкетите в съвременните общества и какво всъщност представляват.

Общият брой обекти на наблюдение (хора, домакинства, предприятия, населени места и др.) с определен набор от характеристики (пол, възраст, доход, брой, оборот и др.), ограничен в пространството и времето. Примери за население

  • Всички жители на Москва (10,6 милиона души според преброяването от 2002 г.)
  • Московски мъже (4,9 милиона според преброяването от 2002 г.)
  • Руски юридически лица (2,2 милиона в началото на 2005 г.)
  • Търговски обекти за продажба на хранителни стоки (20 хил. в началото на 2008 г.) и др.

Извадка (извадкова популация)

Част от обектите от популацията, избрани за изследване, за да се направи заключение за цялата популация. За да може заключението, получено чрез изследване на извадката, да се разпространи върху цялата популация, извадката трябва да има свойството да бъде представителна.

Представителност на извадката

Свойството на извадката да отразява правилно генералната съвкупност. Една и съща извадка може или не може да бъде представителна за различни популации.
Пример:

  • Извадка, състояща се изцяло от московчани, които притежават кола, не представлява цялото население на Москва.
  • Извадката от руски предприятия с до 100 служители не представлява всички предприятия в Русия.
  • Извадката от московчани, които правят покупки на пазара, не представя покупателното поведение на всички московчани.

В същото време тези проби (при други условия) могат перфектно да представят московските собственици на автомобили, съответно малки и средни руски предприятия и купувачи, които правят покупки на пазарите.
Важно е да се разбере, че представителността на извадката и грешката на извадката са различни явления. Представителността, за разлика от грешката, не зависи от размера на извадката.
Пример:
Колкото и да увеличим броя на анкетираните московчани-собственици на автомобили, няма да можем да представим всички московчани с тази извадка.

Грешка на извадката (доверителен интервал)

Отклонението на резултатите, получени с помощта на извадково наблюдение, от истинските данни на генералната съвкупност.
Има два вида грешки на извадката: статистическа и систематична. Статистическата грешка зависи от размера на извадката. Колкото по-голям е размерът на извадката, толкова по-малък е той.
Пример:
За проста произволна извадка от 400 единици максималната статистическа грешка (с 95% сигурност) е 5%, за извадка от 600 единици - 4%, за извадка от 1100 единици - 3%.
Систематичната грешка зависи от различни фактори, които оказват постоянно влияние върху изследването и отклоняват резултатите от изследването в определена посока.
Пример:

  • Използването на каквато и да е вероятностна извадка подценява дела на хората с високи доходи, които са активни. Това се дължи на факта, че такива хора са много по-трудни за намиране на определено място (например у дома).
  • Проблемът с респондентите, които отказват да отговарят на въпроси (делът на „отказниците“ в Москва за различни проучвания варира от 50% до 80%)

В някои случаи, когато са известни истинските разпределения, пристрастията могат да бъдат изравнени чрез въвеждане на квоти или повторно претегляне на данните, но в повечето реални проучвания дори оценяването може да бъде доста проблематично.

Примерни типове

Пробите са разделени на два вида:

  • вероятностен
  • невероятност

1. Вероятностни проби
1.1 Случайна извадка (прост произволен избор)
Такава извадка предполага хомогенността на генералната съвкупност, същата вероятност за наличност на всички елементи, наличието на пълен списък на всички елементи. При избора на елементи по правило се използва таблица с произволни числа.
1.2 Механично (систематично) вземане на проби
Един вид произволна извадка, сортирана по някакъв признак (азбучен ред, телефонен номер, дата на раждане и др.). Първият елемент се избира произволно, след което всеки „k'-ти елемент се избира на стъпки от „n“. Размерът на генералната съвкупност, докато - N=n*k
1.3 Стратифицирани (зонирани)
Използва се в случай на хетерогенност на генералната съвкупност. Генералната съвкупност е разделена на групи (страти). Във всяка страта селекцията се извършва на случаен принцип или механично.
1.4 Серийно (вложено или клъстерно) вземане на проби
При серийно вземане на проби единиците за селекция не са самите обекти, а групи (клъстери или гнезда). Групите се избират на случаен принцип. Обектите в групите се изследват навсякъде.

2. Невероятни мостри
Подборът в такава извадка се извършва не по принципите на случайността, а по субективни критерии - достъпност, типичност, равно представителство и др.
2.1. Квотна извадка
Първоначално се разпределят определен брой групи обекти (например мъже на възраст 20-30 години, 31-45 години и 46-60 години; лица с доход до 30 хиляди рубли, с доход от 30 до 60 рубли). хиляди рубли и с доход над 60 хиляди рубли ) За всяка група е посочен броят на обектите, които ще бъдат изследвани. Броят на обектите, които трябва да попаднат във всяка от групите, се определя най-често или пропорционално на предварително известния дял на групата в генералната съвкупност, или еднакъв за всяка група. В рамките на групите обектите се избират на случаен принцип. Квотната извадка се използва доста често.
2.2. Метод на снежна топка
Пробата е конструирана по следния начин. Всеки респондент, като се започне от първия, е помолен да се свърже със своите приятели, колеги, познати, които отговарят на условията за подбор и биха могли да участват в проучването. Така, с изключение на първата стъпка, извадката се формира с участието на самите обекти на изследване. Методът често се използва, когато е необходимо да се намерят и интервюират труднодостъпни групи от респонденти (например респонденти с високи доходи, респонденти, принадлежащи към същата професионална група, респонденти, които имат сходни хобита / страсти и др. )
2.3 Спонтанно вземане на проби
Анкетират се най-достъпните респонденти. Типични примери за спонтанни извадки са във вестници/списания, дадени на респондентите за самостоятелно попълване, повечето интернет проучвания. Размерът и съставът на спонтанните извадки не е предварително известен и се определя само от един параметър – активността на респондентите.
2.4 Примерни типични случаи
Избират се единици от генералната съвкупност, които имат средна (типична) стойност на признака. Това повдига проблема с избора на характеристика и определянето на нейната типична стойност.

Курс лекции по теория на статистиката

По-подробна информация за примерни наблюдения можете да получите чрез разглеждане.

Елементи, които се обхващат от експеримента (наблюдение, анкета).

Примерни характеристики:

  • Качествени характеристики на извадката - какво точно избираме и какви методи за вземане на проби използваме за това.
  • Количествената характеристика на извадката е колко случая избираме, с други думи, размерът на извадката.

Необходимост от вземане на проби:

  • Обектът на изследване е много широк. Например, потребителите на продуктите на една глобална компания са огромен брой географски разпръснати пазари.
  • Има нужда от събиране на първична информация.

Енциклопедичен YouTube

    1 / 5

    ✪ Пример: изчисляване на обема. Надеждност и сила на изследването. Биостатистика.

    ✪ 02 - Мат. статистика. Примерно пространство. Примери

    ✪ Основи на SQL за начинаещи | Извличане на стойности от базата данни

    ✪ SQL за начинаещи (DML): Избор от таблица (MySql), Урок 4!

    ✪ Производство на SIP панели. Част 2. Рязане и къдраво рязане. Избор на жлебове. Всичко в ума

    субтитри

Размер на извадката

Размер на извадката - броя на случаите, включени в извадката.

Извадките могат условно да бъдат разделени на големи и малки, тъй като в зависимост от размера на извадката се използват различни подходи в математическата статистика. Смята се, че проби, по-големи от 30, могат да бъдат класифицирани като големи.

Зависими и независими проби

При сравняване на две (или повече) проби, тяхната зависимост е важен параметър. Ако е възможно да се установи хомоморфна двойка (т.е. когато един случай от проба X съответства на един и само един случай от проба Y и обратно) за всеки случай в две проби (и тази основа на връзка е важна за чертата измерени в пробите), такива проби се наричат зависим. Примери за зависими селекции:

  • двойка близнаци
  • две измервания на всяка характеристика преди и след експериментална експозиция,
  • съпрузи и съпруги
  • и така нататък.

Ако няма такава връзка между пробите, тогава тези проби се вземат предвид независима, Например:

  • мъже и жени ,
  • психолози и математици.

Съответно зависимите проби винаги имат еднакъв размер, докато размерът на независимите проби може да се различава.

Пробите се сравняват с помощта на различни статистически критерии:

  • Критерий на Пиърсън (χ 2)
  • Критерий Ученик ( T )
  • критерий на Уилкоксън ( T )
  • Критерий Ман - Уитни ( U )
  • Критериални знаци ( Ж )
  • и т.н.

Представителност

Извадката може да се счита за представителна или непредставителна. Извадката ще бъде представителна при изследване на голяма група хора, ако в рамките на тази група има представители на различни подгрупи, само по този начин могат да се направят правилни заключения.

Пример за непредставителна извадка

  1. Изследване с експериментални и контролни групи, които са поставени в различни условия.
    • Проучете с експериментални и контролни групи, като използвате стратегия за подбор на двойки
  2. Проучване, като се използва само една група - експериментална.
  3. Изследване по смесен (факториален) план – всички групи са поставени в различни условия.

Примерни типове

Пробите са разделени на два вида:

  • вероятностен
  • невероятност

Вероятностни проби

  1. Проста вероятностна извадка:
    • Просто повторно вземане на проби. Използването на такава извадка се основава на предположението, че всеки респондент е еднакво вероятно да бъде включен в извадката. Въз основа на списъка на генералната съвкупност се съставят карти с броя на респондентите. Те се поставят в тесте, разбъркват се и от тях се изважда карта на случаен принцип, записва се число, след което се връща обратно. Освен това процедурата се повтаря толкова пъти, колкото е необходимият размер на пробата. Минус: повторение на единиците за избор.

Процедурата за конструиране на проста произволна извадка включва следните стъпки:

1) необходимо е да се получи пълен списък на членовете на общото население и да се номерира този списък. Такъв списък, припомнете си, се нарича рамка за вземане на проби;

2) определяне на очаквания размер на извадката, т.е. очаквания брой респонденти;

3) извлечете толкова числа от таблицата със случайни числа, колкото са ни необходими примерни единици. Ако извадката трябва да включва 100 души, от таблицата се вземат 100 произволни числа. Тези произволни числа могат да бъдат генерирани от компютърна програма.

4) изберете от основния списък онези наблюдения, чиито номера съответстват на написаните произволни числа

  • Простата произволна извадка има очевидни предимства. Този метод е изключително лесен за разбиране. Резултатите от изследването могат да бъдат разширени до изследваната популация. Повечето подходи за статистически изводи включват събиране на информация с помощта на проста произволна извадка. Простият метод на произволна извадка обаче има поне четири съществени ограничения:

1) често е трудно да се създаде рамка за вземане на проби, която би позволила проста произволна извадка.

2) резултатът от прилагането на проста произволна извадка може да бъде голяма популация или популация, разпределена в голяма географска област, което значително увеличава времето и разходите за събиране на данни.

3) резултатите от прилагането на проста случайна извадка често се характеризират с ниска точност и по-голяма стандартна грешка, отколкото резултатите от прилагането на други вероятностни методи.

4) в резултат на прилагането на СРС може да се образува непредставителна извадка. Въпреки че извадките, получени чрез обикновен случаен подбор, средно адекватно представят общата популация, някои от тях изключително неправилно представят изследваната популация. Вероятността за това е особено висока при малък размер на извадката.

  • Обикновено неповтарящо се вземане на проби. Процедурата за конструиране на извадката е същата, само че картите с номерата на респондентите не се връщат обратно в тестето.
  1. Систематична вероятностна извадка. Това е опростена версия на проста вероятностна извадка. Въз основа на списъка на генералната съвкупност се избират респонденти на определен интервал (K). Стойността на K се определя произволно. Най-надеждният резултат се постига с хомогенна генерална съвкупност, в противен случай размерът на стъпката и някои вътрешни циклични модели на извадката може да съвпаднат (смесване на пробата). Недостатъци: същото като при проста вероятностна извадка.
  2. Серийно (вложено) вземане на проби. Извадковите единици са статистически серии (семейство, училище, екип и др.). Избраните елементи се подлагат на непрекъснато изследване. Изборът на статистически единици може да бъде организиран според вида на случайна или систематична извадка. Минуси: Възможност за по-голяма хомогенност, отколкото в общата популация.
  3. Зонирана проба. В случай на хетерогенна популация, преди да се използва вероятностна извадка с която и да е техника за подбор, се препоръчва популацията да се раздели на хомогенни части, такава извадка се нарича зонирана извадка. Групите за зониране могат да бъдат както природни образувания (например градски квартали), така и всяка характеристика, която е в основата на изследването. Признакът, въз основа на който се извършва разделянето, се нарича признак на стратификация и райониране.
  4. "Удобна" селекция. Процедурата за вземане на проби "удобство" се състои в установяване на контакти с "удобни" единици за вземане на проби - с група ученици, спортен отбор, с приятели и съседи. Ако е необходимо да се получи информация за реакциите на хората към нова концепция, такава извадка е напълно разумна. „Удобната“ извадка често се използва за предварително тестване на въпросници.

Невероятни мостри

Подборът в такава извадка се извършва не по принципите на случайността, а по субективни критерии - достъпност, типичност, равно представителство и др.

  1. Квотна извадка - извадката се изгражда като модел, който възпроизвежда структурата на генералната съвкупност под формата на квоти (пропорции) на изследваните характеристики. Броят на елементите на извадката с различна комбинация от изследваните характеристики се определя по такъв начин, че да съответства на техния дял (пропорция) в генералната съвкупност. Така например, ако имаме общо население от 5000 души, от които 2000 жени и 3000 мъже, тогава в квотната извадка ще имаме 20 жени и 30 мъже, или 200 жени и 300 мъже. Квотните извадки най-често се основават на демографски критерии: пол, възраст, регион, доход, образование и др. Минуси: обикновено такива проби не са представителни, тъй като е невъзможно да се вземат предвид няколко социални параметъра наведнъж. Плюсове: лесно достъпен материал.
  2. Метод на снежна топка. Пробата е конструирана по следния начин. Всеки респондент, като се започне от първия, е помолен да се свърже със своите приятели, колеги, познати, които отговарят на условията за подбор и биха могли да участват в проучването. Така, с изключение на първата стъпка, извадката се формира с участието на самите обекти на изследване. Методът често се използва, когато е необходимо да се намерят и интервюират труднодостъпни групи от респонденти (например респонденти с високи доходи, респонденти, принадлежащи към същата професионална група, респонденти, които имат сходни хобита / страсти и др. )
  3. Спонтанно вземане на проби - вземане на проби от т. нар. "първият попаднал". Често се използва в телевизионни и радио анкети. Размерът и съставът на спонтанните извадки не е предварително известен и се определя само от един параметър – активността на респондентите. Недостатъци: невъзможно е да се установи каква генерална съвкупност представляват респондентите и в резултат на това е невъзможно да се определи представителността.
  4. Маршрутно проучване - често се използва, ако единицата за изследване е семейството. На картата на населеното място, в което ще се извършва проучването, всички улици са номерирани. С помощта на таблица (генератор) на произволни числа се избират големи числа. Всяко голямо число се счита за състоящо се от 3 компонента: номер на улица (2-3 първи числа), номер на къща, номер на апартамент. Например числото 14832: 14 е номерът на улицата на картата, 8 е номерът на къщата, 32 е номерът на апартамента.
  5. Зонирано вземане на проби с избор на типични обекти. Ако след зониране от всяка група е избран типичен обект, т.е. обект, който се доближава до средното за повечето от характеристиките, изследвани в изследването, такава извадка се нарича зонирана с избора на типични обекти.
  6. модален избор.
  7. Експертна проба.
  8. хетерогенна проба.

Стратегии за изграждане на група

Подборът на групи за тяхното участие в психологически експеримент се извършва с помощта на различни стратегии, които са необходими, за да се осигури възможно най-голямо съответствие с вътрешната и външната валидност.

Рандомизиране

Рандомизиране, или случаен избор, се използва за създаване на прости произволни проби. Използването на такава извадка се основава на предположението, че всеки член на популацията е еднакво вероятно да бъде включен в извадката. Например, за да направите произволна извадка от 100 студенти, можете да поставите парчета хартия с имената на всички студенти в шапка и след това да извадите 100 листа от нея - това ще бъде случаен избор (Гудуин Дж. , стр. 147)......

Избор по двойки

Избор по двойки- стратегия за конструиране на извадкови групи, при която групи от субекти са съставени от субекти, еквивалентни по странични параметри, които са значими за експеримента. Тази стратегия е ефективна за експерименти, използващи експериментални и контролни групи с най-добрия вариант - привличане на двойки близнаци (моно - и дизиготни).

Стратометрична селекция

Стратометрична селекция- рандомизиране с разпределяне на страти (или клъстери). С този метод на извадка генералната съвкупност се разделя на групи (страти) с определени характеристики (пол, възраст, политически предпочитания, образование, ниво на доходи и т.н.) и се избират субекти със съответните характеристики.

Приблизително моделиране

Приблизително моделиране- изготвяне на ограничени извадки и обобщаване на заключенията за тази извадка за по-широка популация. Например, когато участвате в проучване на студенти от 2-ра година на университета, данните от това проучване се разширяват до „хора на възраст от 17 до 21 години“. Допустимостта на подобни обобщения е изключително ограничена.

Приблизителното моделиране е формирането на модел, който за ясно дефиниран клас системи (процеси) описва неговото поведение (или желани явления) с приемлива точност.

проба - Това:

1) съвкупността от тези елементи на обекта на изследване, които ще бъдат пряко изследвани;

2) методи и процедури за избор на елементи от обекта на изследване.

Население - пълен набор от обекти, свързани с изследвания проблем. В социологическите изследвания като G.S. най-често действат съвкупности от индивиди - населението (градове, държави и т.н.), социална група (младежи, безработни, бизнесмени и т.н.), аудиторията на средствата за масова информация (MSK) и т.н. Въпреки това, в много дела, Г.С. може да се състои от по-големи елементи (обекти) - семейства (домакинства), академични групи, предприятия, религиозни общности, отделни селища или държави и др.

Извадкова популация - част от обектите от генералната съвкупност, избрани за изследване, за да се направи заключение за цялата съвкупност.

За да може заключението, получено чрез изследване на извадката, да се разпространи върху цялата популация, извадката трябва да има свойството да бъде представителна.

Представителност е способността на извадката да представлява изследваната популация. Колкото по-точно съставът на извадката представя съвкупността по изследваните въпроси, толкова по-висока е нейната представителност.

ПРИМЕР: Представителността може да се илюстрира със следния пример. Да предположим, че населението е всички ученици на училището (600 души от 20 класа, по 30 души във всеки клас). Обект на изследване е отношението към тютюнопушенето. Извадка от 60 гимназисти представя съвкупността много по-зле от извадка от същите 60 души, която ще включва по 3 ученици от всеки клас. Основната причина за това е неравномерното възрастово разпределение в класовете. Следователно в първия случай представителността на извадката е ниска, а във втория случай представителността е висока (при други равни условия).

Примерни типове

1. Случайна извадка.

1.1 Прост произволен избор.

1.2 Методът на систематично (или механично) вземане на проби.

1.3 Серийно (вложено или клъстерно) вземане на проби.

1.4 Стратифицирана извадка.

2. Неслучайна извадка (невероятност).

2.2. случаен избор.

2.3. Многоетапно и едноетапно вземане на проби.

1. Случайна извадка.

Характеристика на случайната извадка е, че всички единици от генералната съвкупност имат еднаква вероятност да бъдат включени в извадката. За произволна извадка, принцип на случайността. Основата на извадката могат да бъдат списъци на служители на предприятието, телефонни указатели, регистрационни списъци на собственици на автомобили, списъци на избиратели в избирателни секции, домашни книги, както и различни списъци, съставени от самия социолог в зависимост от целите на изследването. (списък с улици, по които след това се извършва подборът на респондентите).

Случайната извадка обикновено се използва при проучвания на общественото мнение преди избори, референдуми и други обществени събития.

плюсна този метод е пълното спазване на принципа на случайността и в резултат на това избягването на систематични грешки.

Недостатъци на този метод:

– Необходимостта от списък на елементите на населението.

- Трудност при провеждане на анкетата.

– Относително голям размер на извадката.



Скорошни статии в раздела:

Значението на Федор Василиевич Чижов в кратка биографична енциклопедия В центъра на бизнес Русия
Значението на Федор Василиевич Чижов в кратка биографична енциклопедия В центъра на бизнес Русия

Днес, когато споровете за Русия и руснаците се водят с такава ожесточеност, е неизбежно да се обърнем към живота и идеите на Ф. В. Чижов, физик и...

СССР: с какво се гордееха съветските хора и за какво не им се казваше
СССР: с какво се гордееха съветските хора и за какво не им се казваше

На 30 декември 1922 г. на Първия всесъюзен конгрес на Съветите ръководителите на делегациите подписват Договора за образуване на СССР. Първоначално СССР включваше ...

Платон и неговата академия Какво е академията на Платон
Платон и неговата академия Какво е академията на Платон

Близо до Атина, в горичка, посветена на героя Кадъм. Впоследствие тези философи се разминават във възгледи и посока и по този начин дават началото на по-късните ...