Показова вибірка. Вибірка, її типи та характеристика

Вибірка-це безліч даних, взятих за допомогою певних процедур з генеральної сукупності для дослідницького аналізу. Репрезентативність - це властивість відтворення ставлення до цілому з його частини. Інакше, це можливість поширення ставлення до частини на ціле, яке цю частину включає у собі.

Репрезентативність вибірки - це показник, який полягає в тому, що вибірка має повно і достовірно відображати ознаки тієї сукупності, частиною якої вона є. Її також можна визначати як властивість вибірки найповніше представляти характеристики генеральної сукупності, суттєві з погляду мети дослідження.

Припустимо, що генеральна сукупність — усі учні школи (900 осіб із 30 класів, по 30 осіб у кожному класі). Об'єкт дослідження – ставлення школярів до куріння. Вибіркова сукупність, що складається з 90 учнів, лише набагато гірше представить усю сукупність, ніж вибірка з тих самих 90 учнів, куди б увійшли з кожного класу по 3 учні. Головна причина – нерівний розподіл за віком. Таким чином, у першому випадку репрезентативність вибірки буде низькою. У другому випадку – високою.

У соціології кажуть, що існує репрезентативність вибірки та її нерепрезентативність.

Як приклад нерепрезентативної вибірки можна навести класичний випадок, що стався 1936 року у США під час президентських виборів.

Журнал «Літерарі дайджест», який до цього дуже успішно прогнозував результати попередніх виборів, цього разу помилився у своїх прогнозах, хоча розіслав кілька мільйонів письмових питань передплатникам, а також респондентам, яких вони обрали з телефонних книг та зі списків реєстрації автомобілів. У 1/4 бюлетенів, які повернулися заповнені назад, голоси розподілилися наступним чином: 57% віддали першість кандидату від республіканців на ім'я Альф Лендон, а 41% віддали перевагу чинному президенту - демократу Франкліну Рузвельту.

Насправді на виборах переміг Ф. Рузвельт, який набрав майже 60% голосів. Помилка «Літерарі дайджест» була наступною. Вони захотіли збільшити репрезентативність вибірки . А оскільки вони знали, що більшість їхніх передплатників відносять себе до республіканців, то вони вирішили розширити вибірку за рахунок респондентів, які вони вибрали з телефонних книг та автомобільних реєстраційних списків. Але вони не врахували існуючих реалій і фактично відібрали ще більше прихильників республіканців, бо за часів мати автомобілі та телефони міг дозволити собі середній та вищий клас. А це й були переважно республіканці, а не демократи.

Існують різні види вибірки: проста випадкова, серійна, типова, механічна та комбінована.

Проста випадкова вибірка полягає у відборі з усієї сукупності досліджуваних одиниць навмання без будь-якої системи.

Механічну вибірку застосовують тоді, коли у генеральній сукупності є впорядкованість, наприклад, є певна послідовність одиниць працівників, виборчі списки, номери телефонів респондентів, номери квартир та будинків та інше).

Типовий відбір використовується тоді, коли всю сукупність можна поділити на групи за типами. Працюючи з населенням такими можуть бути, наприклад, освітні, вікові, соціальні групи, щодо підприємств - галузь чи окрема організація та інших.

Серійний відбір зручний тоді, коли одиниці об'єднані у невеликі серії чи групи. Такою серією можуть бути партії готової продукції, шкільні класи та інші групи.

Комбінована вибірка передбачає використання всіх попередніх видів вибірки у тій чи іншій комбінації.

Поняття «репрезентативність» стосовно соціологічних опитувань - опитувань громадської думки - має майже магічну дію на людей. Сам термін «репрезентація» має, крім наукового, ще й явно політичне значення.

В чому причина? Вся справа в тому, що передбачається, що вибірка (група людей, відібрана для опитування) може представляти всю генеральну сукупність. Генеральною сукупністю у разі загальноросійських опитувань є населення країни. Тепер уявімо, що йдеться про політичне рішення - підтримку законопроекту чи голосування на виборах. За допомогою вибіркового опитування ми отримуємо відмінний механізм політичної репрезентації – механізм, у якому невелика група людей може представляти думку чи позицію населення країни. Тому репрезентативності дослідження приділяється таке важливе місце.

Поняття репрезентативності використовується, зрозуміло, у політичних дослідженнях. Термін застосовується практично завжди, коли йдеться про великі дослідження, чи то у сфері маркетингу, економічної поведінки чи освіти.

Методологія репрезентативних опитувань

Як, опитавши 1500 осіб, можна робити висновки про всіх росіян, яких понад 140 мільйонів (і навіть виборців понад 110 мільйонів)? Технологія, яка стоїть за репрезентативними опитуваннями, ґрунтується на статистичних законах. Найближчою підставою є закон великих чисел, або теорема Бернуллі.

Спрощено його зміст можна передати так. Припустимо, ми маємо деяку ознаку, наприклад кількість опадів за день в Єкатеринбурзі протягом ХХ століття. Якщо ми випишемо всі його значення разом із їх частотою (це називається розподілом), а потім випадково візьмемо досить велику кількість випадків (тобто не всі дні у ХХ столітті, але досить багато), то ми побачимо, що розподіл у нашій вибірці буде дуже схожим на розподіл за все ХХ століття. Таким чином, якщо ми відбираємо із сукупності деякі одиниці, вони справді можуть представляти всю сукупність, і насправді немає необхідності збирати дані з усіх випадків.

Однак є ключова умова: це правильно, тільки якщо проводити відбір суворо випадковим чином. Єдиною проблемою може бути відхилення від випадковості. Так, якщо ми візьмемо лише дані щодо опадів за останні роки (наприклад, тому що ці дані простіше знайти) або опитаємо 1500 своїх знайомих (бо з ними простіше зв'язатися), а не випадкових людей, то вибірка, звичайно, не буде репрезентативною.

Уявіть, що з 143,5 мільйонів росіян ви випадково відбираєте необхідні вам 1500 чоловік. Тоді, наприклад, частка менеджерів середньої ланки серед них приблизно дорівнює частці менеджерів середньої ланки в генеральній сукупності, що і показує, що ваша вибірка може представляти всю сукупність. Чи може так вийти, що ці два показники сильно відрізнятимуться? Наприклад, серед росіян він становить 14%, а у вибірці він становитиме лише 1%? Теоретично це можливо, проте ймовірність цього настільки мала, що її можна знехтувати (приблизно як зустріти дракона на вулиці).

Більш того, найприємніше в цій ймовірності навіть не те, що вона мала, а те, що для випадкових процесів цю ймовірність можна обчислити. Ми можемо сказати, з якою ймовірністю наше вибіркове значення відхилиться від значення в генеральній сукупності на 13% (як у прикладі вище), а з якою, скажімо, на 2,5%. Зазвичай, втім, роблять навпаки: спочатку визначають ймовірність, з якої ми хочемо, щоб наше значення не відхилялося від значення в генеральній сукупності (найчастіше його фіксують на рівні 95%), а потім уже дивляться, яка величина відхилення при тому чи іншому розмірі вибірки. Це відхилення називається довірчим інтервалом, іноді його називають помилкою вибірки чи статистичної похибкою – його часто наводять поруч із результатами опитування.

Отже, ймовірність відхилення, величина відхилення (довірчий інтервал) та розмір вибірки пов'язані між собою. Виходячи з цього, формула для розрахунку розміру вибірки виглядає так:

де n – розмір вибірки, Δ – довірчий інтервал, z – значення функції нормального розподілу для даної ймовірності відхилення (для ймовірності 5% це значення становить 1,96).

Це спрощена формула, у реальних опитуваннях використовуються дещо складніші формули. Ця формула також може давати збій, якщо значення показника сильно відрізняється від 50% (тому, наприклад, ця формула не підійде для того, щоб оцінити частку хворих на рідкісне захворювання в країні).

Ось що буде, якщо підставити в цю формулу деякі значення:

Іншими словами, якщо ми взяли випадкову вибірку росіян розміром у 1600 осіб і оцінили якийсь показник, наприклад, готовність голосувати за певного політика, то з ймовірністю 95% наша оцінка не відрізнятиметься від готовності проголосувати за нього серед усіх росіян більш ніж на 2, 45%.

Розмір вибірки

Отже, чим більший розмір вибірки, тим більша ймовірність того, що ми будемо ближчими до частки в генеральній сукупності. Здавалося б, це означає, що нам потрібно намагатися наблизити вибірку до 143,5 млн. Насправді, як можна бачити з таблиці, природа випадкових процесів така, що з певного моменту можливість потрапити в інтервал починає підвищуватися дуже повільно (і цей момент настає доволі швидко). Після того як ми відбираємо 1500 одиниць, як би ми сильно не збільшували обсяг вибірки, ймовірність, що наше значення за вибіркою потрапить у значення за генеральною сукупністю, зростатиме дуже і дуже повільно.

Фактично різниці між 1500 та 10 000 опитаних майже немає. Десь до 1500 ми вже можемо говорити, що наші оцінки відрізнятимуться від частки в генеральній сукупності на 2–3%. Якщо ми збільшуємо вибірку далі, ця можлива помилка буде зменшуватися, але дуже незначно. Інакше кажучи, вибірка в 100 000 краще, ніж вибірка в 2500, але різниця настільки мала, що немає сенсу, а разі соціальних обстежень і економічно не обгрунтована. Зазвичай збільшення вибірки коштує дорого, і тому її немає сенсу роздмухувати заради того, щоб виграти один відсотковий пункт у розмірі довірчого інтервалу.

Важливо, що у формулі взагалі фігурує розмір генеральної сукупності. Справа в тому, що коли генеральна сукупність велика (понад 20 000), він практично не впливає на розмір вибірки. Таким чином, нам не потрібно знати, скільки людей живе в Росії, щоби побудувати репрезентативну вибірку. Зрозуміло, що вибирати 1500 із 2000, швидше за все, не має сенсу – простіше обстежити 2000 та отримати точну оцінку. Але, роблячи у разі потреби вибірку, ми маємо можливість узагальнювати її результати для генеральної сукупності. І з цієї ж причини розмір вибірки не відрізнятиметься для великих та маленьких країн.

Репрезентативність та точність

Щоб зрозуміти зміст поняття «репрезентативність», розглянемо вибірку в 15 осіб. Як не дивно, якщо ви зробили її випадково, вона також репрезентативна. Більше того, ви можете зробити вибірку на одну одиницю. Уявіть ящик з кулями, звідки ви випадково берете одну кулю. Якщо це випадково обрана куля, то вона теж буде репрезентувати всі кулі, що є в цій скриньці. Просто він буде репрезентувати їх неточно. Чому? Тому що є дуже велика можливість помилитися. Наступного разу ми можемо витягнути іншу кулю і отримати інше уявлення про кулі в ящику. Репрезентувати неточно означає мати велику кількість оцінок.

Так само і 15 осіб репрезентують будь-яку генеральну сукупність, але вони репрезентують її неточно, тому що похибка, довірчий інтервал дуже великі. Нам доведеться додавати +/- 33%, щоб отримати 95% ймовірності того, що ми потрапимо в інтервал. Якщо ми готові це допустити, то беремо 15 осіб, з'ясовуємо, що 7 з них – це менеджери середньої ланки, а далі отримуємо оцінку, що 7/15 від сукупності, тобто 47% +/- 33% – це і є оцінка частки менеджерів у генеральній сукупності, і це абсолютно коректний висновок. Просто він не має жодної цінності. Це ми могли сказати без обстеження. Тому, плануючи вибірку, має сенс досягати такого обсягу, який буде доцільним з погляду співвідношення витрат та ефективності.

Все сказане покликане донести одну просту думку, яку часто не усвідомлюють: обсяг вибірки не пов'язаний з її репрезентативністю.

Маленька вибірка неточна, але вона все одно може бути репрезентативною. Обсяги вибірок, які використовуються сьогодні в масових опитуваннях в Росії, майже завжди мають досить високу точність.

Погрожує репрезентативності вибірки не її обсяг, а зміщення, тобто відхилення від принципу випадковості.

Порушення принципу випадковості

Якщо ми починаємо вибирати одиниці невипадковим чином, вибірка стає нерепрезентативною. Наприклад, якщо щось заважає нам відбирати їх випадково. Уявімо, що ми хочемо відібрати кулі з нашого ящика випадковим чином, але тут виявляється, що частина куль кусається. Механізм, при якому ми братимемо лише ті кульки, які даються нам у руки, - це механізм, що порушує випадковість і тому порушує репрезентативність. В цьому випадку, скільки б ми кульок не взяли з ящика (навіть якщо ми візьмемо всі кульки, які не кусаються), у нас буде нерепрезентативна вибірка, тому що ми не врахуємо жодного з тих, що кусаються - вони просто пройдуть нашу вибірку .

Найбільша проблема з кулями, що кусаються, полягає в тому, що вони можуть відрізнятися від тих, які йдуть до нас в руки, і відрізнятися якраз за тією ознакою, яка нас цікавить. Така ситуація називається систематичною помилкою вибірки.

Потрібно відрізняти ситуацію неточної репрезентації, яку ми описали вище, від ситуації нерепрезентативності. Це різні проблеми, і вони мають різні способи вирішення. Не можна вирішити одну з них шляхом вирішення іншої. Якщо вибірці не вистачає репрезентативності, марно її збільшувати. Більше того, великі вибірки у соціальних обстеженнях мають властивість накопичувати помилки, тому за допомогою сильного збільшення вибірки проблему репрезентації можна лише посилити.

Чому репрезентативність неможлива

У примітках до таблиць з результатами опитувань часто можна побачити, що «обсяг вибірки становить 1600 осіб, вибірка репрезентативна за статтю та віком». Зі сказаного вище очевидно, що це два різні параметри: вказівка на репрезентативність не пов'язана з обсягом вибірки. Насправді тут мають на увазі те, що виконувались певні процедури, щоб забезпечити відповідність між вибіркою та генеральною сукупністю. Наприклад, щоб забезпечити репрезентативність за статтю, у вибірку набирають чоловіків і жінок у таких самих співвідношеннях, які існують серед росіян за даними перепису. Але репрезентативність за статтю не означає репрезентативності, наприклад, з політичних поглядів.

Чому доводиться вирівнювати вибірку за статтю та іншими соціально-демографічними категоріями? Тому що справжню репрезентативність може забезпечити лише випадкова вибірка, а реалізувати її практично неможливо з маси причин. Як тільки ви спробуєте це зробити, ви зіткнетеся з безліччю проблем - байдуже, яким методом ви захочете скористатися. Частина респондентів взагалі виявиться недоступною для вашого методу (скажімо, для особистих інтерв'ю великою проблемою є будинки з домофонами та охороною), ще частина буде відсутня, не відповідатиме або волітиме займатися своїми справами. Є люди, які мають мовні проблеми, і вони не можуть з нами говорити. Є люди, які не розуміють, навіщо це потрібно, і вони не хочуть говорити з нами. Все це - серйозні порушення випадковості, які унеможливлюють її реалізацію.

Ті, хто зводить проблему репрезентації у масових опитуваннях до статистики, забувають про те, що люди – це дуже специфічні кульки. Є кульки, які тікають та ховаються. Є кульки, які кусаються. Вони не пасивні об'єкти, вони дають здачу. Вони кажуть: "Я не хочу брати участь у твоєму опитуванні", тим самим порушують випадковість. Тому в строгому значенні слова репрезентативність у масових опитуваннях, звісно, неможлива у жодному вигляді.

Вироблено механізм, за допомогою якого зазвичай забезпечується видимість репрезентативності: ми вирівнюємо вибірку за деякими категоріями і робимо вигляд, що за рештою можливих категорій вона теж вирівняна. Насправді, у нас немає жодних підстав це стверджувати. Але проблема в тому, що немає і ніякої можливості це перевірити - знову ж таки через те, що деякі кульки кусаються. Щоб перевірити наявність систематичної помилки, перевіряльнику довелося б сходити до тих, кого ми не опитали, і опитати їх. Але вони, як ми пам'ятаємо, не хочуть, щоб їх опитували. Опитати тих, хто не відповідає категорично, неможливо. Тому всі працюють на припущенні, що якщо ми вирівняли вибірку за двома-трьома параметрами, вона репрезентує всю сукупність, хоча у цього припущення і немає жодних серйозних підстав.

Репрезентативна вибірка – технологія, запозичена соціологами зі статистики. Тому вона неминуче містить у собі елементи математико-статистичної картини світу. Мабуть, найсильніше припущення у тому, що саме собою вибіркове опитування політично і соціологічно нейтральний: що й неучасть у опитуванні несе у собі політичного сенсу і пов'язані з іншими соціологічно важливими параметрами. Але сьогодні опитування стали одним із головних політичних інститутів і перетворилися на ключового посередника між великими корпораціями та споживачами. У цих умовах вірити в їхню політичну стерильність уже неможливо. Однак ми, як і раніше, мало знаємо про те, як опитування розуміються в сучасних суспільствах і що вони насправді репрезентують.

Сумарна чисельність об'єктів спостереження (люди, домогосподарства, підприємства, населені пункти тощо), які мають певним набором ознак (стаття, вік, дохід, чисельність, оборот тощо.), обмежена у просторі та часі. Приклади генеральних сукупностей

Усі мешканці Москви (10,6 млн. осіб за даними перепису 2002 року)
Чоловіки-Москвичі (4,9 млн осіб за даними перепису 2002 року)
Юридичні особи Росії (2,2 млн. на початок 2005 року)
Роздрібні торгові точки, які здійснюють продаж продуктів харчування (20 тисяч початку 2008 року) тощо.

Вибірка (Вибіркова сукупність)

Частина об'єктів з генеральної сукупності, відібраних для вивчення, для того, щоб зробити висновок про всю генеральну сукупність. Для того щоб висновок, отриманий шляхом вивчення вибірки, можна було поширити на всю генеральну сукупність, вибірка повинна мати властивість репрезентативності.

Репрезентативність вибірки

Властивість вибірки коректно відбивати генеральну сукупність. Одна і та ж вибірка може бути репрезентативною та нерепрезентативною для різних генеральних сукупностей.
Приклад:

Вибірка, що повністю складається з москвичів, які володіють автомобілем, не представляє все населення Москви.
Вибірка з підприємств чисельністю до 100 людина не репрезентує всі підприємства Росії.
Вибірка з москвичів, які здійснюють покупки на ринку, не репрезентує купівельну поведінку всіх москвичів.

У той же час, зазначені вибірки (при дотриманні інших умов) можуть відмінно репрезентувати москвичів-автовласників, невеликі та середні російські підприємства та покупців, які купують на ринках відповідно.
Важливо розуміти, що репрезентативність вибірки та помилка вибірки – різні явища. Репрезентативність, на відміну від помилки, ніяк не залежить від розміру вибірки.
Приклад:
Як би ми не збільшували кількість опитаних москвичів-автовласників, ми не зможемо репрезентувати цією вибіркою всіх москвичів.

Помилка вибірки (довірчий інтервал)

Відхилення результатів, одержаних за допомогою вибіркового спостереження від справжніх даних генеральної сукупності.
Помилка вибірки буває двох видів – статистична та систематична. Статистична помилка залежить від розміру вибірки. Чим більший розмір вибірки, тим вона нижча.
Приклад:
Для простої випадкової вибірки розміром 400 одиниць максимальна статистична помилка (з 95% довірчою ймовірністю) становить 5%, для вибірки 600 одиниць – 4%, для вибірки 1100 одиниць – 3% Зазвичай, коли говорять про помилку вибірки, мають на увазі саме статистичну помилку .
Систематична помилка залежить від різних факторів, що надають постійний вплив на дослідження та зміщують результати дослідження у певний бік.
Приклад:

Використання будь-яких ймовірнісних вибірок занижує частку людей із високим доходом, які ведуть активний спосіб життя. Відбувається це через те, що таких людей набагато складніше застати в якомусь певному місці (наприклад, вдома).
Проблема респондентів, які відмовляються відповідати на запитання (частка «відмовників» у Москві, для різних опитувань коливається від 50% до 80%)

У деяких випадках, коли відомі справжні розподіли, систематичну помилку можна нівелювати запровадженням квот або перезважуванням даних, але в більшості реальних досліджень навіть оцінити її досить проблематично.

Типи вибірок

Вибірки поділяються на два типи:

імовірнісні
неймовірні

1. Імовірнісні вибірки
1.1 Випадкова вибірка (простий випадковий вибір)
Така вибірка передбачає однорідність генеральної сукупності, однакову можливість доступності всіх елементів, наявність повного списку всіх елементів. При відборі елементів зазвичай використовується таблиця випадкових чисел.
1.2 Механічна (систематична) вибірка
Різновид випадкової вибірки, впорядкований за якоюсь ознакою (алфавітний порядок, номер телефону, дата народження тощо). Перший елемент відбирається випадково, потім з кроком 'n' відбирається кожен 'k'-ий елемент. Розмір генеральної сукупності, у своїй – N=n*k
1.3 Стратифікована (районована)
Застосовується у разі неоднорідності генеральної сукупності. Генеральна сукупність розбивається на групи (страти). У кожній страті відбір здійснюється випадковим чи механічним чином.
1.4 Серійна (гніздова чи кластерна) вибірка
При серійній вибірці одиницями відбору виступають самі об'єкти, а групи (кластери чи гнізда). Групи відбираються випадковим чином. Об'єкти всередині груп обстежуються суцільником.

2.Неймовірні вибірки
Відбір у такій вибірці здійснюється за принципами випадковості, а, по суб'єктивним критеріям – доступності, типовості, рівного представництва тощо.
2.1. Квотна вибірка
Спочатку виділяється деяка кількість груп об'єктів (наприклад, чоловіки віком 20-30 років, 31-45 років і 46-60 років; особи з доходом до 30 тисяч рублів, з доходом від 30 до 60 тисяч рублів та з доходом понад 60 тисяч рублів ) Для кожної групи задається кількість об'єктів, які мають бути обстежені. Кількість об'єктів, які повинні потрапити до кожної групи, задається, найчастіше, або пропорційно заздалегідь відомої частки групи в генеральній сукупності, або однаковою для кожної групи. Усередині груп об'єкти відбираються довільно. Квотні вибірки використовуються досить часто.
2.2. Метод снігової грудки
Вибірка будується в такий спосіб. У кожного респондента, починаючи з першого, просяться контакти його друзів, колег, знайомих, які б підходили під умови відбору і могли б взяти участь у дослідженні. Отже, крім першого кроку, вибірка формується з участю самих об'єктів дослідження. Метод часто застосовується, коли необхідно знайти та опитати важкодоступні групи респондентів (наприклад, респондентів, які мають високий дохід, респондентів, що належать до однієї професійної групи, респондентів, які мають схожі хобі/захоплення тощо)
2.3 Стихійна вибірка
Опитуються найдоступніші респонденти. Типові приклади стихійних вибірок – у газетах/журналах, які віддали респондентам на самозаповнення, більшість інтернет-опитувань. Розмір та склад стихійних вибірок заздалегідь не відомий, і визначається лише одним параметром – активністю респондентів.
2.4 Вибір типових випадків
Відбираються одиниці генеральної сукупності, які мають середнім (типовим) значенням ознаки. При цьому виникає проблема вибору ознаки та визначення її типового значення.

Курс лекцій з теорії статистики

Більш детальну інформацію щодо вибіркових спостережень можна отримати переглянувши.

Елементи, що охоплюються експериментом (спостереженням, опитуванням).

Характеристики вибірки:

Якісна характеристика вибірки - що саме ми вибираємо та які способи побудови вибірки ми для цього використовуємо.
Кількісна характеристика вибірки - скільки випадків вибираємо, тобто обсяг вибірки.

Необхідність вибірки:

Об'єкт дослідження дуже великий. Наприклад, споживачі продукції глобальної компанії – величезна кількість територіально розкиданих ринків.
Існує потреба у зборі первинної інформації.

Енциклопедичний YouTube

1 / 5

✪ Вибір: розрахунок обсягу. Достовірність та потужність дослідження. Біостатистика.

✪ 02 – Мат. Статистика. Вибірка. Вибірковий простір. Приклади

✪ Основи SQL для початківців | Вибір значень з бази даних

✪ SQL для початківців (DML): Вибір з таблиці (MySql), Урок 4!

✪ Виробництво панелей SIP. Частина 2. Розкрій та фігурне різання. Вибір пазів. Все за розумом

Субтитри

Обсяг вибірки

Обсяг вибірки - Число випадків, включених у вибіркову сукупність.

Вибірки можна умовно розділити великі і малі, оскільки у математичної статистиці використовуються різні підходи залежно від обсягу вибірки. Вважається, що вибірки обсягу більше 30 можна зарахувати до великих.

Залежні та незалежні вибірки

При порівнянні двох (і більше) вибірок важливим параметром є їхня залежність. Якщо можна встановити гомоморфну пару (тобто коли одному випадку з вибірки X відповідає один і тільки один випадок з вибірки Y і навпаки) для кожного випадку у двох вибірках (і ця підстава взаємозв'язку є важливою для вимірюваної на вибірках ознаки), такі вибірки називаються залежними. Приклади залежних вибірок:

пари близнюків,
два виміри будь-якої ознаки до і після експериментального впливу,
чоловіки та дружини
і т.п.

Якщо такий взаємозв'язок між вибірками відсутня, то ці вибірки вважаються незалежними, наприклад:

чоловіки та жінки ,
психологи та математики.

Відповідно, залежні вибірки мають однаковий обсяг, а обсяг незалежних може відрізнятися.

Порівняння вибірок проводиться за допомогою різних статистичних критеріїв:

Критерій Пірсона (χ 2 )
Критерій Стюдента ( t )
Критерій Вілкоксону ( T )
Критерій Манна - Уітні ( U )
Критерій знаків ( G )
та ін.

Репрезентативність

Вибірка може розглядатися як репрезентативна або нерепрезентативна. Вибірка буде репрезентативною під час обстеження великої групи людей, якщо всередині цієї групи є представники різних підгруп, тільки так можна зробити правильні висновки.

Приклад нерепрезентативної вибірки

Дослідження з експериментальною та контрольною групами, які ставляться у різні умови.
- Дослідження з експериментальною та контрольною групами із залученням стратегії попарного відбору
Дослідження з використанням лише однієї групи – експериментальної.
Дослідження з використанням змішаного (факторного) плану – всі групи ставляться у різні умови.

Типи вибірок

Вибірки поділяються на два типи:

імовірнісні
неймовірні

Імовірнісні вибірки

Проста ймовірнісна вибірка:
- Проста повторна вибірка. Використання такої вибірки ґрунтується на припущенні, що кожен респондент з часткою ймовірності може потрапити у вибірку. За підсумками списку генеральної сукупності складаються картки з номерами респондентів. Вони поміщаються в колоду, перемішуються і їх навмання виймається картка, записується номер, потім повертається назад. Далі процедура повторюється стільки разів, який обсяг вибірки нам необхідний. Мінус: повторення одиниць відбору.

Процедура побудови простої випадкової вибірки включає наступні кроки:

1) необхідно отримати повний список членів генеральної сукупності та пронумерувати цей список. Такий список, нагадаємо, називається основою вибірки;

2) визначити передбачуваний обсяг вибірки, тобто очікуване число опитаних;

3) витягти з таблиці випадкових чисел стільки чисел, скільки нам потрібно вибіркових одиниць. Якщо у вибірці має бути 100 людина, з таблиці беруть 100 випадкових чисел. Ці випадкові числа можуть генеруватись комп'ютерною програмою.

4) вибрати зі списку-основи ті спостереження, номери яких відповідають виписаним випадковим числам

Проста випадкова вибірка має очевидні переваги. Цей метод дуже простий для розуміння. Результати дослідження можна поширювати на сукупність, що вивчається. Більшість підходів до отримання статистичних висновків передбачають збирання інформації за допомогою простої випадкової вибірки. Однак метод простої випадкової вибірки має як мінімум чотири суттєві обмеження:

1) нерідко складно створити основу вибіркового спостереження, яка б провести просту випадкову вибірку.

2) результатом застосування простої випадкової вибірки може стати велика сукупність, або сукупність, розподілена на великій географічній території, що значно збільшує час і вартість збору даних.

3) результати застосування простої випадкової вибірки часто характеризуються низькою точністю та більшою стандартною помилкою, ніж результати застосування інших імовірнісних методів.

4) у результаті застосування SRS може сформуватися нерепрезентативна вибірка. Хоча вибірки, отримані простим випадковим відбором, в середньому адекватно представляють генеральну сукупність, деякі з них вкрай некоректно представляють сукупність, що вивчається. Імовірність цього особливо велика за невеликого обсягу вибірки.

Проста неповторна вибірка. Процедура побудови вибірки така сама, тільки картки з номерами респондентів не повертаються назад у колоду.

Систематична імовірнісна вибірка. Є спрощеним варіантом простої імовірнісної вибірки. За підсумками списку генеральної сукупності через певний інтервал (К) відбираються респонденти. Розмір До визначається випадково. Найбільш достовірний результат досягається при однорідній генеральній сукупності, інакше можливі збіг величини кроку та якихось внутрішніх циклічних закономірностей вибірки (змішування вибірки). Мінуси: такі ж, як і в простій імовірнісній вибірці.
Серійна (гніздова) вибірка. Одиниці відбору є статистичні серії (сім'я, школа, бригада тощо). Відібрані елементи зазнають суцільного обстеження. Відбір статистичних одиниць може бути організований на кшталт випадкової чи систематичної вибірки. Мінус: Можливість більшої однорідності, ніж у генеральній сукупності.
Районована вибірка. У разі неоднорідної генеральної сукупності, перш ніж використовувати ймовірнісну вибірку з будь-якою технікою відбору, рекомендується розділити генеральну сукупність на однорідні частини, така вибірка називається районованою. Групами районування можуть бути як природні освіти (наприклад, райони міста), і будь-який ознака, закладений основою дослідження. Ознака, на основі якої здійснюється поділ, називається ознакою розшарування та районування.
«Зручна» вибірка. Процедура «зручної» вибірки полягає у встановленні контактів із «зручними» одиницями вибірки – з групою студентів, спортивною командою, з друзями та сусідами. Якщо необхідно отримати інформацію про реакцію людей на нову концепцію, така вибірка цілком обґрунтована. «Зручну» вибірку часто використовують із попереднього тестування анкет.

Неймовірні вибірки

Відбір у такій вибірці здійснюється за принципами випадковості, а, по суб'єктивним критеріям - доступності, типовості, рівного представництва тощо.

Квотна вибірка - вибірка будується як модель, яка відтворює структуру генеральної сукупності у вигляді квот (пропорцій) ознак, що вивчаються. Число елементів вибірки з різним поєднанням ознак, що вивчаються, визначається з таким розрахунком, щоб воно відповідало їх частці (пропорції) в генеральній сукупності. Так, наприклад, якщо генеральна сукупність у нас представлена 5000 чоловік, з них 2000 жінок та 3000 чоловіків, тоді у квотній вибірці у нас будуть 20 жінок та 30 чоловіків, або 200 жінок та 300 чоловіків. Квотовані вибірки найчастіше ґрунтуються на демографічних умовах: стать, вік, регіон, дохід, освіта та інші. Мінуси: зазвичай такі вибірки нерепрезентативні, тому що не можна врахувати відразу кілька соціальних параметрів. Плюси: доступний матеріал.
Спосіб снігового кома. Вибірка будується в такий спосіб. У кожного респондента, починаючи з першого, просяться контакти його друзів, колег, знайомих, які б підходили під умови відбору і могли б взяти участь у дослідженні. Отже, крім першого кроку, вибірка формується з участю самих об'єктів дослідження. Метод часто застосовується, коли необхідно знайти та опитати важкодоступні групи респондентів (наприклад, респондентів, які мають високий дохід, респондентів, що належать до однієї професійної групи, респондентів, які мають схожі хобі/захоплення тощо).
Стихійна вибірка – вибірка так званого «першого зустрічного». Часто використовується в теле- та радіоопитуваннях. Розмір та склад стихійних вибірок заздалегідь не відомий, і визначається лише одним параметром – активністю респондентів. Мінуси: неможливо встановити якусь генеральну сукупність представляють опитані, і як наслідок - неможливість визначити репрезентативність.
Маршрутне опитування – часто використовується, якщо одиницею вивчення є сім'я. На карті населеного пункту, в якому опитуватиметься, нумеруються всі вулиці. З допомогою таблиці (генератора) випадкових чисел відбираються великі числа. Кожне велике число розглядається як 3-х компонентів: номер вулиці (2-3 перших числа), номер будинку, номер квартири. Наприклад, число 14832: 14 – це номер вулиці на карті, 8 – номер будинку, 32 – номер квартири.
Районована вибірка із відбором типових об'єктів. Якщо після районування з кожної групи відбирається типовий об'єкт, тобто об'єкт, який переважно досліджуваних у дослідженні характеристик наближається до середніх показників, така вибірка називається районованої з відбором типових об'єктів.
Модальна вибірка.
Експертна вибірка.
Гетерогенна вибірка.

Стратегії побудови груп

Відбір груп для їхньої участі в психологічному експерименті здійснюється за допомогою різних стратегій, які потрібні для того, щоб забезпечити максимально можливе дотримання внутрішньої та зовнішньої валідності.

Рандомізація

Рандомізація, або випадковий відбірвикористовується для створення простих випадкових вибірок. Використання такої вибірки ґрунтується на припущенні, що кожен член популяції з рівною ймовірністю може потрапити у вибірку. Наприклад, щоб зробити випадкову вибірку зі 100 студентів вузу, можна скласти папірці з іменами всіх студентів вузу в капелюх, а потім дістати з нього 100 папірців - це буде випадковим відбором (Гудвін Дж., с. 147).

Попарний відбір

Попарний відбір- стратегія побудови груп вибірки, у якому групи піддослідних складаються з суб'єктів, еквівалентних за значними експерименту побічним параметрам. Ця стратегія ефективна для експериментів з використанням експериментальних та контрольних груп з кращим варіантом - залученням близнюкових пар (моно- та дизиготних).

Стратометричний відбір

Стратометричний відбір- рандомізація із виділенням страт (чи кластерів). При даному способі формування вибірки генеральна сукупність ділиться на групи (страти), що мають певні характеристики (стаття, вік, політичні переваги, освіта, рівень доходів та ін), і відбираються піддослідні з відповідними характеристиками.

Наближене моделювання

Наближене моделювання- Складання обмежених вибірок та узагальнення висновків про цю вибірку на ширшу популяцію. Наприклад, за участю у дослідженні студентів 2-го курсу університету дані цього дослідження поширюються на «людей віком від 17 до 21 року». Допустимість подібних узагальнень вкрай обмежена.

Наближене моделювання - формування моделі, яка чітко обумовленого класу систем (процесів) визначає його поведінка (чи необхідні явища) з прийнятною точністю.

Вибірка - Це:

1) сукупність тих елементів об'єкта дослідження, яка безпосередньо вивчатиметься;

2) способи та процедури відбору елементів об'єкта дослідження.

Генеральна сукупність - Повна сукупність об'єктів, що мають відношення до проблеми, що вивчається. У соціологічних дослідженнях як Г.С. найчастіше виступають сукупності індивідів – населення (міста, країни тощо), соціальна група (молодь, безробітні, бізнесмени тощо), аудиторія засобів масової комунікації (СМЯ) та ін. Однак у багатьох випадках Г.С . можуть складатися з великих елементів (об'єктів) – сімей (домогосподарств), академічних груп, підприємств, релігійних громад, окремих населених пунктів чи держав тощо.

Вибіркова сукупність – частина об'єктів з генеральної сукупності, відібраних для вивчення, щоб зробити висновок про всю генеральну сукупність.

Для того, щоб висновок, отриманий шляхом вивчення вибірки, можна було поширити на всю генеральну сукупність вибірка повинна мати властивість репрезентативності.

Репрезентативність - Це здатність вибірки представляти сукупність, що досліджується. Чим точніше склад вибірки представляє сукупність з питань, що вивчаються, тим вище її репрезентативність.

ПРИКЛАД: Репрезентативність можна проілюструвати наступним прикладом. Припустимо, сукупність - це всі учні школи (600 осіб із 20 класів, по 30 осіб у кожному класі). Предмет вивчення – ставлення куріння. Вибірка, що складається з 60 учнів старших класів, набагато гірше представляє сукупність, ніж вибірка з тих же 60 осіб, до якої увійдуть по 3 учні з кожного класу. Головною причиною цього - нерівний віковий розподіл у класах. Отже, у першому випадку репрезентативність вибірки низька, а в другому репрезентативність висока (за інших рівних умов).

Типи вибірок

1.Випадкова вибірка.

1.1.Простий випадковий добір.

1.2.Метод систематичної (або механічної) вибірки.

1.3.Серійна (гніздова чи кластерна) вибірка.

1.4.Стратифікована вибірка.

2. Невипадкова вибірка (неймовірна).

2.2. Стихійна вибірка.

2.3. Багатоступінчаста та одноступінчаста вибірки.

1.Випадкова вибірка.

Особливість випадкової вибірки у тому, що це одиниці генеральної сукупності мають рівну ймовірність потрапити у вибіркову сукупність. При випадковій вибірці виконується принцип випадковості. Основою вибірки можуть виступати списки працівників підприємства, телефонні довідники, реєстраційні списки власників автомобілів, списки виборців на виборчих дільницях, будинкові книги, а також складені самим соціологом різні списки в залежності від цілей дослідження (список вулиць, на яких потім проводиться відбір респондентів).

Випадкова вибірка зазвичай застосовується під час опитування громадської думки перед виборами, референдумами та інші масовими заходами.

Плюсомданого методу є повне дотримання принципу випадковості та, як наслідок – уникнення систематичних помилок.

Недоліки цього методу:

- Необхідність наявності списку елементів генеральної сукупності.

– Складність проведення опитування.

– Порівняно великий обсяг вибірки.