Генеральна сукупність та вибірка. Генеральна та вибіркова сукупності

У попередньому розділі нас цікавила розподіл ознаки у певній сукупності елементів. Сукупність, яка поєднує всі елементи, що має цю ознаку, називається генеральною. Якщо ознака людська (національність, освіта, коефіцієнт IQ тощо), то генеральна сукупність - все людство. Це дуже велика сукупність, тобто кількість елементів у сукупності n велика. Число елементів називається обсягом сукупності. Сукупності можуть бути кінцевими та нескінченними. Генеральна сукупність - всі люди хоч і дуже велика, але, звичайно, кінцева. Генеральна сукупність – усі зірки, напевно, нескінченно.

Якщо дослідник проводить вимір деякої безперервної випадкової величини X, кожен результат виміру вважатимуться елементом деякої гіпотетичної необмеженої генеральної сукупності. У цій генеральній сукупності незліченну кількість результатів розподілено за ймовірністю під впливом похибок у приладах, неуважності експериментатора, випадкових перешкод у самому явищі та ін.

Якщо ми проведемо n повторних вимірів випадкової величини Х, тобто отримаємо n конкретних різних чисельних значень, цей результат експерименту вважатимуться вибіркою обсягу n з гіпотетичної генеральної сукупності результатів одиничних вимірів.

Природно вважати, що дійсним значенням величини, що вимірюється, є середнє арифметичне від результатів. Ця функція від n результатів вимірювань називається статистикою, і вона сама є випадковою величиною, що має деякий розподіл, що називається вибірковим розподілом. Визначення вибіркового розподілу тієї чи іншої статистики - найважливіше завдання статистичного аналізу. Зрозуміло, що це розподіл залежить від обсягу вибірки n і зажадав від розподілу випадкової величини Х гіпотетичної генеральної сукупності. Вибірковий розподіл статистики є розподілом Х q в нескінченній сукупності всіх можливих вибірок обсягу n з вихідної генеральної сукупності.

Можна проводити вимірювання та дискретної випадкової величини.

Нехай вимір випадкової величини Х є киданням правильної однорідної трикутної піраміди, на гранях якої написані числа 1, 2, 3, 4. Дискретна, випадкова величина Х має простий рівномірний розподіл:

Експеримент можна робити необмежену кількість разів. Гіпотетичною теоретичною генеральною сукупністю є нескінченна сукупність, в якій є однакові частки (по 0.25) чотирьох різних елементів, позначених цифрами 1, 2, 3, 4. Серія n повторних кидань піраміди або одночасне кидання n однакових пірамід можна розглядати як вибір n цієї генеральної сукупності. В результаті експерименту маємо n чисел. Можна запровадити деякі функції цих величин, які називаються статистиками, можуть бути пов'язані з певними параметрами генерального розподілу.

Найважливішими числовими характеристиками розподілів є ймовірності Р i , математичне очікування М, дисперсія D. Статистиками для ймовірностей Р i є відносні частоти, де n i - Частота результату i (i = 1,2,3,4) у вибірці. Математичного очікування М відповідає статистика

яка називається вибірковим середнім. Вибіркова дисперсія

відповідає генеральній дисперсії D.

Відносна частота будь-якої події (i=1,2,3,4) у серіях з n повторних випробувань (або вибірках обсягу n з генеральної сукупності) матиме біномне розподіл.

У цього розподілу математичне очікування дорівнює 0.25 (не залежить від n), а середнє квадратичне відхилення одно (швидко зменшується зі зростанням n). Розподіл є вибірковим розподілом статистики, відносна частота будь-якого з чотирьох можливих результатів одиничного кидання піраміди в повторних n випробуваннях. Якби ми вибрали з нескінченної, генеральної сукупності, в якій чотири різні елементи (i=1,2,3,4) мають рівні частки по 0.25, всі можливі вибірки обсягом n (їх число також нескінченно), то отримали б так звану математичну вибірку обсягу n. У цій вибірці кожен із елементів (i=1,2,3,4) розподілено за біноміальним законом.

Допустимо, ми виконали кидання цієї піраміди, і число двійки випало 3 рази (). Ми можемо знайти можливість цього результату, використовуючи вибірковий розподіл. Вона рівна

Наш результат виявився дуже малоймовірним; у серії із двадцяти чотирьох кратних кидань він зустрічається приблизно один раз. У біології такий результат зазвичай вважається практично неможливим. В цьому випадку у нас з'явиться сумнів: є піраміда правильною і однорідною, чи справедливо при одному киданні рівність, чи правильний розподіл і, отже, вибірковий розподіл.

Щоб вирішити сумнів, треба виконати ще один раз чотириразове кидання. Якщо знову з'явиться результат, то ймовірність двох результатів дуже мала. Зрозуміло, що ми отримали практично неможливий результат. Тому вихідний розподіл неправильний. Очевидно, що, якщо другий результат виявиться ще малоймовірнішим, то є ще більше підстав розібратися з цією "правильною" пірамідою. Якщо ж результат повторного експерименту буде і тоді можна вважати, що піраміда правильна, а перший результат (), теж вірний, але просто малоймовірний.

Нам можна було і не займатися перевіркою правильності та однорідності піраміди, а вважати апріорі піраміду правильною та однорідною, і, отже, правильним вибірковий розподіл. Далі слід з'ясувати, що дає знання вибіркового розподілу на дослідження генеральної сукупності. Але оскільки встановлення вибіркового розподілу є основним завданням статистичного дослідження, докладний опис експериментів із пірамідою можна вважати виправданим.

Вважатимемо, що вибірковий розподіл правильний. Тоді експериментальні значення відносної частоти різних серіях по n кидань піраміди будуть групуватися близько значення 0.25, що є центром вибіркового розподілу і точним значенням оцінюваної ймовірності. І тут кажуть, що відносна частота є незміщеною оцінкою. Оскільки, вибіркова дисперсія прагнути до нуля зі зростанням n, то експериментальні значення відносної частоти дедалі більше групуватимуться біля математичного очікування вибіркового розподілу зі зростанням обсягу вибірки. Тому є спроможною оцінкою ймовірності.

Якби піраміда виявилася направильною та неоднорідною, то вибіркові розподіли для різних (i=1,2,3,4) мали б відмінні математичні очікування (різні) та дисперсії.

Зазначимо, що отримані тут біномні вибіркові розподіли при великих n() добре апроксимуються нормальним розподілом з параметрами і, що значно спрощує розрахунки.

Продовжимо випадковий експеримент - кидання правильної, однорідної, трикутної піраміди. Випадкова величина Х, пов'язана з цим досвідом, має розподіл. Математичне очікування тут одно

Проведемо n кидань, що еквівалентно випадковій вибірці обсягу n з гіпотетичної, нескінченної, генеральної сукупності, що містить рівні частки (0.25) чотирьох різних елементів. Отримаємо n вибіркових значень випадкової величини Х(). Виберемо статистику, яка є вибірковим середнім. Величина сама є випадковою величиною, що має деякий розподіл, що залежить від обсягу вибірки та розподілу вихідної, випадкової величини Х. Величина є усередненою сумою n однакових випадкових величин (тобто з однаковим розподілом). Зрозуміло, що

Тому статистика є незміщеною оцінкою математичного очікування. Вона є також заможною оцінкою, оскільки

Таким чином, теоретичний вибірковий розподіл має також математичне очікування, що й у вихідного розподілу дисперсія зменшена в n разів.

Нагадаємо, що дорівнює

Математична, абстрактна нескінченна вибірка, пов'язана з вибіркою обсягу n з генеральної сукупності та з введеною статистикою міститиме в нашому випадку елементів. Наприклад, якщо в математичній вибірці будуть елементи зі значеннями статистики. Усього елементів буде 13. Частка крайніх елементів у математичній вибірці буде мінімальною, тому що результати і мають ймовірності рівні. Серед безлічі елементарних результатів чотирьох кратного кидання піраміди є лише по одному сприятливому і. При наближенні статистик до середніх значень ймовірності зростатимуть. Наприклад, значення реалізуватиметься при елементарних наслідках, і т. д. Відповідно зросте і частка елемента 1.5 в математичній вибірці.

Середнє значення матиме максимальну ймовірність. Зі зростанням n експериментальні результати будуть групуватися близько середнього значення. Те, що середнє вибіркового середнього дорівнює середньому початковій сукупності часто використовується в статистиці.

Якщо виконати розрахунки ймовірностей у вибірковому розподілі, то можна переконатися, що вже при такому невеликому значенні n вибірковий розподіл буде виглядати як нормальний. Воно буде симетричним, у якому значення буде медіаною, модою та математичним очікуванням. Зі зростанням n воно добре апроксимується відповідним нормальним навіть, якщо вихідний розподіл прямокутний. Якщо ж вихідний розподіл є нормальним, то розподіл є розподілом Стьюдента за будь-якого n.

Для оцінки генеральної дисперсії необхідно вибрати складнішу статистику, яка дає незміщену та заможну оцінку. У вибірковому розподілі для S 2 математичне очікування рівне, а дисперсія. При більших обсягах вибірок вибірковий розподіл вважатимуться нормальним. При малих n і нормальному вихідному розподілі вибірковий розподіл S 2 буде ч 2 _розподіл.

Вище ми спробували представити перші кроки дослідника, який намагається провести простий статистичний аналіз повторних експериментів із правильною однорідною трикутною призмою (тетраедром). У цьому випадку нам відомий вихідний розподіл. Можна в принципі теоретично отримати і вибіркові розподіли відносної частоти, вибіркової середньої та вибіркової дисперсії в залежності від числа повторних дослідів n. При великих n всі ці вибіркові розподіли наближатимуться до відповідних нормальних розподілів, оскільки вони є законами розподілу сум незалежних випадкових величин (центральна гранична теорема). Таким чином, нам відомі очікувані результати.

Повторні експерименти чи вибірки дадуть оцінки параметрів вибіркових розподілів. Ми стверджували, що експериментальні оцінки будуть правильними. Ми не виконували ці експерименти і навіть не наводили результатів дослідів, отриманих іншими дослідниками. Можна наголосити, що з визначенні законів розподілів теоретичні методи використовуються частіше, ніж прямі експерименти.

100 рбонус за перше замовлення

Оберіть тип роботи Дипломна робота Курсова робота Реферат Магістерська дисертація Звіт з практики Стаття Доповідь Рецензія Контрольна робота Монографія Рішення задач Бізнес-план Відповіді на запитання Творча робота Есе Чертеж Твори Переклад Презентації Набір тексту Інше Підвищення унікальності тексту

Дізнатись ціну

Генеральна сукупність - вся статистична сукупність об'єктів та/або явищ суспільного життя, що вивчається вибірковим методом, мають загальні якісні ознаки або кількісні змінні.

Сумарна чисельність об'єктів спостереження (люди, домогосподарства, підприємства, населені пункти тощо), які мають певним набором ознак (стаття, вік, дохід, чисельність, оборот тощо.), обмежена у просторі та часі. Приклади генеральних сукупностей:
- всі мешканці Москви (10,6 млн. осіб за даними перепису 2002 року)
– Чоловіки-Москвичі (4,9 млн. осіб за даними перепису 2002 року)
- Юридичні особи Росії (2,2 млн. на початок 2005 року)
- роздрібні торгові точки, які здійснюють продаж продуктів харчування (20 тисяч на початок 2008 року) тощо.

Коректне визначення Г.С. та її характеристик надзвичайно важливо для вибору дизайну дослідження - стратегії побудови репрезентативної вибірки ( див.). Найважливішими характеристиками Г.С. є її обсяг та доступність елементів для визначення.

З погляду обсягу, прийнято виділяти кінцеві та нескінченні Г.С. Цей поділ є суто технічним, він обумовлений особливостями процедур оцінювання обсягу та помилок репрезентативної ймовірнісної (випадкової) вибірки. Кінцевими вважаються Г.С., чисельність яких можна порівняти з обсягом вибірки. Якщо обсяг вибірки перевищує кілька відсотків чисельності Г.С., помилку вибірки необхідно оцінювати з поправкою обсяг Г.С.

Нескінченними називаються Г.С., обсяг яких, порівняно з обсягом репрезентативної випадкової вибірки, незрівнянно великий. Власне кажучи, все Г.С. у соціальних науках кінцеві (навіть якщо їх чисельність становить кілька мільярдів), проте практично Г.С. можна вважати нескінченною, якщо обсяг вибірки, що забезпечує прийнятний рівень помилки, вбирається у 1-2 % від її чисельності. Іноді поняття нескінченності пов'язують безпосередньо з обсягом Г.С., наприклад, понад сто тисяч об'єктів.

Г.С., приналежність яких очевидна чи легко встановлюється, називаються конкретними. Для конкретних Г.С. нескладно визначити обсяг та отримати відносно повний список їх елементів – основу вибірки (див. Вибірки основа). Наприклад, список повнолітніх мешканців міста можна отримати в адресному столі, а списки студентів великого міста – в університетах. Якщо конкретна Г.С. дуже велика (наприклад, населення країни), списки можуть бути отримані для її структурних частин. Побудова репрезентативної вибірки випадкової ( див.) для конкретних Г.С. технічно завжди можливо; проблеми можуть виникнути через брак часу, кваліфікованого персоналу або матеріальних ресурсів.

Г.С., належність до якої можна встановити лише внаслідок цілеспрямованих процедур чи спеціальних досліджень, називаються гіпотетичними. До таких Г.С. належать, наприклад, аудиторії СМЯ (не можна дізнатися, чи бачив людина конкретний рекламний ролик, якщо не запитати його про це), любителі певних видів акваріумних рибок, експерти з вузької проблеми тощо. Для визначення обсягу деяких гіпотетичних Г.С. також потрібні спеціальні дослідження. Можливість побудови репрезентативної вибірки випадкової ( див.) для гіпотетичних Г.С. великого обсягу у багатьох випадках є проблематичною.

ГЕНЕРАЛЬНОЇ СУКУПНОСТІ ПАРАМЕТР- статистичний термін, який застосовується для позначень будь-якої кількісної характеристики генеральної сукупності ( див.). Математичне очікування ( див.), дисперсія ( див.), ймовірність ( див.) позитивної відповіді, коефіцієнт кореляції між двома випадковими величинами ( див.) є Г.С.П. Аналогічні характеристики вибірки ( див.) називаються статистиками вибірковими ( див.).

Вибірка (Вибіркова сукупність) -безліч випадків (випробуваних, об'єктів, подій, зразків), за допомогою певної процедури обраних із генеральної сукупності для участі у дослідженні.
Частина об'єктів з генеральної сукупності, відібраних для вивчення, для того, щоб зробити висновок про всю генеральну сукупність. Для того щоб висновок, отриманий шляхом вивчення вибірки, можна було поширити на всю генеральну сукупність, вибірка повинна мати властивість репрезентативності.

Характеристики вибірки:

Якісна характеристика вибірки – кого саме ми вибираємо та які способи побудови вибірки ми для цього використовуємо.

Кількісна характеристика вибірки - скільки випадків вибираємо, тобто обсяг вибірки.

Обсяг вибірки- Кількість випадків, включених у вибіркову сукупність. Зі статистичних міркувань рекомендується, щоб кількість випадків становила не менше 30—35.

Отже, закономірності, яким підпорядковується досліджувана випадкова величина, фізично повністю зумовлюються реальним комплексом умов її спостереження (або експерименту), а математично задаються відповідним ймовірнісним простором або, що те саме, відповідним законом розподілу ймовірностей. Однак при проведенні статистичних досліджень дещо зручнішою виявляється інша термінологія, пов'язана з поняттям генеральної сукупності.

Генеральною сукупністю називають сукупність всіх мислимих спостережень (чи всіх подумки можливих об'єктів типу, що цікавить нас, з яких «знімаються» спостереження), які могли б бути зроблені при даному реальному комплексі умов. Оскільки у визначенні йдеться про всі подумки можливі спостереження (або об'єкти), то поняття генеральної сукупності є поняття умовно-математичне, абстрактне і його не слід змішувати з реальними сукупностями, що підлягають статистичному дослідженню. Так, обстеживши навіть всі підприємства підгалузі з точки зору реєстрації значень техніко-економічних показників, що характеризують їх, ми можемо розглядати обстежену сукупність лише як представника гіпотетично можливої більш широкої сукупності підприємств, які могли б функціонувати в рамках того ж самого реального комплексу умов

У практичній роботі зручніше вибір пов'язувати з об'єктами спостереження, ніж із характеристиками цих об'єктів. Ми відбираємо вивчення машини, геологічні проби, людей, але з значення характеристик машин, проб, людей. З іншого боку, в математичній теорії об'єкти та сукупність їх характеристик не розрізняються та двоїстість введеного визначення зникає.

Як бачимо, математичне поняття «генеральна сукупність» фізично повністю обумовлюється, так само як і поняття «імовірнісний простір», «випадкова величина» та «закон розподілу ймовірностей», відповідним реальним комплексом умов, а тому всі ці чотири математичні поняття можна вважати у певному сенсі синонімами. Генеральна сукупність називається кінцевою чи нескінченною залежно від цього, кінцева чи нескінченна сукупність всіх мислимих спостережень.

З визначення слід, що безперервні генеральні сукупності (що з спостережень ознак безперервної природи) завжди нескінченні. Дискретні ж генеральні сукупності може бути як нескінченними, і кінцевими. Скажімо, якщо аналізується партія з N виробів на сортність (див. приклад п. 4.1.3), коли кожен виріб може бути віднесено до одного з чотирьох сортів, досліджуваною випадковою величиною є номер сорту випадково витягнутого з партії виробу, а безліч можливих значень випадкової величини складається відповідно з чотирьох точок (1, 2, 3 і 4), то, очевидно, генеральна сукупність буде кінцевою (всього N мислимих спостережень).

Поняття нескінченної генеральної сукупності є математична абстракція, як і уявлення про те, що вимір випадкової величини можна повторити нескінченну кількість разів. Приблизно нескінченну генеральну сукупність можна тлумачити як граничний випадок кінцевої, коли кількість об'єктів, що породжуються цим реальним комплексом умов, необмежено зростає. Тож якщо у щойно наведеному прикладі замість партій виробів розглядати безперервне масове виробництво тих самих виробів, ми й дійдемо поняття нескінченної генеральної сукупності. Практично ж така видозміна рівносильна вимогі

Вибірка з цієї генеральної сукупності - це результати обмеженого ряду спостережень випадкової величини. Вибірку можна розглядати як якийсь емпіричний аналог генеральної сукупності, те, з чим ми найчастіше на практиці маємо справу, оскільки обстеження всієї генеральної сукупності буває або дуже трудомістким (у разі великих N), або принципово неможливо (у разі нескінченних генеральних сукупностей).

Число спостережень, що утворюють вибірку, називають обсягом вибірки.

Якщо обсяг вибірки великий і при цьому ми маємо справу з одновимірною безперервною величиною (або з одновимірною дискретною, кількість можливих значень якої досить велика, скажімо більше 10), то часто зручніше, з точки зору спрощення подальшої статистичної обробки результатів спостережень, перейти до так званих «групованим» вибірковим даним. Цей перехід здійснюється зазвичай так:

а) відзначаються найменше та найбільше значення у вибірці;

б) весь обстежений діапазон розбивається на кілька рівних інтервалів групування; при цьому кількість інтервалів s не повинна бути меншою за 8-10 і більше 20-25: вибір кількості інтервалів істотно залежить від обсягу вибірки для зразкової орієнтації у виборі 5 можна користуватися наближеною формулою

яку слід сприймати швидше як оцінку знизу для s (особливо при великих

в) відзначаються крайні точки кожного з інтервалів у порядку зростання, а також їх середини

г) підраховуються числа вибіркових даних, що потрапили до кожного з інтервалів: (очевидно, ); вибіркові дані, що потрапили на межі інтервалів, або рівномірно розподіляються по двох сусідніх інтервалах, або призначаються відносити їх тільки до одного з них, наприклад до лівого.

Залежно від конкретного змісту завдання до цієї схеми групування можуть бути внесені деякі видозміни (наприклад, у деяких випадках доцільно відмовитися від вимоги рівної довжини інтервалів групування).

У всіх подальших міркуваннях, що використовують вибіркові дані, виходитимемо з щойно описаної системи позначень.

Нагадаємо, що сутність статистичних методів полягає в тому, щоб по деякій частині генеральної сукупності (тобто за вибіркою) виносити судження про її властивості загалом.

Одне з найважливіших питань, від успішного вирішення якого залежить достовірність одержуваних результаті статистичної обробки даних висновків, є питання репрезентативності вибірки, тобто. питання повноти і адекватності уявлення нею цікавлять нас властивостей аналізованої генеральної сукупності. У практичній роботі одна і та ж група об'єктів, взятих для вивчення, може розглядатися як вибірка з різних генеральних сукупностей. Так, групу сімей, навмання відібраних з кооперативних будинків однієї з житлово-експлуатаційних контор (ЖЕК) одного з районів міста для докладного соціологічного обстеження, можна розглядати і як вибірку з генеральної сукупності сімей (з кооперативною формою житла) цієї ЖЕК, і як вибірку з генеральної сукупності сімей даного району, як вибірку з генеральної сукупності всіх сімей міста, і, нарешті, як вибірку з генеральної сукупності всіх сімей міста, що у кооперативних будинках. Змістовна інтерпретація результатів апробації істотно залежить від того, представником якоїсь генеральної сукупності ми розглядаємо відібрану групу сімей, для якої генеральної сукупності цю вибірку можна вважати представницькою (репрезентативною). Відповідь це питання залежить від багатьох чинників. У наведеному вище прикладі, зокрема, від наявності або відсутності спеціального (може бути, прихованого) фактора, що визначає приналежність сім'ї до даної ЖЕК або району в цілому (таким фактором може бути, наприклад, середньодушовий дохід сім'ї, географічне розташування району в місті, « вік» району тощо).

Генеральна сукупність- сукупність всіх об'єктів (одиниць), щодо яких вчений має намір робити висновки щодо конкретної проблеми. Генеральна сукупність складається із усіх об'єктів, які підлягають вивченню. Склад генеральної сукупності залежить від цілей дослідження. Іноді генеральна сукупність — це населення певного регіону (наприклад, коли вивчається ставлення потенційних виборців до кандидата), найчастіше задається кілька критеріїв, визначальних об'єкт дослідження. Наприклад, жінки 18-29 років, які використовують крем для рук певних марок не рідше одного разу на тиждень, і мають дохід не нижче $150 на одного члена сім'ї.

Вибірка- безліч випадків (випробуваних, об'єктів, подій, зразків), за допомогою певної процедури обраних із генеральної сукупності для участі у дослідженні.

Обсяг вибірки;
Залежні та незалежні вибірки;
Репрезентативність:
1. приклад нерепрезентативної вибірки;
Види плану побудови груп із вибірок;
Стратегії побудови груп:
1. Рандомізація;
2. Попарний відбір;
3. Стратометричний відбір;
4. Наближене моделювання.

Обсяг вибірки- Число випадків, включених у вибіркову сукупність. Зі статистичних міркувань рекомендується, щоб кількість випадків становила не менше 30-35.

Залежні та незалежні вибірки

При порівнянні двох (і більше) вибірок важливим параметром є їхня залежність. Якщо можна встановити гомоморфну пару (тобто, коли одному випадку з вибірки X відповідає один і тільки один випадок з вибірки Y і навпаки) для кожного випадку у двох вибірках (і ця основа взаємозв'язку є важливою для вимірюваної на вибірках ознаки), такі вибірки називаються залежними. Приклади залежних вибірок: пари близнюків, два виміри будь-якої ознаки до і після експериментального впливу, чоловіки та дружини тощо.

У випадку, якщо такий взаємозв'язок між вибірками відсутній, то ці вибірки вважаються незалежними, наприклад: чоловіки та жінки, психологи та математики.

Відповідно, залежні вибірки мають однаковий обсяг, а обсяг незалежних може відрізнятися.

Порівняння вибірок здійснюється за допомогою різних статистичних критеріїв:

t-критерій Стьюдента;
T-критерій Вілкоксону;
U-критерій Манна-Уітні;
Критерій знаків та ін.

Репрезентативність

Вибірка може розглядатися як репрезентативна або нерепрезентативна.

Приклад нерепрезентативної вибірки

У США одним із найвідоміших історичних прикладів нерепрезентативної вибірки вважається випадок, що стався під час президентських виборів у 1936 році Журнал «Літрері Дайджест», який успішно прогнозував події кількох попередніх виборів, помилився у своїх прогнозах, розіславши десять мільйонів пробних бюлетенів своїм передплатникам, людям, обраним за телефонними книгами всієї країни, та людям із реєстраційних списків автомобілів. У 25 % бюлетенів, що повернулися (майже 2,5 мільйона) голоси були розподілені наступним чином:

57% віддавали перевагу кандидату-республіканцю Альфу Лендону

40 % обрали чинного на той час президента-демократа Франкліна Рузвельта

На дійсних виборах, як відомо, переміг Рузвельт, набравши більше 60% голосів. Помилка «Літрері Дайджест» полягала в наступному: бажаючи збільшити репрезентативність вибірки, оскільки їм було відомо, що більшість їх передплатників вважають себе республіканцями, вони розширили вибірку за рахунок людей, вибраних з телефонних книг та реєстраційних списків. Однак вони не врахували сучасних їм реалій і насправді набрали ще більше республіканців: під час Великої депресії мати телефони та автомобілі могли собі дозволити в основному представники середнього та верхнього класу (тобто більшість республіканців, а не демократів).

Види плану побудови груп із вибірок

Виділяють кілька основних видів плану побудови груп:

Дослідження з експериментальною та контрольною групами, які ставляться у різні умови;
Дослідження з експериментальною та контрольною групами із залученням стратегії попарного відбору;
Дослідження з використанням лише однієї групи – експериментальної;
Дослідження з використанням змішаного (факторного) плану – всі групи ставляться у різні умови.

Стратегії побудови груп

Відбір груп для їхньої участі в психологічному експерименті здійснюється за допомогою різних стратегій, які потрібні для того, щоб забезпечити максимально можливе дотримання внутрішньої та зовнішньої валідності:

Рандомізація (випадковий відбір);
Попарний відбір;
Стратометричний відбір;
наближене моделювання;
Залучення реальних груп.

Рандомізація

Рандомізація, або випадковий вибір, використовується для створення простих випадкових вибірок. Використання такої вибірки ґрунтується на припущенні, що кожен член популяції з рівною ймовірністю може потрапити у вибірку. Наприклад, щоб зробити випадкову вибірку зі 100 студентів ВНЗ, можна скласти папірці з іменами всіх студентів ВНЗ у капелюх, а потім дістати з нього 100 папірців - це буде випадковим відбором

Попарний відбір

Попарний відбір - стратегія побудови груп вибірки, у якому групи піддослідних складаються з суб'єктів, еквівалентних за значними експерименту побічним параметрам. Дана стратегія ефективна для експериментів з використанням експериментальних та контрольних груп з кращим варіантом - залученням близнюкових пар (моно-і дизиготних), оскільки дозволяє створити.

Стратометричний відбір

Стратометричний відбір – рандомізація з виділенням страт (або кластерів). При цьому способі формування вибірки генеральна сукупність ділиться на групи (страти), які мають певні характеристики (стаття, вік, політичні переваги, освіту, рівень доходів та ін), і відбираються піддослідні з відповідними характеристиками.

Наближене моделювання

Наближене моделювання - складання обмежених вибірок та узагальнення висновків про цю вибірку більш широку популяцію. Наприклад, за участю у дослідженні студентів 2-го курсу університету дані цього дослідження поширюються на «людей віком від 17 до 21 року». Допустимість подібних узагальнень вкрай обмежена.

http://www.hi-edu.ru/e-books/xbook096/01/index.html?part-011.htm- Дуже корисний сайт!

Вибірковий метод дослідження є основним статистичним методом. Це природно, оскільки обсяг об'єктів, що вивчаються, як правило нескінченний (і навіть, якщо кінцевий, то дуже важко перебрати всі об'єкти, доводиться задовольнятися лише їх частиною, вибіркою).

Генеральна та вибіркова сукупності

Генеральною сукупністю називається сукупність всіх досліджуваних у цьому експерименті елементів.

Вибірковою сукупністю (або вибіркою) називається кінцева сукупність об'єктів, випадково відібраних із генеральної сукупності.

Обсягом сукупності (вибірковою чи генеральною) називається кількість об'єктів цієї сукупності.

Приклад генеральної та вибіркової сукупностей

Припустимо, досліджується психологічна схильність людини до поділу даного відрізка щодо золотого перерізу. Так як походження самого поняття золотого перерізу продиктоване антропометрією людського тіла, то зрозуміло, що в даному випадку генеральною сукупністю є будь-яка антропогенна істота, яка досягла фізичної зрілості і набула остаточних пропорцій, тобто - вся доросла частина людства. Обсяг цієї сукупності практично нескінченний.

Якщо ж ця схильність досліджується виключно у мистецькому середовищі, то генеральна сукупність – це люди, які безпосередньо стосуються дизайну: художники, архітектори, дизайнери. Таких людей теж дуже багато, і вважатимуться, що обсяг генеральної сукупності у разі теж нескінченний.

І в тому, і в іншому випадку для дослідження ми змушені обмежитися розумними обсягами вибірок, обираючи в якості представників тієї та іншої сукупностей студентів технічних спеціальностей (як людей, далеких від художнього світу) або студентів спеціальності дизайн (як людей, які мають безпосереднє відношення до світу) художніх образів).

Репрезентативність

Основною проблемою вибіркового методу є питання про те, наскільки точно об'єкти, відібрані з генеральної сукупності для дослідження, представляють характеристики генеральної сукупності, що вивчаються, тобто - питання про репрезентативність вибірки.

Отже, вибірка називається репрезентативною (представницькою), якщо вона досить точно представляє кількісні співвідношення генеральної сукупності.

Зрозуміло, важко сказати, що саме ховається за розпливчастим формулюванням досить точно. Питання репрезентативності взагалі є найбільш спірними у будь-якому експериментальному дослідженні. Є маса прикладів, що вже стали класичними, коли недостатня представництво вибірки призводила експериментаторів до абсурдних результатів.

Зазвичай, питання репрезентативності вирішуються з допомогою експертної оцінки, коли наукове співтовариство приймає думку групи авторитетних фахівців щодо коректності проведеного дослідження.

Приклад репрезентативності

Повернемося наприклад із розподілом відрізка. Питання репрезентативності вибірок лежать тут у основі дослідження: ми у жодному разі нічого не винні змішувати групи піддослідних за ознакою приналежності їх до художньому середовищі.

Статистичний розподіл ознаки, що спостерігається

Частота значення, що спостерігається

Нехай в результаті випробування у вибірці обсягу спостерігається ознакаприйняв значення,, ..., причому значенняспостерігалосяраз, значення-раз, і т. д., значенняспостерігалосяраз. Тоді частотою спостерігається значенняназивається число, значення-числа тощо.

Відносна частота значення, що спостерігається

Відносною частотою спостеріганого значення визнається відношення частот об'єму вибірки:

Зрозуміло, що сума частот спостерігається ознаки повинна давати обсяг вибірки

а сума відносних частот має давати одиницю:

Ці міркування можна використовуватиме контролю при складанні статистичних таблиць. Якщо рівності не дотримуються, то при протоколюванні результатів експерименту було допущено помилку.

Статистичний розподіл значення, що спостерігається

Статистичним розподілом спостерігається ознаки називається відповідність між значеннями ознаки, що спостерігаються, і відповідають їм частотами (або відносними частотами).

Як правило, статистичний розподіл записується у вигляді дворядкової таблиці, в якій у першому рядку вказуються значення ознаки, що спостерігаються, а в другому - відповідні їм частоти (або відносні частоти):