По какому признаку построен вариационный ряд. Ряды распределения

Практическое занятие 1

ВАРИАЦИОННЫЕ РЯДЫ РАСПРЕДЕЛЕНИЯ

Вариационным рядом или рядом распределения называют упорядоченное распределение единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака.

Существует 3 вида ряда распределения:

1) ранжированный ряд – это перечень отдельных единиц совокупности в порядке возрастания изучаемого признака; если численность единиц совокупности достаточно велика ранжированный ряд становится громоздким, и в таких случаях ряд распределения строится с помощью группировки единиц совокупности по значениям изучаемого признака (если признак принимает небольшое число значений, то строится дискретный ряд, а в противном случае – интервальный ряд);

2) дискретный ряд – это таблица, состоящая из двух столбцов (строк) – конкретных значений варьирующего признака X i и числа единиц совокупности с данным значением признака f i – частот; число групп в дискретном ряду определяется числом реально существующих значений варьирующего признака;

3) интервальный ряд – это таблица, состоящая из двух столбцов (строк) – интервалов варьирующего признака X i и числа единиц совокупности, попадающих в данный интервал (частот), или долей этого числа в общей численности совокупностей (частостей).

Числа, показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами или весами вариант и обозначаются строчной буквой латинского алфавита f . Общая сумма частот вариационного ряда равна объему данной совокупности, т. е.

где k – число групп, n – общее число наблюдений, или объем совокупности.

Частоты (веса) выражают не только абсолютными, но и от­носительными числами – в долях единицы или в процентах от общей численности вариант, составляющих данную совокуп­ность. В таких случаях веса называют относительными частотами или частостями. Общая сумма частностей равна единице

или
,

если частоты выражены в про­центах от общего числа наблюдений п. Замена частот частостями не обязательна, но иногда оказывается полезной и даже необхо­димой в тех случаях, когда приходится сопоставлять друг с дру­гом вариационные ряды, сильно отличающиеся по их объемам.

В зависимости от того, как варьирует признак – дискретно или непрерывно, в широком или узком диапазоне, – статистиче­ская совокупность распределяется в безынтервальный или интер­вальный вариационные ряды. В первом случае частоты относятся непосредственно к ранжированным значениям признака, которые приобретают положение отдельных групп или классов вариаци­онного ряда, во втором – подсчитывают частоты, относящиеся к отдельным промежуткам или интервалам (от – до), на которые разбивается общая вариация признака в пределах от минималь­ной до максимальной варианты данной совокупности. Эти проме­жутки, или классовые интервалы, могут быть равными и не рав­ными по ширине. Отсюда различают равно- и неравноинтервальные вариационные ряды. В неравноинтервальных рядах характер распределения час­тот меняется по мере изменения ширины классовых интервалов. Неравноинтервальную группировку в биологии применяют сравнительно редко. Как правило, биометрические данные рас­пределяются в равноинтервальные ряды, что позволяет не только выявлять закономерность варьирования, но и облегчает вычисле­ние сводных числовых характеристик вариационного ряда, сопо­ставление рядов распределения друг с другом.

Приступая к построению равноинтервального вариационного ряда, важно правильно наметить ширину классового интервала. Дело в том, что грубая группировка (когда устанавливают очень широкие классовые интервалы) искажает типичные черты варьи­рования и ведет к снижению точности числовых характеристик ряда. При выборе чрезмерно узких интервалов точность обобщающих числовых характеристик повышается, но ряд получается слишком растянутым и не дает четкой картины варьирования.

Для получения хорошо обозримого вариационного ряда и обеспечения достаточной точности вычисляемых по нему числовых характеристик следует разбить вариацию признака (в пределах от минимальной до максимальной варианты) на такое число групп или классов, которое удовлетворяло бы обоим требо­ваниям. Эту задачу решают делением размаха варьирования признака на число групп или классов, намечаемых при построе­нии вариационного ряда:

,

где h – величина интервала; X м a x и X min – максимальное и минимальное значения в совокупности; k – число групп.

При построении интервального ряда распределения необходимо выбирать оптимальное число групп (интервалов признака) и установливать длину (размах) интервала. Поскольку при анализе ряда распределения сравнивают частоты в разных интервалах, необходимо, чтобы длина интервалов была постоянной. Если приходится иметь дело с интервальным рядом распределения с неравными интервалами, то для сопоставимости нужно частоты или частости привести к единице интервала, полученное значение называется плотностью ρ , то есть
.

Оптимальное число групп выбирается так, чтобы достаточной мере отразилось разнообразие значений признака в совокупности и в то же время закономерность распределении, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, не проявится закономерность вариации; если групп будет чрезмерно много, случайные скачки частот исказят форму распределения.

Чаще всего число групп в ряду распределения определяют по формуле Стерждесса:

где n – численность совокупности.

Существенную помощь в анализе ряда распределения и его свойств оказывает графическое изображение. Интервальный ряд изображается столбиковой диаграммой, в которой основания столбиков, расположенные по оси абсцисс, – это интервалы значений варьирующего признака, а высоты столбиков – частоты, соответствующие масштабу по оси ординат. Диаграмма такого типа называется гистограммой.

Если имеется дискретный ряд распределения или используются середины интервалов, то графическое изображение такого ряда называется полигоном , которое получается соединением прямыми точек с координатами X i и f i .

Если по оси абсцисс откладывать значения классов, а по оси ординат – накопленные частоты с последующим соединени­ем точек прямыми линиями, получается график, называемый кумулятой. Накопленные частоты находят последо­вательным суммированием, или кумуляцией частот в направлении от первого класса до конца вариационного ряда.

Пример . Имеются данные о яйценоскости 50 кур-несушек за 1 год, содер­жащихся на птицеферме (табл. 1.1).

Т а б л и ц а 1.1

Яйценоскость кур-несушек

№ курицы-несушки

Яйценоскость, шт.

№ курицы-несушки

Яйценоскость, шт.

№ курицы-несушки

Яйценоскость, шт.

№ курицы-несушки

Яйценоскость, шт.

№ курицы-несушки

Яйценоскость, шт.

Требуется построить интервальный ряд распределения и отобразить его графически в виде гистограммы, полигона и кумуляты.

Видно, что признак варь­ирует от 212 до 245 яиц, полученных от несушки за 1 год.

В нашем примере по формуле Стерждесса определим число групп:

k = 1 + 3,322lg 50 = 6,643 ≈ 7.

Рассчитаем длину (размах) интервала по формуле:

.

Построим интервальный ряд с 7 группами и интервалом 5 шт. яиц (табл. 1.2). Для построения графиков в таблице рассчитаем середину интервалов и накопленную частоту.

Т а б л и ц а 1.2

Интервальный ряд распределения яйценоскости

Группа кур-несушек по величине яйценоскости

X i

Число кур-несушек

f i

Середина интервала

Х i ’

Накопленная частота

f i

Построим гистограмму распределения яйценоскости (рис. 1.1).

Р и с. 1.1. Гистограмма распределения яйценоскости

Данные гистограммы показывают характерную для многих признаков форму распределения: чаще встречаются значения средних интервалов признака, реже – крайние (малые и большие) значения признака. Форма этого распределения близка к нормальному закону распределения, которое образуется, если на варьирующую переменную влияет большое число факторов, ни один из которых не имеет преобладающего значения.

Полигон и кумулята распределения яйценоскости имеют вид (рис. 1.2 и 1.3).

Р и с. 1.2. Полигон распределения яйценоскости

Р и с. 1.3. Кумулята распределения яйценоскости

Технология решения задачи в табличном процессоре Microsoft Excel следующая.

1. Введите исходные данные в соответствии с рис. 1.4.

2. Ранжируйте ряд.

2.1. Выделите ячейки А2:А51.

2.2. Щелкните левой кнопкой мыши на панели инструментов на кнопке <Сортировка по возрастанию > .

3. Определите величину интервала для построения интервального ряд распределения.

3.1. Скопируйте ячейку А2 в ячейку Е53.

3.2. Скопируйте ячейку А51 в ячейку Е54.

3.3. Рассчитайте размах вариации. Для этого введите в ячейку Е55 формулу =E54-E53 .

3.4. Рассчитайте число групп вариации. Для этого введите в ячейку Е56 формулу =1+3,322*LOG10(50) .

3.5. Введите в ячейку Е57 округленное число групп.

3.6. Рассчитайте длину интервала. Для этого введите в ячейку Е58 формулу =E55/E57 .

3.7. Введите в ячейку Е59 округленную длину интервала.

4. Постройте интервальный ряд.

4.1. Скопируйте ячейку Е53 в ячейку В64.

4.2. Введите в ячейку В65 формулу =B64+$E$59 .

4.3. Скопируйте ячейку В65 в ячейки В66:В70.

4.4. Введите в ячейку С64 формулу =B65 .

4.5. Введите в ячейку С65 формулу =C64+$E$59 .

4.6. Скопируйте ячейку С65 в ячейки С66:С70.

Результаты решения выводятся на экран дисплея в следующем виде (рис. 1.5).

5. Рассчитайте частоту интервалов.

5.1. Выполните команду Сервис , Анализ данных , щелкнув поочередно левой кнопкой мыши.

5.2. В диалоговом окне Анализ данных с помощью левой кнопки мыши установите: Инструменты анализа  <Гистограмма> (рис. 1.6).

5.3. Щелкните левой кнопкой мыши на кнопке <ОК>.

5.4. На вкладке Гистограмма установите параметры в соответствии с рис. 1.7.

5.5. Щелкните левой кнопкой мыши на кнопке <ОК>.

Результаты решения выводятся на экран дисплея в следующем виде (рис. 1.8).

6. Заполните таблицу «Интервальный ряд распределения».

6.1. Скопируйте ячейки В74:В80 в ячейки D64:D70.

6.2. Рассчитайте сумму частот. Для этого выделите ячейки D64:D70 и щелкните левой кнопкой мыши на панели инструментов на кнопке <Автосумма > .

6.3. Рассчитайте середину интервалов. Для этого введете в ячейку Е64 формулу =(B64+C64)/2 и скопируйте в ячейки Е65:Е70.

6.4. Рассчитайте накопленные частоты. Для этого скопируйте ячейку D64 в ячейку F64. В ячейку F65 введите формулу =F64+D65 и скопируйте в ячейки F66:F70.

Результаты решения выводятся на экран дисплея в следующем виде (рис. 1.9).

7. Отредактируйте гистограмму.

7.1. Щелкните правой кнопкой мыши на диаграмме на названии «карман» и на появившейся вкладке нажмите кнопку <Очистить>.

7.2. Щелкните правой кнопкой мыши на диаграмме и на появившейся вкладке нажмите кнопку <Исходные данные>.

7.3. В диалоговом окне Исходные данные измените подписи оси Х. Для этого выделите ячейки В64:С70 (рис. 1.10).

7.5. Нажмите клавишу .

Результаты выводятся на экран дисплея в следующем виде (рис. 1.11).

8. Постройте полигон распределения яйценоскости.

8.1. Щелкните левой кнопкой мыши на панели инструментов на кнопке <Мастер диаграмм > .

8.2. В диалоговом окне Мастер диаграмм (шаг 1 из 4) с помощью левой кнопки мыши установите: Стандартные  <График> (рис. 1.12).

8.3. Щелкните левой кнопкой мыши на кнопке <Далее>.

8.4. В диалоговом окне Мастер диаграмм (шаг 2 из 4) установите параметры в соответствии с рис. 1.13.

8.5. Щелкните левой кнопкой мыши на кнопке <Далее>.

8.6. В диалоговом окне Мастер диаграмм (шаг 3 из 4) введите названия диаграммы и ос Y (рис. 1.14).

8.7. Щелкните левой кнопкой мыши на кнопке <Далее>.

8.8. В диалоговом окне Мастер диаграмм (шаг 4 из 4) установите параметры в соответствии с рис. 1.15.

8.9. Щелкните левой кнопкой мыши на кнопке <Готово>.

Результаты выводятся на экран дисплея в следующем виде (рис. 1.16).

9. Вставьте на графике подписи данных.

9.1. Щелкните правой кнопкой мыши на диаграмме и на появившейся вкладке нажмите кнопку <Исходные данные>.

9.2. В диалоговом окне Исходные данные измените подписи оси Х. Для этого выделите ячейки Е64:Е70 (рис. 1.17).

9.3. Нажмите клавишу .

Результаты выводятся на экран дисплея в следующем виде (рис. 1.18).

Кумулята распределения строится аналогично полигону распределения на основе накопленных частот.

Вариационные ряды, их элементы.

Исследователь, интересующийся тариф-ным разрядом рабочих механиче-
ского цеха, провел опрос 100 рабочих. Рас-положим наблюдавшиеся значения
приз-нака в порядке возрастания. Эта операция называется ранжированием ста-
тистичес-ких данных. В результате получим сле-дующий ряд, который называет-
ся ран-жированным:

1,1,..1, 2,2..2, 3,3,..3, 4,4,..4, 5,5,..5, 6,6,..6.

Из ранжированного ряда следует, что ис-следуемый признак (тарифный
разряд) принял шесть различных значений: 1, 2, 3, 4, 5 и 6.

В дальнейшем различные значения приз-нака будем называть варианта-
ми,
а под варьированием - понимать изменение значений признака.

В зависимости от принимаемых призна-ком значений, признаки делятся
на диск-ретно варьирующие и непрерывно ва-рьирующие.

Тарифный разряд - это дискретно ва-рьирующий признак. Число, показы-
ваю-щее, сколько раз встречается вариант х в ряде наблюдений, называется час-
тотой
варианта m x .

Вместо частоты варианта х можно рас-сматривать её отношение к общему
числу наблюдений n, которое называется часто-стью варианта и ее отношение обоз-начается w x .

w x =m x /n=m x /åm x

Таблица, позволяющая судить о распре-делении частот (или частостей) между вариантами, называется дискретным вариационным рядом.

Наряду с понятием частоты использу-ют понятие накопленной частоты,
кото-рую обозначают т x нак. Накопленная час-тота показывает, во скольких на-
блюдени-ях признак принял значения, меньшие за-данного значения х. Отноше-
ние накоп-ленной частоты к общему числу наблю-дений n, называют накоплен-
ной часто-стью
и обозначают w x нак . Очевидно, что



w x нак =m x нак /n=m x нак /åm x .

Накопленные частоты (частости_ для дискретного вариационного ряда, вычес-лены в следующей таблице:

Х m x m x нак w x нак
0+4=4 0,04
4+6=10 0,10
10+12=22 0,22
22+16=38 0,38
38+44=82 0,82
82+18=100 1,00
Выше 6

Пусть необходимо исследовать выработку на одного рабочего – станоч-ника механического цеха в отчётном году в процентах к предыдущему году. Здесь исследуемым признаком х является выработка в отчётном году в процентах к предыдущему. Это непрерывно варьиру-ющий признак. Для выяления характерных черт варьирования значений признака обьединим в группы рабочих, у которых величина выработки колеблется в пределах 10%. Сгруппированные данные представим в таблице:

Иссл. Признак х Кол-во рабочих m Доля рабочих w Накоплен. частота m x нак w x нак
80-90 8/117 8/117
90-100 15/117 8+15=23 23/117
100-110 46/117 23+46=69 69/117
110-120 29/117 69+29=98 98/117
120-130 13/117 98+13=111 111/117
130-140 3/117 111+3=114 114/117
140-150 3/117 114+3=117 117/117
å

В таблице частоты m показывают, во скольких наблюдениях признак принял значения, принадлежащие тому или иному интервалу. Такую частоту называют интервальной, а отношение её к общему числу наблюдений – интервальной частостью w. Таблицу, позволяющую судить о распределении частот между интервалами варьирования значений признака, называют интерва-льным вариационным рядом.

Интервальный вариационный ряд строят по данным наблюдений за не-
прерывно варьирующим признаком, а также за дис-кретно варьирующим, если
велико число наблюдавших вариантов. Дискретный ва-риационный ряд строят
только для дис-кретно варьирующего признака

Иногда интервальный вариационный ряд условно заменяют дискретным.
Тогда се-рединное значение интервала принимают за вариант х, а соответст-
вующую интер-вальную частоту - за т х.

Для определения оптимального постоян-ного интевала h часто используют формулу Стерджесса:

h =(x max – x min)/(1+3.322*lg n ).

Построение инт.вар.рядов

Частоты m показывают, во скольких наблюдениях признак принял значения, принадлежащие тому или иному интервалу. Такую частоту называют интервальной, а отношение ее к общему числу наблюдений - ин­тервальной частостью w. Таблицу, позволяющую судить о распределении частот (или частостей) между интервалами варьирования значений признака, называют интервальным вариационным рядом.

Интервальный вариационный ряд строят по данным наблюдений за не­прерывно варьирующим признаком, а также за дискретно варьирующим, если велико число наблюдавших вариантов. Дискретный вариационный ряд строят только для дискретно варьирующего признака.

Иногда интервальный вариационный ряд условно заменяют дискретным. Тогда серединное значение интервала принимают за вариант х, а соответст­вующую интервальную частоту – за mx

Для построения интервального вариационного ряда необходимо оп­ределить величину интервала, установить полную шкалу интервалов и в соответствии с ней сгруппировать результаты наблюдений.

Для определения оптимального постоянного интервала h часто исполь­зуют формулу Стерджесса:

h = (xmax - xmin) /(1+ 3,322 lg n) .

где xmax xmin - соответственно максимальный и минимальный варианты. Если в результате расчетов h окажется дробным числом, то за величину интервала следует взять либо ближайшее целое число, либо ближайшую несложную дробь.

За начало первого интервала рекомендуется принять величину a1=xmin-h/2; начало второго интервала совпадает с концом первого и равно а2=а1 +h; начало третьего интервала совпадает с концом второго и равно a3=a2 + h. Построение интервалов продолжается до тех пор, пока начало сле­дующего по порядку интервала не будет больше хmах. После установления шкалы интервалов следует сгруппировать результаты наблюдений.

5) Понятие, формы выражения и виды статитстических показателей.

Статистический показатель представляет собой количественную характеристику социально-экономических явлений и процессов в условиях качественной определённости. Качественная определё-нность показателя заключается в том, что он непосредственно связан с внутренним содержанием изучаемого явления или процесса, его сущностью.

Система статистических показателей – это совокупность взаимосвязанных пока-зателей, имеющая одноуровневую или многоуровневую структуру и нацеленная на решение конкретной статистической задачи.

В отличие от признака статистический показатель получается расчётным путём. Это могут быть простой подсчёт единиц совокупности, суммирование их значений признака, сравнение 2 или нескольких величин или более сложные расчёты.

Различают конкретный статистический показатель и показатель-категорию.

Конкретный статистический показа-тель характеризует размер, величину изучаемого явления или процесса в дан-ном месте и в данное время. Однако в теоретических работах и на этапе проектирования статистического наблю-дения также оперируют и абсолютными показателями или показателями-катего-риями.

Показатели-категории отражают сущ-ность, общие отличительные свойства конкретных статистических показателей одного и того же вида без указания места, времени и числового значения. Все статистические показатели делятся по охвату единиц совокупности на индивидуальные и свободные, а по форме – на абсолютные, относительные и сред-ние.

Индивидуальные показатели хара-ктеризуют отдельный объект или отдельную единицу совокупности – предприятие, фирму, банк и т. п. Приме-ром может служить численность промы-шленно-производственного персонала предприятия. На сонове соотнесения двух индивидуальных абсолютных показателей, характеризующих один и тот же объект или единицу, получают индивидуальный относительный показа-тель.

Сводные показатели в отличие от индивидуальных характеризуют группу единиц, представляющую собой часть статистической совокупности или всю совокупность в целом. Эти показатели подразделяются на объемные и рас-чётные.

Объёмные показатели получают путём сложения значений признака отдельных единиц совокупности. Полученная величина, называемая объёмом признака, может выступать в качестве объёмного абсолютного показателя, а может сравниваться с другой объёмной абсолютной величиной или объёмом совокупности. В последних 2 случаях получают объёмный относительный и объёмный средний показатели.

Расчётные показатели , вычисляемые по различным формулам, служат для решения отдельных статистических задач анализа – измерение вариации, характе-ристики структурных сдвигов, оценки взаимосвязи и т. д. Они также делятся на абсолютные, относительные или средние.

В эту группу входят индексы, коэффиценты тесноты связи, ошибки выборки и прочие показатели.

Охват единиц совокупности и форма выражения являются основными, но не единственными классификационными признаками статистических показателей. Важным классификационным признаком также является временный фактор. Соц-экономические процессы и явления находят своё отражение в статистических показателях либо по состоянию на определённый момент времени, как правило, на определённую дату, начало или конец месяца, года, либо за определённый период – день, неделю, месяц, квартал, год. В первом случае показатели являются моментными, во втором – интервальными.

В зависимости от принадлежности к одному или двум объектам изучения различают однообъектные и межобъек-тные показатели . Если первые характеризуют только один объект, то вторые получают в результате сопоставления двух величин, относящихся к разным объектам.

С точки зрения пространственной определённости статистические показатели подразделяются на общетерриториальные , характеризую-щие изучаемый объект или явление в це-лом по стране, региональные и мест-ные , относящиеся к какой-либо части территории или отдельному объекту.

6) Виды и взаимосвязь относительных показателей .

Относительный показатель представляет собой результат деления одного абсолют-ного показателя на другой и выражает соотношение между количественными характеристиками соц-экономических процессов и явлений. Поэтому пог отношению к абсолютным показателям относительные показатели или показатели в форме относительных величин являются производными.

При расчёте относительного показателя абсолютный показатель, находящийся в числителе получаемого отношения, назы-вается текущим или сравниваемым . Показатель же, с которым производится сравнение и который находится в знаменателе, называется основанием или базой сравнения. Относительные показатели могут выражаться в процентах, промилле, коэффицентах или могут быть именованными числами.

Все используемые на практике относительные показатели делятся на:

·динамики; ·плана; ·реализации плана; ·структуры; ·координации; ·интенсив-ности и уровня эк-го развития; ·сравнения.

Относительный показатель данамики пред-ет собой отношение уровня исследуемого процесса или явления за данный период времени к уровню этого же процесса или явления в прошлом.

ОПД=текущий показатель/предшеств. Или базисный показатель.

Рассчитанная таким образом величина показывает, во сколько раз текущий уровень превышает предшествующий или какую долю от последнего составля-ет. Если данный показатель выражен кратным соотношением, он называется коэффициентом роста , при домножении этого коэффициента на 100% получают темп роста.

Относительный показатель структуры представляет собой соотношение структурных частей изучаемого объекта и их целого. Относительный показатель структуры выражается в долях единицы или в процентах. Рассчитанные величины (d i), соответсвенно называемые долями или удельными весами, показывают, ка-каой долей обладает или каокй удельный вес имеет i-ая часть в общем итоге.

Относительные показатели координа-ции характеризуют соотношение отдель-ных частей целого между собой. При этом в качестве базы сравнения выбирается та часть, которая имеет наибольший удельный вес или является приоритетной с экономической, социальной или какой-либо другой точки зрения. В результате получают, сколько единиц каждой структурной части приходится на 1 единицу базисной структурной части.

Относительный показатель интенсив-ности характеризует степень распро-странения изучаемого процесса или явления в присущей ему среде. Этот показатель исчисляется, когда абсолютная величина оказывается недостаточной для формулировки обоснованных выводов о масштабах явления, его размерах, насыщенности, плотности распространения. Он может выражаться в процентах, промилле или быть именованной величиной. Разновид-ностью относительных показателей инте-нсивности являются относительные показатели уровня эко-го развития, характеризующие производство продукции в расчёте на душу населения и играющие важную роль в оценке развития экономики государства. По форме выражения эти показатели близки средним показателям, что нередко приводит к их смешиванию или отждествлению. Разница между ними заключается лишь в том, что при расчётесреднего показателя мы имеем дело с совокупностью единиц, каждая из которых является носителем осредняе-мого признака.

Относительный показатель сравнения представляет собойсоотношение одноименных абсолютных показателей, характеризующих разные объекты (предприятия, фирмы, области, районы и т. д.)

Показатели вариации

Изучение вариации (изменение значений признака в пределах совокуп­ности) имеет большое значение в статистике и социально-экономических ис­следованиях вообще. Абсолютные и относительные показатели вариации, характеризующие колеблемость значений варьирующего признака, позволяют, в частности, измерить степень связи и взаимосвязи, оценить степень однородно­сти совокупности, типичности и устойчивости средней, определить величину возможной погрешности выборочного наблюдения.

К абсолютным показателям вариации относят размах вариации, среднее линейное отклонение, дисперсию, среднее квадратическое отклонение и квар­тальное отклонение.

Размах вариации показывает, на какую величину изменяется значение количественно варьирующего признака

R=xmax-xmin, где xmax(xmin) -максимальное (минимальное) значение признака в совокупности (в ряду распределе­ния).

Среднее линейное отклонение d определяется как средняя величина из отклонений вариантов признака от средней в первой степени, взятых по модулю:

Среднее линейное отклонение сравнительно редко применяется для оценки вариации признака. Обычно вычисляются дисперсия и среднее квадратическое отклонение .

Если необходимо сравнить колеблемость нескольких признаков в одной совокупности или же одного и того же признака в нескольких совокупностях с различными показателями центра распределения, то пользуются относитель­ными показателями вариации.

К ним относятся следующие показатели:

1. Коэффициент осцилляции:

2. Относительное линейное отклонение:

3. Коэффициент вариации:

4. Относительный показатель квартильной вариации:

Наиболее часто применяемый показатель относительной вариации - это коэффициент вариации. Этот показатель используют не только для сравни­тельной оценки вариации, но и как характеристику однородности совокупно­сти. Совокупность считается однородной, если <0,33.

Формы.

1. Стат. отчетность- это такая орг-я форма при которой единицы набл-я предост-т сведения о своей деят-ти в виде формуляров, регламентир-го аппарата.

Особенность отчетности сост-т в том, что она обязат-но обоснован, обяз-на в исполнении и юр-ки подтверждена подписью руководителя или ответственного лица.

2. Специально организованное наблюдение- наиболее яркий и простой пример этой формы набл-я явл. перепись. Перепись как правило проводится через равные промежутки времени, одновременно на всей исслед-й территории в одно и тоже время.

Росс-ми органами статистики проводятся переписи населения отдельных видов п/п и орг-ций, матер-ых ресурсов, многолетних насаждений, объектов НЗ строительства и т.д.

4. Регистровая форма наблюдения- основана на ведении стат-го регистра. В регистре каж. единица набл-я хар-ся рядом показателей. В отечественной статистической практике наиб-ее распространение получили регистры нас-я и регистры п/п.

Регистрация населения – ведется органами ЗАГСа

Регистрация п/п – ЕГРПО вед.орг. статистики.

Виды.

можно разбить на группы по след. признакам:

а) по времени регистрации

б) по охвату единиц сов-ти

По времени рег. они бывают:

Текущие (непрер-е)

Прерывное (периодические и единовременные)

При тек. набл. изменение явлений и процессов фиксируется по мере их поступления (регистрация рождения, смерти, брака, развода и т.д.)

Периодич. набл. проводится через опр. промежутки времени (N перепись населения каждые 10 лет)

Единоврем. набл. проводится либо не регулярно, либо всего один раз (референдум)

По охвату ед. сов-ти стат-е набл. бывают:

Сплошными

Несплошными

Сплошное набл. предст-ет собой обслед-е всех единиц сов-ти

Несплошное набл. предполагает ч. обсл-ю подлежит лишь часть исслед-ий сов-ти.

Сущ-ет несколько видов несплошного набл-я:

Метод осн. массива

Выборочное (самостоятельно)

Монографическое

Этот метод х-ся тем, что отбираются как правило самые существ-е, обычно самые крупные ед. сов-ти в кот. сосред-на значит. часть всех наблх признаков.

При монографическом набл-ии тчательному ан. подвергаются отд. ед. изуч-ой сов-ти или м.б. либо типичные для данной сов-ти ед. либо предст-е собой к-либо новые разновидности явлений.

Многогр-е набл. проводится с целью выявления либо намечающихся тенденции в развитии данного явления.

Способы

Непосредственное набл-е

Документарное набл.

Непосредственным наз. такое набл. при кот. сами регистраторы путем непоср-го замера, подсчета, сдерживания уст-т факт подлежащий рег-ии и на этом основании делают запись в формуляре.

Документарный способ набл. основан на исп-ии в качестве источников инф-ции разл-х док-ов как правило учетного х-ра (т.е. стат. отчетность)

Опрос- это способ убеждения при кот. необходимые сведения получ-т со слов респондента (т.е. опрашиваемого) (устный, корреспондентский, анкетный, явочный и т.д.)

Определение ошибок выборки.

В процессе проведения выборочного наблюдения выделяют два вида ошибок: регистрации и репрезентативности.

Ошибки регистрации – отклонения между значением показателя, получен-ного при проведении статистического наблюдения, и действительным его значением. Эти ошибки могут появляться и при сплошном, и при несплошном наблюдении. Ошибки регистрации возни-кают из-за неправильных или неточных сведений. Источниками этого вида оши-бок могут быть непонимание сущности вопроса, невнимательность регистратора, пропуск или повторный счёт отдельных единиц наблюдения. Ошибки регистра-ции подразделяются на систематичес-кие , обусловленные причинами, действу-ющими в каком-либо одном направлении и сглаживающими результаты обследова-ния (округление цифр), и случайные , яв-ляющиеся результатом действия различ-ных случайных факторов (перестановка местами соседних цифр). Случайные ошибки имеют разную направленность и при достаточно большом объёме обследуемой совокупности взаимно погашаются.

Ошибки репрезентативности – откло-нения значений показателя обследован-ной совокупности от его значения в ис-ходной совокупности. Эти ошибки также подразделяются на систематические , по-являющиеся вследствие нарушения принципов отбора подлежащих наблюде-нию единиц из исходной совокупности, и случайные , которые возникают, если отобранная совокупность неполно вос-производит всю совокупность в целом. Величина случайной ошибки может быть оценена.

Ошибка выборочного наблюдения – разность между значением признака в ге-неральной совокупности и его значением, рассчитанным по результатам выбороч-ного наблюдения. В практике выбороч-ных обследований наиболее часто опре-деляется средняя и предельная ошибки выборки.

Средняя ошибка выборки для различных спосбов отбора вычисляется по разному. Если случайный или мех-ий отбор, то

Для средней: m = s 2 / (n) 1/2

Для доли: m = (w(1-w)/n) 1/ 2 , где

m - средняя ошибка выборки

s 2 – генеральная дисперсия

n – объём выборочной совокупности

Если выборочная совокупность формируется на основе типической выборки и отбор единиц осуществляется пропорционально объёму типических групп, то средняя ошибка равна:

Для средней: m = (s i 2 / n) 1/2

Для доли: m = (w i (1-w i) / n) 1/2 , где

s i 2 – средняя из внутригрупп-х дисперсий

w i – доля единиц в итой группе, обладающих исследуемым признаком.

s i 2 = ås 2 n i / ån i

Cредняя ошибка серийной выборки рав-на:

Для средней: m = (d х 2 / r) 1/2

Для доли: m = (d 2 w / r) 1/2

d 2 w – межгрупповая дисперсия доли

d х 2 – межгрупповая дисперсия количес-твенного признака.

r– число отобранных серий/

d 2 x = å(x i -x) 2 / r

d 2 w = å(w i – w) 2 / r

Если отбор единиц из генеральной совокупности производится бесповторным способом, то в формулы средней ошибки вносится поправка: (1-n/N) 1/2

Предельная ошибка выборки D рас-считывается как произведение коэффици-ента доверия t и средней ошибки вы-борки: D = t*m. D связана с гарантирующим её уровнем доверия вероятности. Этот уровень определяет коэффициент доверия t, и наоборот. Значения t приводятся в специальных математических таблицах.

Определение объёма выборки.

Объём выборки рассчитывается, как правило, на стадии проектирования вы-борочного обследования. Формулы для определения численности выборки следуют из формул предельных ошибок выборки.

Объём собственно случайной и механической повторных выборок определяется по формулам:

Для средней n = t 2 s 2 / D 2

Для доли n = t 2 w(1-w) / D 2

В случае бесповторной выборки:

Для средней n = t 2 s 2 N / ND 2 +t 2 s 2

Для доли n = t 2 w(1-w)N / ND 2 +t 2 w(1-w) .

Величины s 2 и w до проведения выбо-рочного наблюдения неизвестны. Приб-лижённо их находят так:

1. берут из предыдущих обследований;

2. если известны максимально и минимальное значения признака, то среднеквадратическое отклонение определяют по правилу «трёх сигм»:

s = x max – x min / 6

3. при изучении альтернативного призна-ка, если нет никаких сведений о его доле в генеральной совокупности, берётся максимально возможная величина w=0,5

При типическом отборе, пропорциона-льном объёму типических групп, объём выборки по каждой группе определяется формулой: n i = n*N i / N , где

n i – объём выборки из i-той группы

N i – объём i –той группы в ген-ой сов-ти.

При выборке, пропорциональной вариа-ции признака, численность выборки из каждой группы находят так: n i = nN i s i /åN i s i .

При типической повторной выборке, пропорциональной объёму групп, общую численность выборки находят так:

Для средней n = t 2 s 2 i / D 2

Для доли n = t 2 w(1-w) / D 2

В случае бесповторной типической выборки:

Для средней n = t 2 s 2 i N / D 2 N+t 2 s 2 i

Для доли n = t 2 w(1-w)N / D 2 N+t 2 w(1-w)

Основные понятия и предпосылки применения корреляционно-регрессион-ного анализа.

Корреляция – это статистическая зависи-мость между случайными величинами, не имеющими строго функционального ха-рактера, при которой изменение одной из случайных величин приводит к изме-нению матем-ского ожидания другой.

Корреляционный анализ – имеет своей за-дачей количественное определение тес-ноты связи между двумя признаками и между результативными и множеством факторных признаков. Теснота связи ко-личественно выражается величиной коэффициентов корреляции.

Корреляционно-регрессионный анализ как общее понятие включает в себя измере-ние тесноты, направления связи и уста-новление аналитического выражения (фо-рмы) связи (регрессионный анализ).

Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной вели-чины (называемой зависимой или резуль-тативным признаком) обусловлено влия-нием одной или нескольких независимых величин (факторов), а множество всех прочих факторов, также оказывающих влияние на зависимую величину, прини-мается за постоянные и средние значе-ния. Регрессия может быть однофактор-ной (парной) и многофакторной (множес-твенной).

Целью регрессионного анализа являет-ся оценка функциональной зависимости условного среднего значения результа-тивного признака (У) от факторных (х 1 , х 2 , …х к) признаками.

Основной предпосылкой регрессионно-го анализа является то, что только резу-льтативный признак (У) подчиняется нормальному закону распределения, а факторные признаки х 1 , х 2 ,…,х к могут иметь произвольный закон распределе-ния. В анализе динамических рядов в качестве факторного признака выступает время t. При этом в регрессионном анализе заранее подразумевается наличие причинно-следственных связей между результативным (У) факторными (х 1 , х 2 ,…,х к) признаками. Уравнение регрессии, или статистическая модель связи социально-экономических явлений, выражаемая функцией У х =f(х 1 , х 2 ,…,х к), является достаточно адекватным реаль-ному моделируемому явлению или процессу в случае соблюдения следую-щих требований их построения .

1. Совокупность исследуемых исходных данных д/б однородной и математически описываеться непрерывными функциями.

2. Возможность описания моделируемого явления одним или несколькими уравне-ниями причинно-следственных связей.

3. Все факторные признаки должны иметь количественное (цифровое) выра-жение.

4. Наличие достаточно большого объёма исследуемой выборочной совокупности.

5. Причинно-следственные связи между явлениями и процессами следует описы-вать линейной или приводимой к линей-ной формами зависимости.

6. Отсутствие количественных ограниче-ний на параметры модели связи.

7. Постоянство территориальной и вре-менной структуры изучаемой совокуп-ности.

Теоретическая обоснованность моде-лей взаимосвязи, построенных на основе корреляционно-регрессионного анализа, обеспечивается соблюдением следующих основных условий .

1. Все признаки и их совместные распределения должны подчиняться нор-мальному закону распределения;

2. Дисперсия моделируемого признака (У) должна всё время оставаться постоян-ной при изменении величины (У) и зна-чений факторных признаков.

3. Отдельные наблюдения д/б независи-мыми, т. е. результаты, полученные в i - ом наблюдении, не должны быть связа-ны с предыдущими и содержать инфор-мацию о последующих наблюдениях, а также влиять на них.

ЗАДАЧИ СВОДКИ И ЕЕ СОДЕРЖАНИЕ

наблюдение дает сведения по каждой единице исследуемого объекта. Полученные данные не являются обобщающими показателями. С их помощью нельзя сделать выводы в целом об объекте без предварительной обработки данных.

Поэтому цель следующего этапа статистического исследования состоит в систематизации первичных данных и получении на этой основе сводной характеристики всего объекта при помощи обобщающих статистических пок-лей.

Сводка - комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом.

если при статистическом наблюдении собирают данные о каждой единице объекта, то результатом сводки являются подробные данные, отражающие в целом всю совокупность

Стат-ая сводка должна вестись на основе предварительного теоретического анализа явлений и процессов, чтобы во время сводки не потерять информацию об исследуемом явлении и все статистические итоги отражали важнейшие характерные черты объекта.

По глубине обработки материала сводка бывает простая и сложная.

Простой сводкой наз-ся операция по подсчету общих итогов по сов-ти единиц наблюдения.

Сложная сводка - комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему объекту и представление результатов группировки и сводки в виде статистических табл.

Проведению сводки предшествует разработка ее программы, которая состоит из следующих этапов: выбор группировочных признаков; определение порядка формирования групп; разработка системы статистических пок-лей для характеристики групп и объекта в целом; разработка системы макетов статистических табл, в которых должны быть представлены результаты сводки.

По форме обработки материала сводка: децентрализованная и централизованная.

При децентрализованной сводке (именно она используется, как правило, при обработке стат-ой отчетности) разработка мат-ла производится последовательными этапами. Так, отчеты предприятий сводятся статистическими органами субъектов Российской Федерации, а уже итоги по региону поступают в Госкомстат России, и там определяются пок-ли в целом по народному хозяйству страны.

При централизованной сводке весь первичный материал поступает в одну организацию, где и подвергается обработке от начала и до конца. Централизованная сводка обычно используется для обработки материалов единовременных статистических обследований.

По технике выполнения статистическая сводка подразделяется на механизированную и ручную.

Механизированная сводка - при котором все операции осуществляются с помощью применения электронно-вычислительных машин. При ручной сводке все основные операции (подсчет групповых и общих итогов) осуществляются вручную.

Для проведения сводки составляется план, в котором излагаются организационные вопросы: кем и когда будут осуществляться все операции, порядок ее проведения, состав сведений, подлежащих опубликованию в периодической, печати.

Смыкание рядов дин-ки

При анализе рядов дин-ки возникает необходимость их смыкания-объединения двух и более рядов в один ряд. Смыкание необходимо в тех случаях, когда уровни рядов несопоставимы в связи с территориальными изменениями, в связи с изменением цен и в связи с изменением м-дики исчисления уровней ряда. необходимо сомкнуть (объединить) приведенные выше два ряда в один. Это можно сделать при помощи коэффициента сопоставимости. Умножая на полученный коэффициент данные за г., получим сомкнутый (сопоставимый) ряд дин-ки абсолютных величин 2 способ смыкания рядов дин-ки (способ приведения к одному основанию) заключается в том, что уровни года, в котором произошли изменения, как до изменения, так и после изме-й принимаются за 100%, а остальные пересчитываются в процентах по отн-ию к этим уровням соответственно.

30. М-ды выравнивания рядов дин-ки

Всякий ряд дин-ки теоретически может быть представлен в виде трех составляющих:

Тренда (основной тенд-и развития динамического ряда);

Циклических (периодических) колебаний, в том числе сезонных;

Случайных колебаний.

Одной из задач, возникающих при анализе рядов дин-ки, является установление изменения уровней изучаемого явления. В некоторых случаях закономерность изменения уровней ряда дин-ки вполне ясна, например, либо систематическое снижение уровней ряда, либо их повышение. иногда уровни ряда претерпевают самые различные изменения (то возрастают, го убывают). В этом случае можно говорить лишь об общей тенд-и разви-ия: либо к росту, либо к снижению.

Выявление основной тенд-и развития (тренда) наз-ся выравниванием временного ряда, а м-ды выявления основной тенден- м-ды выравнивания.

Непосредственное выделение тренда может быть произведено тремя ме-ми.

* М-д укрупнения интервалов. Этот м-д основан на укрупнении пер времени, к которым относятся уровни ряда. Например, ряд дин-ки

суточного выпуска продукции заменяется рядом месячного выпуска проекции и т.д.

* М-д скользящей средней. В этом м-де исходные уровни ряда заменяются средними величинами, к-ые получают из данного уровня и нескольких симметрично его окружающих. Целое число уровней, по которым рассчитывается среднее значение, называют интервалом сглаживания. Интервал сглаживания может быть нечетным (3, 5, 7 и т.д. точек) и четным (2, 4, 6 и т.д. точек). Расчет средних ведется способом скольжения, то есть постепенным исключением из принятого периода скольжения первого уровня и включение следующего. При нечетном сглаживании полученное среднее арифметическое значение закрепляют за серединой расчетного интервала.

«-» м-дики сглаживания скользящими средними состоит в условности определения сглаженных уровней для точек в начале и конце ряда.

* Аналит-ое выравнивание- является наиболее эффективным способом выявления основной тенд-и развития. При этом уровни ряда дин-ки выражаются в виде функции времени: Yt=f(t)

Целью аналит-ого выравнивания дин-го ряда является определение аналит-ой зав-ти f(t). На практике по имеющемуся временному ряду задают вид и находят параметры функции f(t), а затем анализируют поведение отклонений от тенд-и.

В экономике часто применяется функция вида: Уi = а0 +∑ аi +ti

Из функции вида (3.12) чаще всего при выравнивании используется линейная зав-ть /(*) = ао + а1 *t или параболическая f(t) = a0 +att + a2 t2.

Коэффициенты ао,а,а2,...,ар в формуле находятся МНК.

Согласно этому м-ду для нахождения параметров полинома р-ой степени необходимо решить систему так называемых нормальных уравнений:

nаo+a1∑t=∑Y

ao∑t+ a1∑t*t= ∑Y*t.

Тренд показывает, как воздействуют систематические факторы на уро- ряда дин-ки. Колеблемость уровней около тренда служит мерой воздействия остаточных (случайных) факторов. Эту меру воздействия можно оценить

по формуле среднего квадратичного отклонения.

Основные понятия корреляционно-регрессионного анализа.

Статистический ряд распределения – это упорядоченное распределение единиц совокупности на группы по определённому варьирующему признаку.
В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения .

Наличие общего признака является основой для образования статистической совокупности, которая представляет собой результаты описания или измерения общих признаков объектов исследования.

Предметом изучения в статистике являются изменяющиеся (варьирующие) признаки или статистические признаками.

Виды статистических признаков .

Атрибутивными называют ряды распределения , построенные по качественным признакам. Атрибутивный – это признак, имеющий наименование, (например профессия: швея, учитель и т.д.).
Ряд распределения принято оформлять в виде таблиц. В табл. 2.8 приведён атрибутивный ряд распределения.
Таблица 2.8 - Распределение видов юридической помощи, оказанной адвокатами гражданам одного из регионов РФ.

Вариационный ряд – это значения признака (или интервалы значений) и их частоты.
Вариационными рядами называют ряды распределения , построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот.
Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду.
Частоты – это численности отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, её объём.
Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100 %. Вариационный ряд позволяет по фактическим данным оценить форму закона распределения.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды .
Пример дискретного вариационного ряда приведен в табл. 2.9.
Таблица 2.9 - Распределение семей по числу занимаемых комнат в отдельных квартирах в 1989 г. в РФ.

В первой колонке таблицы представлены варианты дискретного вариационного ряда, во второй – помещены частоты вариационного ряда, в третьей – показатели частости.

Вариационный ряд

В генеральной совокупности исследуется некоторый количественный признак. Из нее случайным образом извлекается выборка объема n , то есть число элементов выборки равно n . На первом этапе статистической обработки производят ранжирование выборки, т.е. упорядочивание чисел x 1 , x 2 , …, x n по возрастанию. Каждое наблюдаемое значение x i называется вариантой . Частота m i – это число наблюдений значения x i в выборке. Относительная частота (частость) w i – это отношение частоты m i к объему выборкиn : .
При изучении вариационного ряда также используют понятия накопленной частоты и накопленной частости. Пусть x некоторое число. Тогда количество вариантов, значения которых меньше x , называется накопленной частотой: для x i n называется накопленной частостью w i max .
Признак называется дискретно варьируемым, если его отдельные значения (варианты) отличаются друг от друга на некоторую конечную величину (обычно целое число). Вариационный ряд такого признака называется дискретным вариационным рядом.

Таблица 1. Общий вид дискретного вариационного ряда частот

Значения признака x i x 1 x 2 x n
Частоты m i m 1 m 2 m n

Признак называется непрерывно варьирующим, если его значения отличаются друг от друга на сколь угодно малую величину, т.е. признак может принимать любые значения в некотором интервале. Непрерывный вариационный ряд для такого признака называется интервальным.

Таблица 2. Общий вид интервального вариационного ряда частот

Таблица 3. Графические изображения вариационного ряда

Ряд Полигон или гистограмма Эмпирическая функция распределения
Дискретный
Интервальный
Просматривая результаты проведенных наблюдений, определяют, сколько значений вариантов попало в каждый конкретный интервал. Предполагается, что каждому интервалу принадлежит один из его концов: либо во всех случаях левые (чаще), либо во всех случаях правые, а частоты или частости показывают число вариантов, заключенных в указанных границах. Разности a i – a i +1 называются частичными интервалами. Для упрощения последующих расчетов интервальный вариационный ряд можно заменить условно дискретным. В этом случае серединное значение i -го интервала принимают за вариант x i , а соответствующую интервальную частоту m i – за частоту этого интервала.
Для графического изображения вариационных рядов наиболее часто используются полигон, гистограмма, кумулятивная кривая и эмпирическая функция распределения.

В табл. 2.3 (Группировка населения России по размеру среднедушевого дохода в апреле 1994г.) представлен интервальный вариационный ряд .
Удобно ряды распределения анализировать при помощи графического изображения, позволяющего судить и о форме распределения. Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма .
Полигон используется при изображении дискретных вариационных рядов .
Изобразим, например графически распределение жилого фонда по типу квартир, (табл. 2.10).
Таблица 2.10 - Распределение жилого фонда городского района по типу квартир (цифры условные).


Рис. Полигон распределения жилого фонда


На оси ординат могут наноситься не только значения частот, но и частостей вариационного ряда.
Гистограмма принимается для изображения интервального вариационного ряда . При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков в случае равных интервалов должна быть пропорциональна частотам. Гистограмма – график, на котором ряд изображен в виде смежных друг с другом столбиков.
Изобразим графически интервальный ряд распределения, приведённый в табл. 2.11.
Таблица 2.11 - Распределение семей по размеру жилой площади, приходящейся на одного человека (цифры условные).
N п/п Группы семей по размеру жилой площади, приходящейся на одного человека Число семей с данным размером жилой площади Накопленное число семей
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
ВСЕГО 115 ----


Рис. 2.2. Гистограмма распределения семей по размеру жилой площади, приходящейся на одного человека


Используя данные накопленного ряда (табл. 2.11), построим кумуляту распределения.


Рис. 2.3. Кумулята распределения семей по размеру жилой площади, приходящейся на одного человека


Изображение вариационного ряда в виде кумуляты особенно эффективно для вариационных рядов, частоты которых выражены в долях или процентах к сумме частот ряда.
Если при графическом изображении вариационного ряда в виде кумуляты оси поменять, то мы получим огиву . На рис. 2.4 приведена огива, построенная на основе данных табл. 2.11.
Гистограмма может быть преобразована в полигон распределения, если найти середины сторон прямоугольников и затем эти точки соединить прямыми линиями. Полученный полигон распределения изображён на рис. 2.2 пунктирной линией.
При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах.
Плотность распределения – это частота, рассчитанная на единицу ширины интервала, т.е. сколько единиц в каждой группе приходится на единицу величины интервала. Пример расчета плотности распределения представлен в табл. 2.12.
Таблица 2.12 - Распределение предприятий по числу занятых (цифры условные)
N п/п Группы предприятий по числу занятых, чел. Число предприятий Величина интервала, чел. Плотность распределения
А 1 2 3=1/2
1 До 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
ВСЕГО 147 ---- ----

Для графического изображения вариационных рядов может также использоваться кумулятивная кривая . При помощи кумуляты (кривой сумм) изображается ряд накопленных частот. Накопленные частоты определяются путём последовательно суммирования частот по группам и показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение.


Рис. 2.4. Огива распределения семей по размеру жилой площади, приходящейся на одного человека

При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда, а по оси ординат накопленные частоты.

Статистические ряды распределения представляют собой упорядоченное расположение единиц изучаемой совокупности на группы по группировочному признаку.

Различают атрибутивные и вариационные ряды распределения.

Атрибутивный - это ряд распределения, построенный по качественным признакам. Он характеризует состав совокупности по различным существенным признакам.

По количественному признаку строится вариационный ряд распределения. Он состоит из частоты (численности) отдельных вариантов или каждой группы вариационного ряда. Данные числа показывают, насколько часто встречаются различные варианты (значения признака) в ряду распределения. Сумма всех частот определяет численность всей совокупности.

Численности групп выражаются в абсолютных и относительных величинах. В абсолютных величинах выражается числом единиц совокупности в каждой выделенной группе, а в относительных величинах - в виде долей, удельных весов, представленных в процентах к итогу.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды распределения. В дискретном вариационном ряде распределения группы составлены по признаку, изменяющемуся дискретно и принимающему только целые значения.

В интервальном вариационном ряде распределения группиро-вочный признак, составляющий основание группировки, может принимать в определенном интервале любые значения.

Вариационные ряды состоят из двух элементов: частоты и варианты.

Вариантой называют отдельное значение варьируемого признака, которое он принимает в ряду распределения.

Частота - это численность отдельных вариант или каждой группы вариационного ряда. Если частоты выражены в долях единицы или в процентах к итогу, то их называют частостями.

Правила и принципы построения интервальных рядов распределения строятся по аналогичным правилам и принципам построения статистических группировок. Если интервальный вариационный ряд распределения построен с равными интервалами, частоты позволяют судить о степени заполнения интервала единицами совокупности. Для проведения сравнительного анализа заполненности интервалов определяют показатель, который будет характеризовать плотность распределения.

Плотность распределения - это отношение числа единиц совокупности к ширине интервала.

Вариационными называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами считаются отдельные значения признака, которые он принимает в вариационном ряду, т е. конкретное значение варьирующего признака. Частоты - это численности отдельных вариантов или каждой группы вариационного ряда, т. е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем.

Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды.

Как известно, вариация количественных признаков может быть дискретной (прерывной) или непрерывной.

В случае дискретной вариации величина количественного признака принимает только целые значения. Следовательно, дискретный вариационный рядхарактеризует распределение единиц совокупности по дискретному признаку. Примером дискретного вариационного ряда является распределение семей по числу комнат в отдельных квартирах, приведенное в табл. 3.12.

В первой колонке таблицы представлены варианты дискретного вариационного ряда, во второй - помещены частоты вариационного ряда, а в третьей - показаны частости.

В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения, отличающиеся друг от друга на сколько угодно малую величину. Построение интервальных вариационныхрядов целесообразно прежде всего при непрерывной вариации признака, а также если дискретная вариация проявляется в широких пределах, т. е. число вариантов дискретного признака достаточно велико. В табл. 3.3 представлен интервальный вариационный ряд.

Графическое изображение рядов распределения

Анализ рядов распределения можно проводить на основе их графического изображения. Линейчатые и круговые диаграммы строятся для отображения структуры совокупности.

Применяются вместе с диаграммами и такие линии, как полигон, кумулята, огива, гистограмма. При изображении дискретных вариационных рядов используется полигон.

Полигон - ломаная кривая, строится на основе прямоугольной системы координат, когда по оси Х откладываются значения признака, а по оси У - частоты.

Гладкая кривая, соединяющая точки - это эмпирическая плотность распределения.

Кумулята - ломаная кривая, строящаяся на основе прямоугольной системы координат, когда по оси Х откладываются значения признака, а по оси У - накопленные частоты.

Для дискретных рядов на оси откладываются сами значения признака, а для интервальных - середины интервалов.

На основе гистограмм можно строить диаграммы накопленных частот с последующим построением интегральной эмпирической функции распределения.



Последние материалы раздела:

Важность Патриотического Воспитания Через Детские Песни
Важность Патриотического Воспитания Через Детские Песни

Патриотическое воспитание детей является важной частью их общего воспитания и развития. Оно помогает формировать у детей чувство гордости за свою...

Изменение вида звездного неба в течение суток
Изменение вида звездного неба в течение суток

Тема урока «Изменение вида звездного неба в течение года». Цель урока: Изучить видимое годичное движение Солнца. Звёздное небо – великая книга...

Развитие критического мышления: технологии и методики
Развитие критического мышления: технологии и методики

Критическое мышление – это система суждений, способствующая анализу информации, ее собственной интерпретации, а также обоснованности...