Как рассчитать среднее значение в статистике. Как найти среднее арифметическое и среднее геометрическое чисел

Больше всего в эк. практике приходится употреблять среднюю арифметическую, которая может быть исчислена как средняя арифметическая простая и взвешенная.

Средняя арифметическая (СА) аиболее распространенный вид средних. Она применяется в тех случаях, когда объем варьирующего признака для всей совокупности является суммой значений признаков отдельных ее единиц. Для общест­венных явлений характерна аддитивность (суммарность) объе­мов варьирующего признака, этим определяется область при­менения СА и объясняется ее распро­страненность как обобщающего показателя, напр: общий фонд з/ п – это сумма з/п всех работников.

Чтобы исчислить СА, нужно сумму всех значений признаков разделить на их число. СА примен-ся в 2 формах.

Рассмотрим сначала простую арифметическую среднюю.

1-СА простая (исходная, определяющая форма) равна простой сумме отдельных значений осредняемого признака, деленной на общее число этих значений (применяется когда имеются несгруппированные инд. значения признака):

Произведенные вычисления могут быть обобщены в следующую формулу:

(1)

где - среднее значение варьирующего признака, т. е. средняя арифметическая простая;

означает суммирование, т. е. сложение отдельных признаков;

x - отдельные значения варьирующего признака, которые называются вариантами;

n - число единиц совокупности

Пример1, требуется найти среднюю выработку одного рабочего (слесаря), если известно, сколько деталей изготовил каждый из 15 рабочих, т.е. дан ряд инд. значений признака, шт.: 21; 20; 20; 19; 21; 19; 18; 22; 19; 20; 21; 20; 18; 19; 20.

СА простая рассчитывается по формуле(1),шт.:

Пример2 . Рассчитаем СА на основании условных данных по 20 магазинам, входящим в торговую фирму (табл. 1). Таблица.1

Распределение магазинов торговой фирмы "Весна" по торговой площади, кв. М

№ магазина

№ магазина

Для вычисления средней площади магазина () необходимо сложить площади всех магазинов и полученный результат разделить на число магазинов:

Т.о., средняя площадь магазина по этой группе торговых предприятий составляет 71 кв.м.

Следовательно, чтобы определить СА простую, нужно сумму всех значений данного признака разделить на число единиц, обладающих этим признаком .

2

где f 1 , f 2 , … ,f n веса (частоты повторения одинаковых признаков);

– сумма произведений величины признаков на их частоты;

– общая численность единиц совокупности.

- СА взвешенная - с редняя из вариантов, которые повторяются различное число раз, или, как говорят, имеют различный вес. В качестве весов выступают численности единиц в разных группах совокупности (в группу объединяют одинаковые варианты). СА взвешенная средняя сгруппиро­ванных величин x 1 , x 2 , .., x n , вычисляется: (2)

Где х - варианты;

f - частота (вес).

СА взвешенная есть частное от деления суммы произведений вариантов и соответствующих им частот на сумму всех частот. Частоты (f ) фигурирующие в формуле СА, принято называть весами , вследствие чего СА, вычисленная с учетом весов, и получила название взвешенной.

Технику вычисления СА взвешенной проиллюстрируем на рассмотренном выше примере 1. Для этого сгруппируем исходные данные и поместим их в табл.

Средняя из сгруппированных данных определяется следующим образом: сначала перемножают варианты на частоты, затем складывают произведения и полученную сумму делят на сумму частот.

По формуле (2) СА взвешенная равна, шт.:

Распределение рабочих по выработке деталей

П

риведенные в предыдущем примере 2 данные можно объединить в однородные группы, которые представлены в табл.Таблица

Распределение магазинов фирмы "Весна" по торговой площади, кв. м

Т.о., результат получился тот же самый. Однако это уже будет величина средняя арифметическая взвешенная.

В предыдущем примере мы вычисляли арифметическую среднюю при условии, что известны абсолютные частоты (численность магазинов). Однако в ряде случаев абсолютные частоты отсутствуют, а известны относительные частоты, или, как принято их называть, частости, которые показывают долю или удельный вес частот во всей совокупности.

При расчетах СА взвешенной использование частот позволяет упрощать расчеты, когда частота выражена большими, многозначными числами. Расчет производится тем же способом, однако, так как средняя величина оказывается увеличенной в 100 раз, полученный результат следует разделить на 100.

Тогда формула средней арифметической взвешенной будет иметь вид:

где d – частость , т.е. доля каждой частоты в общей сумме всех частот.

(3)

В нашем примере 2 сначала определяют удельный вес магазинов по группам в общей численности магазинов фирмы "Весна". Так, для первой группы удельный вес соответствует 10%
. Получаем следующие данныеТаблица3

В математике среднее арифметическое значение чисел (или просто среднее) — это сумма всех чисел в данном наборе, разделенная на их количество. Это наиболее обобщенное и распространенное понятие средней величины. Как вы уже поняли, чтобы найти нужно суммировать все данные вам числа, а полученный результат разделить на количество слагаемых.

Что такое среднее арифметическое?

Давайте рассмотрим пример.

Пример 1 . Даны числа: 6, 7, 11. Нужно найти их среднее значение.

Решение.

Для начала найдем сумму всех данных чисел.

Теперь разделим получившуюся сумму на количество слагаемых. Так как у нас слагаемых три, соответственно, мы будем делить на три.

Следовательно, среднее значение чисел 6, 7 и 11 — это 8. Почему именно 8? Да потому, что сумма 6, 7 и 11 будет такая же, как трех восьмерок. Это отлично видно на иллюстрации.

Среднее значение чем-то напоминает «выравнивание» ряда чисел. Как видите, кучки карандашей стали одного уровня.

Рассмотрим еще один пример, чтобы закрепить полученные знания.

Пример 2. Даны числа: 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29. Нужно найти их среднее арифметическое значение.

Решение.

Находим сумму.

3 + 7 + 5 + 13 + 20 + 23 + 39 + 23 + 40 + 23 + 14 + 12 + 56 + 23 + 29 = 330

Делим на количество слагаемых (в этом случае — 15).

Следовательно, среднее значение данного ряда чисел равно 22.

Теперь рассмотрим отрицательные числа. Вспомним, как их суммировать. Например, у вас есть два числа 1 и -4. Найдем их сумму.

1 + (-4) = 1 - 4 = -3

Зная это, рассмотрим еще один пример.

Пример 3. Найти среднее значение ряда чисел: 3, -7, 5, 13, -2.

Решение.

Находим сумму чисел.

3 + (-7) + 5 + 13 + (-2) = 12

Так как слагаемых 5, разделим получившуюся сумму на 5.

Следовательно, среднее арифметическое значение чисел 3, -7, 5, 13, -2 равно 2,4.

В наше время технологического прогресса гораздо удобнее использовать для нахождения среднего значения компьютерные программы. Microsoft Office Excel — одна из них. Искать среднее значение в Excel быстро и просто. Тем более, эта программа входит в пакет программ от Microsoft Office. Рассмотрим краткую инструкцию, значение с помощью этой программы.

Для того чтобы посчитать среднее значение ряда чисел, необходимо использовать функцию AVERAGE. Синтаксис для этой функции:
= Average (argument1, argument2, ... argument255)
где argument1, argument2, ... argument255 — это либо числа, либо ссылки на ячейки (под ячейками подразумеваются диапазоны и массивы).

Чтобы было более понятно, опробуем полученные знания.

  1. Введите числа 11, 12, 13, 14, 15, 16 в ячейки С1 - С6.
  2. Выделите ячейку С7, нажав на нее. В этой ячейке у нас будет отображаться среднее значение.
  3. Щелкните на вкладке «Формулы».
  4. Выберите More Functions > Statistical для того, чтобы открыть
  5. Выберите AVERAGE. После этого должно открыться диалоговое окно.
  6. Выделите и перетащите туда ячейки С1-С6, чтобы задать диапазон в диалоговом окне.
  7. Подтвердите свои действия клавишей «ОК».
  8. Если вы все сделали правильно, в ячейке С7 у вас должен появиться ответ - 13,7. При нажатии на ячейку C7 функция (= Average (C1: C6)) будет отображаться в строке формул.

Очень удобно использовать эту функцию для ведения учета, накладных или когда вам просто нужно найти среднее значение из очень длинного ряда чисел. Поэтому ее часто используют в офисах и крупных компаниях. Это позволяет сохранять порядок в записях и дает возможность быстро посчитать что-либо (например, средний доход за месяц). Также с помощью Excel можно найти среднее значение функции.

Важнейшее свойство средней заключается в том, что она отражает то общее, что присуще всем единицам исследуемой совокупности. Значения признака отдельных единиц совокупности варьируют под влиянием множества факторов, среди которых могут быть, как основные, так и случайные. Сущность средней в том и заключается, что в ней взаимокомпенсируются отклонения значений признака, которые обусловлены действием случайных факторов, и накапливаются (учитываются) изменения, вызванные действием основных факторов. Это позволяет средней отражать типичный уровень признака и абстрагироваться от индивидуальных особенностей, присущих отдельным единицам.

Для того, чтобы средний показатель был действительно типизирующим, он должен рассчитываться с учетом определенных принципов.

Основные принципы применения средних величин.

1. Средняя должна определяться для совокупностей, состоящих из качественно однородных единиц.

2. Средняя должна исчисляться для совокупности, состоящей из достаточно большого числа единиц.

3. Средняя должна рассчитываться для совокупности в стационарных условиях (когда влияющие факторы не меняются или меняются не значительно).

4. Средняя должна вычисляться с учетом экономического содержания исследуемого показателя.

Расчет большинства конкретных статистических показателей основан на использовании:

· средней агрегатной;

· средней степенной (гармонической, геометрической, арифметической, квадратической, кубической);

· средней хронологической (см. раздел).

Все средние, за исключением средней агрегатной, могут рассчитываться в двух вариантах - как взвешенные или невзвешенные.

Средняя агрегатная. Используется формула:

где w i = x i * f i ;

x i - i-й вариант осредняемого признака;

f i , — вес i — го варианта.

Средняя степенная. В общем виде формула для расчета:

где степень k – вид средней степенной.

Значения средних рассчитанных на основании средних степенных для одних и тех же исходных данных — не одинаковы. С увеличением показателя степени k, увеличивается и соответствующая средняя величина:

Cредняя хронологическая. Для моментного динамического ряда с равными интервалами между датами, рассчитывается по формуле:

,

где х 1 и х n значение показателя на начальную и конечную дату.

Формулы расчета степенных средних

Пример. По данным табл. 2.1 требуется рассчитать среднюю заработную плату в целом по трем предприятиям.

Таблица 2.1

Заработная плата предприятий АО

Пред приятие

Численность промышленно- производственного персонала (ППП), чел.

Месячный фонд заработной платы, руб.

Средняя заработная плата, руб.

564840

2092

332750

2750

517540

2260

Итого

1415130

Конкретная расчетная формула зависит от того, какие данные табл. 7 являются исходными. Соответственно возможны варианты: данные столбцов 1 (численность ППП) и 2 (месячный ФОТ); либо — 1 (численность ППП) и 3 (средняя ЗП); или 2 (месячный ФОТ) и 3 (средняя ЗП).

Если имеются только данные столбцов 1 и 2 . Итоги этих граф содержат необходимые величины для расчета искомой средней. Используется формула средней агрегатной:

Если имеются только данные столбцов 1 и 3 , то известен знаменатель исходного соотношения, но не известен его числитель. Однако фонд заработной платы можно получить умножением средней заработной платы на численность ППП. Поэтому общая средняя может быть рассчитана по формуле средней арифметической взвешенной :

Необходимо учитывать, что вес (f i ) в отдельных случаях может представлять собой произведение двух или даже трех значений.

Кроме того, в статистической практике находит применение и средняя арифметическая невзвешенная :

где n - объем совокупности.

Эта средняя используется тогда, когда веса (f i ) отсутствую (каждый вариант признака встречается только один раз) или равны между собой.

Если имеются только данные столбцов 2 и 3. , т. е. известен числитель исходного соотношения, но не известен его знаменатель. Численность ППП каждого предприятия можно получить делением ФОТ на среднюю ЗП. Тогда расчет средней ЗП в целом по трем предприятиям проводится по формуле средней гармонической взвешенной :

При равенстве весов (f i ) расчет среднего показателя может быть произведен по средней гармонической невзвешенной:

В нашем примере использовались разные формы средних, но получили один и тот же ответ. Это обусловлено тем, что для конкретных данных каждый раз реализовывалось одно и то же исходное соотношение средней.

Средние показатели могут рассчитываться по дискретным и интервальным вариационным рядам. При этом расчет производится по средней арифметической взвешенной. Для дискретного ряда данная формула используется так же, как и в приведенном выше примере. В интервальном же ряду для расчета определяются середины интервалов.

Пример. По данным табл. 2.2 определим величину среднедушевого денежного дохода за месяц в условном регионе.

Таблица 2.2

Исходные данные (вариационный ряд)

Среднедушевой денежный доход в среднем за месяц, х, руб. Численность населения, % к итогу/
До 400 30,2
400 — 600 24,4
600 — 800 16,7
800 — 1000 10,5
1000-1200 6,5
1200 — 1600 6,7
1600 — 2000 2,7
2000 и выше 2,3
Итого 100

Сейчас поговорим о том, как рассчитывать среднюю величину .
В классическом виде общая теория статистики предлагает нам один вариант правил выбора средней величины.
Сначала необходимо составить правильно логическую формулу для расчета средней величины (ЛФС). Для каждой средней величины всегда есть только одна логическая формула ее расчета, поэтому ошибиться тут трудно. Но всегда надо помнить, что в числителе (это то, что сверху дроби) сумма всех явлений, а в знаменателе (то, что внизу дроби) общее количество элементов.

После того как составлена логическая формула можно пользоваться правилами (для простоты понимания упростим их и сократим):
1. Если в исходных данных (определяем по частоте) представлен знаменатель логической формулы, то расчет проводим по формуле средней арифметической взвешенной.
2. Если в исходных данных представлен числитель логической формулы, то расчет ведем по формуле средней гармонической взвешенной.
3. Если в задаче представлены сразу и числитель и знаменатель логической формулы (такое бывает редко), то расчет проводим по этой формуле или по формуле средней арифметической простой.
Это классическое представление о выборе верной формулы расчета средней величины. Далее представим последовательность действий при решении задач на расчет средней величины.

Алгоритм решения задач на расчет средней величины

А. Определяем способ расчета средней величины – простой или взвешенный . Если данные представлены в таблице то используем взвешенный способ, если данные представлены простым перечислением, то используем простой способ расчета.

Б. Определяем или расставляем условные обозначения – x – варианта, f – частота . Варианта это то, для какого явления требуется найти среднюю величину. Оставшиеся данные в таблице будут частотой.

В. Определяем форму расчета средней величины – арифметическая или гармоническая . Определение проводится по колонке частот. Арифметическая форма используется, если частоты заданы явным количеством (условно к ним можно подставить слово штук, количество элементов «штук»). Гармоническая форма используется, если частоты заданы не явным количеством, а сложным показателем (произведением осредняемой величины и частоты).

Самое сложное, это догадаться, где и какое количество задано, особенно неопытному в таких делах студенту. В такой ситуации можно воспользоваться одним из предлагаемых далее способов. Для некоторых задач (экономических) подходит наработанное годами практики утверждение (пункт В.1). В других же ситуациях придется пользоваться пунктом В.2.

В.1 Если частота задана в денежных единицах (в рублях), то используется для расчета средняя гармоническая, такое утверждение верно всегда, если выявленная частота задана в деньгах, в других ситуациях это правило не действует.

В.2 Воспользоваться правилами выбора средней величины указанными выше в этой статье. Если частота задана знаменателем логической формулы расчета средней величины, то рассчитываем по средней арифметической форме, если частота задана числителем логической формулы расчета средней величины, то рассчитываем по средней гармонической форме.

Рассмотрим на примерах использование данного алгоритма.

А. Так как данные представлены в строчку то используем простой способ расчета.

Б. В. Имеем только данные по величине пенсий, именно они и будут нашей вариантой – х. Данные представлены простым количеством (12 человек), для расчета используем среднюю арифметическую простую.

Средний размер пенсии пенсионера составляет 9208,3 рубля.

Б. Так как требуется найти средний размер выплаты на одного ребенка, то варианты находятся в первой колонке, туда ставим обозначение х , вторая колонка автоматически становится частотой f .

В. Частота (число детей) задана явным количеством (можно подставить слово штук детей, с точки зрения русского языка неверное словосочетание, но, по сути, очень удобно проверять), значит, для расчета используется средняя арифметическая взвешенная.

Эту же задачу модно решить не формульным способом, а табличным, то есть занести все данные промежуточных расчетов в таблицу.

В результате все, что нужно теперь сделать, это разделить два итоговых данных в правильно порядке.

Средний размер выплаты на одного ребенка в месяц составил 1910 рублей.

А. Так как данные представлены в таблице то для расчета используем взвешенную форму.

В. Частота (себестоимость выпуска) задана неявным количеством (частота задана в рублях пункт алгоритма В1 ), значит, для расчета используется средняя гармоническая взвешенная. Вообще же, по сути, себестоимость выпуска это сложный показатель, который получается перемножение себестоимости единицы изделия на количество таких изделий, вот это и есть суть средней гармонической величины.

Чтобы эта задача могла решаться по формуле средней арифметической необходимо, чтобы вместо себестоимости выпуска стояло число изделий с соответствующей себестоимостью.

Обратите внимание, что сумма в знаменателе, получившаяся после расчетов 410 (120+80+210) это и есть общее количество выпущенных изделий.

Средняя себестоимость единицы изделия составила 314,4 рубля.

А. Так как данные представлены в таблице то для расчета используем взвешенную форму.

Б. Так как требуется найти среднюю себестоимость единицы изделия, то варианты находятся в первой колонке, туда ставим обозначение х , вторая колонка автоматически становится частотой f .

В. Частота (общее число пропусков) задана неявным количеством (это произведение двух показателей числа пропусков и числа студентов, имеющих такое количество пропусков), значит, для расчета используется средняя гармоническая взвешенная. Будем использовать пункт алгоритма В2 .

Чтобы эта задача могла решаться по формуле средней арифметической необходимо, чтобы вместо общего числа пропусков стояло число студентов.

Составляем логическую формулу расчета среднего числа пропусков одного студента.

Частота по условию задачи Общее число пропусков. В логической формуле этот показатель находится в числителе, а значит, используем формулу средней гармонической.

Обратите внимание, что сумма в знаменателе, получившаяся после расчетов 31 (18+8+5) это и есть общее количество студентов.

Среднее число пропусков одного студента 13,8 дня.

Средние величины относятся к обобщающим статистическим показателям, которые дают сводную (итоговую) характеристику массовых общественных явлений, так как строятся на основе большого количества индивидуальных значений варьирующего признака. Для выяснения сущности средней величины необходимо рассмотреть особенности формирования значений признаков тех явлений, по данным которых исчисляют среднюю величину.

Известно, что единицы каждого массового явления обладают многочисленными признаками. Какой бы из этих признаков мы ни взяли, его значения у отдельных единиц будут различными, они изменяются, или, как говорят в статистике , варьируют от одной единицы к другой. Так, например, заработная плата работника определяется его квалификацией, характером труда, стажем работы и целым рядом других факторов, поэтому изменяется в весьма широких пределах. Совокупное влияние всех факторов определяет размер заработка каждого работника, тем не менее можно говорить о среднемесячной заработной плате работников разных отраслей экономики . Здесь мы оперируем типичным, характерным значением варьирующего признака, отнесенным к единице многочисленной совокупности.

Средняя величина отражает то общее, что характерно для всех единиц изучаемой совокупности. В то же время она уравновешивает влияние всех факторов, действующих на величину признака отдельных единиц совокупности, как бы взаимно погашая их. Уровень (или размер) любого общественного явления обусловлен действием двух групп факторов. Одни из них являются общими и главными, постоянно действующими, тесно связанными с природой изучаемого явления или процесса, и формируют то типичное для всех единиц изучаемой совокупности, которое и отражается в средней величине. Другие являются индивидуальными, их действие выражено слабее и носит эпизодический, случайный характер. Они действуют в обратном направлении, обусловливают различия между количественными признаками отдельных единиц совокупности, стремясь изменить постоянную величину изучаемых признаков. Действие индивидуальных признаков погашается в средней величине. В совокупном влиянии типичных и индивидуальных факторов, которое уравновешивается и взаимно погашается в обобщающих характеристиках, проявляется в общем виде известный из математической статистики фундаментальный закон больших чисел.

В совокупности индивидуальные значения признаков сливаются в общую массу и как бы растворяются. Отсюда и средняя величина выступает как «обезличенная», которая может отклоняться от индивидуальных значений признаков, не совпадая количественно ни с одним из них. Средняя величина отражает общее, характерное и типичное для всей совокупности благодаря взаимопогашению в ней случайных, нетипичных различий между признаками отдельных ее единиц, так как ее величина определяется как бы общей равнодействующей из всех причин.

Однако для того, чтобы средняя величина отражала наиболее типичное значение признака, она должна определяться не для любых совокупностей, а только для совокупностей, состоящих из качественно однородных единиц. Это требование является основным условием научно обоснованного применения средних величин и предполагает тесную связь метода средних величин и метода группировок в анализе социально-экономических явлений. Следовательно, средняя величина - это обобщающий показатель, характеризующий типичный уровень варьирующего признака в расчете на единицу однородной совокупности в конкретных условиях места и времени.

Определяя, таким образом, сущность средних величин, необходимо подчеркнуть, что правильное исчисление любой средней величины предполагает выполнение следующих требований:

  • качественная однородность совокупности, по которой вычислена средняя величина. Это означает, что исчисление средних величин должно основываться на методе группировок, обеспечивающем выделение однородных, однотипных явлений;
  • исключение влияния на вычисление средней величины случайных, сугубо индивидуальных причин и факторов. Это достигается в том случае, когда вычисление средней основывается на достаточно массовом материале, в котором проявляется действие закона больших чисел, и все случайности взаимно погашаются;
  • при вычислении средней величины важно установить цель ее расчета и так называемый определяющий показа-телъ (свойство), на который она должна быть ориентирована.

Определяющий показатель может выступать в виде суммы значений осредняемого признака, суммы его обратных значений, произведения его значений и т. п. Связь между определяющим показателем и средней величиной выражается в следующем: если все значения осредняемого признака заменить средним значением, то их сумма или произведение в этом случае не изменит определяющего показателя. На основе этой связи определяющего показателя со средней величиной строят исходное количественное отношение для непосредственного расчета средней величины. Способность средних величин сохранять свойства статистических совокупностей называют определяющим свойством.

Средняя величина, рассчитанная в целом по совокупности, называется общей средней; средние величины, рассчитанные для каждой группы, - групповыми средними. Общая средняя отражает общие черты изучаемого явления, групповая средняя дает характеристику явления, складывающуюся в конкретных условиях данной группы.

Способы расчета могут быть разные, поэтому в статистике различают несколько видов средней величины, основными из которых являются средняя арифметическая, средняя гармоническая и средняя геометрическая.

В экономическом анализе использование средних величин является основным инструментом для оценки результатов научно-технического прогресса, социальных мероприятий, поиска резервов развития экономики. В то же время следует помнить о том, что чрезмерное увлечение средними показателями может привести к необъективным выводам при проведении экономико-статистического анализа. Это связано с тем, что средние величины, будучи обобщающими показателями, погашают, игнорируют те различия в количественных признаках отдельных единиц совокупности, которые реально существуют и могут представлять самостоятельный интерес.

Виды средних величин

В статистике используют различные виды средних величин, которые делятся на два больших класса:

  • степенные средние (средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадра-тическая, средняя кубическая);
  • структурные средние (мода, медиана).

Для вычисления степенных средних необходимо использовать все имеющиеся значения признака. Мода и медиана определяются лишь структурой распределения, поэтому их называют структурными, позиционными средними. Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.

Самый распространенный вид средней величины - средняя арифметическая. Под средней арифметической понимается такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. Вычисление данной величины сводится к суммированию всех значений варьирующего признака и делению полученной суммы на общее количество единиц совокупности. Например, пять рабочих выполняли заказ на изготовление деталей, при этом первый изготовил 5 деталей, второй - 7, третий - 4, четвертый - 10, пятый- 12. Поскольку в исходных данных значение каждого варианта встречалось только один раз, для определения средней выработки одного рабочего следует применить формулу простой средней арифметической:

т. е. в нашем примере средняя выработка одного рабочего равна

Наряду с простой средней арифметической изучают среднюю арифметическую взвешенную. Например, рассчитаем средний возраст студентов в группе из 20 человек , возраст которых варьируется от 18 до 22 лет, где xi - варианты осредняемого признака, fi - частота, которая показывает, сколько раз встречается i-е значение в совокупности (табл. 5.1).

Таблица 5.1

Средний возраст студентов

Применяя формулу средней арифметической взвешенной, получаем:


Для выбора средней арифметической взвешенной существует определенное правило: если имеется ряд данных по двум показателям, для одного из которых надо вычислить

среднюю величину, и при этом известны численные значения знаменателя ее логической формулы, а значения числителя неизвестны, но могут быть найдены как произведение этих показателей, то средняя величина должна высчитывать-ся по формуле средней арифметической взвешенной.

В некоторых случаях характер исходных статистических данных таков, что расчет средней арифметической теряет смысл и единственным обобщающим показателем может служить только другой вид средней величины - средняя гармоническая. В настоящее время вычислительные свойства средней арифметической потеряли свою актуальность при расчете обобщающих статистических показателей в связи с повсеместным внедрением электронно-вычислительной техники. Большое практическое значение приобрела средняя гармоническая величина, которая тоже бывает простой и взвешенной. Если известны численные значения числителя логической формулы, а значения знаменателя неизвестны, но могут быть найдены как частное деление одного показателя на другой, то средняя величина вычисляется по формуле средней гармонической взвешенной.

Например, пусть известно, что автомобиль прошел первые 210 км со скоростью 70 км/ч, а оставшиеся 150 км со скоростью 75 км/ч. Определить среднюю скорость автомобиля на протяжении всего пути в 360 км, используя формулу средней арифметической, нельзя. Так как вариантами являются скорости на отдельных участках xj = 70 км/ч и Х2 = 75 км/ч, а весами (fi) считаются соответствующие отрезки пути, то произведения вариантов на веса не будут иметь ни физического, ни экономического смысла. В данном случае смысл приобретают частные от деления отрезков пути на соответствующие скорости (варианты xi), т. е. затраты времени на прохождение отдельных участков пути (fi/ xi). Если отрезки пути обозначить через fi, то весь путь выразиться как Σfi, а время, затраченное на весь путь, - как Σ fi/ xi , Тогда средняя скорость может быть найдена как частное от деления всего пути на общие затраты времени:

В нашем примере получим:

Если при использовании средней гармонической веса всех вариантов (f) равны, то вместо взвешенной можно использовать простую (невзвешенную) среднюю гармоническую:

где xi - отдельные варианты; n - число вариантов осредняемого признака. В примере со скоростью простую среднюю гармоническую можно было бы применить, если бы были равны отрезки пути, пройденные с разной скоростью.

Любая средняя величина должна вычисляться так, чтобы при замене ею каждого варианта осредняемого признака не изменялась величина некоторого итогового, обобщающего показателя, который связан с осредняемым показателем. Так, при замене фактических скоростей на отдельных отрезках пути их средней величиной (средней скоростью) не должно измениться общее расстояние.

Форма (формула) средней величины определяется характером (механизмом) взаимосвязи этого итогового показателя с осредняемым, поэтому итоговый показатель, величина которого не должна изменяться при замене вариантов их средней величиной, называется определяющим показателем. Для вывода формулы средней нужно составить и решить уравнение, используя взаимосвязь осредняемого показателя с определяющим. Это уравнение строится путем замены вариантов осредняемого признака (показателя) их средней величиной.

Кроме средней арифметической и средней гармонической в статистике используются и другие виды (формы) средней величины. Все они являются частными случаями степенной средней. Если рассчитывать все виды степенных средних величин для одних и тех же данных, то значения

их окажутся одинаковыми, здесь действует правило мажо-рантности средних. С увеличением показателя степени средних увеличивается и сама средняя величина. Наиболее часто применяемые в практических исследованиях формулы вычисления различных видов степенных средних величин представлены в табл. 5.2.

Таблица 5.2


Средняя геометрическая применяется, когда имеется n коэффициентов роста, при этом индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста. Средняя геометрическая простая рассчитывается по формуле

Формула средней геометрической взвешенной имеет следующий вид:

Приведенные формулы идентичны, но одна применяется при текущих коэффициентах или темпах роста, а вторая - при абсолютных значениях уровней ряда.

Средняя квадратическая применяется при расчете с величинами квадратных функций, используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения и вычисляется по формуле

Средняя квадратическая взвешенная рассчитывается по другой формуле:

Средняя кубическая применяется при расчете с величинами кубических функций и вычисляется по формуле

средняя кубическая взвешенная:

Все рассмотренные выше средние величины могут быть представлены в виде общей формулы:

где - средняя величина; - индивидуальное значение; n - число единиц изучаемой совокупности; k - показатель степени, определяющий вид средней.

При использовании одних и тех же исходных данных, чем больше k в общей формуле степенной средней, тем больше средняя величина. Из этого следует, что между величинами степенных средних существует закономерное соотношение:

Средние величины, описанные выше, дают обобщенное представление об изучаемой совокупности и с этой точки зрения их теоретическое, прикладное и познавательное значение бесспорно. Но бывает, что величина средней не совпадает ни с одним из реально существующих вариантов, поэтому кроме рассмотренных средних в статистическом анализе целесообразно использовать величины конкретных вариантов, занимающие в упорядоченном (ранжированном) ряду значений признака вполне определенное положение. Среди таких величин наиболее употребительными являются структурные, или описательные, средние - мода (Мо) и медиана (Ме).

Мода - величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда, т. е. вариант, обладающий наибольшей частотой. Мода может применяться при определении магазинов, которые чаще посещаются, наиболее распространенной цены на какой-либо товар. Она показывает размер признака, свойственный значительной части совокупности, и определяется по формуле

где х0 - нижняя граница интервала; h - величина интервала; fm - частота интервала; fm_ 1 - частота предшествующего интервала; fm+ 1 - частота следующего интервала.

Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой - больше ее. Медиана используется при изучении элемента, значение которого больше или равно или одновременно меньше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр.

Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности. Задача нахождения медианы для дискретного вариационного ряда решается просто. Если всем единицам ряда придать порядковые номера, то порядковый номер медианного варианта определяется как (п +1) / 2 с нечетным числом членов п. Если же количество членов ряда является четным числом, то медианой будет являться среднее значение двух вариантов, имеющих порядковые номера n / 2 и n / 2 + 1.

При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле

где X0 - нижняя граница интервала; h - величина интервала; fm - частота интервала; f - число членов ряда;

∫m-1 - сумма накопленных членов ряда, предшествующих данному.

Наряду с медианой для более полной характеристики структуры изучаемой совокупности применяют и другие значения вариантов, занимающих в ранжированном ряду вполне определенное положение. К ним относятся квартили и децили. Квартили делят ряд по сумме частот на 4 равные части, а децили - на 10 равных частей. Квартилей насчитывается три, а децилей - девять.

Медиана и мода в отличие от средней арифметической не погашают индивидуальных различий в значениях варьирующего признака и поэтому являются дополнительными и очень важными характеристиками статистической совокупности. На практике они часто используются вместо средней либо наряду с ней. Особенно целесообразно вычислять медиану и моду в тех случаях, когда изучаемая совокупность содержит некоторое количество единиц с очень большим или очень малым значением варьирующего признака. Эти, не очень характерные для совокупности значения вариантов, влияя на величину средней арифметической, не влияют на значения медианы и моды, что делает последние очень ценными для экономико-статистического анализа показателями.

Показатели вариации

Целью статистического исследования является выявление основных свойств и закономерностей изучаемой статистической совокупности. В процессе сводной обработки данных статистического наблюдения строят ряды распределения. Различают два типа рядов распределения - атрибутивные и вариационные, в зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным.

Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности не постоянны, более или менее различаются между собой. Такое различие в величине признака носит название вариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Для описания меры изменчивости признаков используют показатели вариации.

Другой важной задачей статистического исследования является определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация. В практике исследователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распределении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Ранжированный ряд сразу дает общее представление о значениях, которые принимает признак в совокупности.

Недостаточность средней величины для исчерпывающей характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает возможность сделать статистический анализ более полным и содержательным и тем самым глубже понять сущность изучаемых общественных явлений.

Самыми простыми признаками вариации являются минимум и максимум - это наименьшее и наибольшее значение признака в совокупности. Число повторений отдельных вариантов значений признаков называют частотой повторения. Обозначим частоту повторения значения признака fi, сумма частот, равная объему изучаемой совокупности будет:

где k - число вариантов значений признака. Частоты удобно заменять частостями - wi. Частость - относительный показатель частоты - может быть выражен в долях единицы или процентах и позволяет сопоставлять вариационные ряды с различным числом наблюдений. Формально имеем:

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности: R = Xmax - Xmin. Этот показатель дает лишь самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Он совершенно не связан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость может придавать ему неустойчивый, случайный характер только от крайних значений признака. Размах вариации не дает никакой информации об особенностях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних величин. Область применения этого показателя ограничена достаточно однородными совокупностями, точнее, характеризует вариацию признака показатель, основанный на учете изменчивости всех значений признака.

Для характеристики вариации признака нужно обобщить отклонения всех значений от какой-либо типичной для изучаемой совокупности величины. Такие показатели

вариации, как среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:


Абсолютное значение (модуль) отклонения варианта от средней арифметической; f- частота.

Первая формула применяется, если каждый из вариантов встречается в совокупности только один раз, а вторая - в рядах с неравными частотами.

Существует и другой способ усреднения отклонений вариантов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений вариантов от средней величины с их последующим усреднением. При этом мы получаем новый показатель вариации - дисперсию.

Дисперсия (σ 2) - средняя из квадратов отклонений вариантов значений признака от их средней величины:

Вторая формула применяется при наличии у вариантов своих весов (или частот вариационного ряда).

В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратического отклонения. Среднее квадратическое отклонение (σ) представляет собой корень квадратный из дисперсии:

Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же единицах измерения, что и варианты.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной колеблемости признаков - среднее линейное и среднее квадртическое отклонение - не пригодны. Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и копейках.

При сравнении изменчивости различных признаков в совокупности удобно применять относительные показатели вариации. Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане). Используя в качестве абсолютного показателя вариации размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, получают относительные показатели колеблемости:


Наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % для распределений, близких к нормальному.



Последние материалы раздела:

Изменение вида звездного неба в течение суток
Изменение вида звездного неба в течение суток

Тема урока «Изменение вида звездного неба в течение года». Цель урока: Изучить видимое годичное движение Солнца. Звёздное небо – великая книга...

Развитие критического мышления: технологии и методики
Развитие критического мышления: технологии и методики

Критическое мышление – это система суждений, способствующая анализу информации, ее собственной интерпретации, а также обоснованности...

Онлайн обучение профессии Программист 1С
Онлайн обучение профессии Программист 1С

В современном мире цифровых технологий профессия программиста остается одной из самых востребованных и перспективных. Особенно высок спрос на...