на что указывают размеры вариации
Показатели размера вариации
Вариация – изменение значения признака при переходе от одной единицы совокупности к другой.
Для измерения вариации используются следующие показатели.
1. Размах вариации – показывает, в каких пределах колеблется размер признака, образующего ряд распределения
где xmax – максимальное значение признака,
xmin – минимальное значение признака.
2. Среднее линейное отклонение – показывает, на сколько в среднем отклоняются значения признака от его среднего значения.
По несгруппированным данным
.
По сгруппированным данным
,
где k – число групп.
3. Дисперсия – средний квадрат отклонений индивидуальных значений признака от их средней величины.
По несгруппированным данным
.
По сгруппированным данным
.
Дисперсия имеет большое значение в статистическом анализе. Однако ее не всегда удобно использовать, потому что размерность дисперсии равна квадрату размерности изучаемого признака. Поэтому рассчитывают среднее квадратическое отклонение.
4. Среднее квадратическое отклонение – показывает, на сколько в среднем отклоняются значения признака от его среднего значения (обладает лучшими свойствами, чем среднее линейное отклонение).
По несгруппированным данным
.
По сгруппированным данным
.
Выражается в тех же единицах измерения, что и признак.
5. Коэффициент вариации – показывает степень интенсивности вариации, однородность совокупности.
Совокупность считается однородной, если , где Vнорм – нормативная величина коэффициента вариации (для разных совокупностей может колебаться от 1% до 30%).
6. Линейный коэффициент вариации – отношение среднего линейного отклонения к средней.
Пример 6.14. Распределение коров фермы по годовому удою молока.
Годовой удой молока от коровы, тыс. кг (xi) | Число коров, fi | Средняя величина признака | xi*fi | ||||
до 2 | 1,5 | -1,3 | 5,2 | 1,69 | 6,76 | ||
2-3 | 2,5 | -0,3 | 0,6 | 0,09 | 0,18 | ||
3-4 | 3,5 | +0,7 | 1,4 | 0,49 | 0,98 | ||
4-5 | 4,5 | 4,5 | +1,7 | 1,7 | 2,89 | 2,89 | |
5 и более | 5,5 | 5,5 | +2,7 | 2,7 | 7,29 | 7,29 | |
Итого | 11,6 | 18,1 |
1) Средняя арифметическая тыс. кг.
2) Размах вариации R = 6 – 1 = 5 тыс. кг.
3) Среднее линейное отклонение тыс. кг.
5) Среднее квадратическое отклонениетыс. кг.
6) Коэффициент вариации — совокупность неоднородна.
7) Линейный коэффициент вариации .
Показатели вариации альтернативного признака.
Доля вариантов обладающих изучаемым признаком обозначается р, а доля вариантов не обладающих изучаемым признаком – q=1-p.
Средняя величина: .
Дисперсия: .
Пример 6.15. Совокупность новорождённых – 205 чел., девочки – 100 чел.
Показатели вариации: понятие, виды, формулы для вычислений. Примеры решения задач
Часто в статистике при анализе какого-либо явления или процесса необходимо учитывать не только информацию о средних уровнях исследуемых показателей, но и разброс или вариацию значений отдельных единиц, которая является важной характеристикой изучаемой совокупности.
В наибольшей степени вариации подвержены курсы акций, объемы спроса и предложения, процентные ставки в разные периоды времени и в разных местах.
Основными показателями, характеризующими вариацию, являются размах, дисперсия, среднее квадратическое отклонение и коэффициент вариации.
Размах вариации представляет собой разность максимального и минимального значений признака: R = Xmax – Xmin. Недостатком данного показателя является то, что он оценивает только границы варьирования признака и не отражает его колеблемость внутри этих границ.
Дисперсия лишена этого недостатка. Она рассчитывается как средний квадрат отклонений значений признака от их средней величины:
Упрощенный способ расчета дисперсии осуществляется с помощью следующих формул (простой и взвешенной):
Примеры применения данных формул представлены в задачах 1 и 2.
Широко распространенным на практике показателем является среднее квадратическое отклонение:
Среднее квадратическое отклонение определяется как квадратный корень из дисперсии и имеет ту же размеренность, что и изучаемый признак.
— формула для расчета коэффициента вариации.
Примеры решения задач по теме «Показатели вариации в статистике»
Задача 1. При изучении влияния рекламы на размер среднемесячного вклада в банках района обследовано 2 банка. Получены следующие результаты:
Определить:
1) для каждого банка: а) средний размер вклада за месяц; б) дисперсию вклада;
2) средний размер вклада за месяц для двух банков вместе;
3) Дисперсию вклада для 2-х банков, зависящую от рекламы;
4) Дисперсию вклада для 2-х банков, зависящую от всех факторов, кроме рекламы;
5) Общую дисперсию используя правило сложения;
6) Коэффициент детерминации;
7) Корреляционное отношение.
Решение
1) Составим расчетную таблицу для банка с рекламой. Для определения среднего размера вклада за месяц найдем середины интервалов. При этом величина открытого интервала (первого) условно приравнивается к величине интервала, примыкающего к нему (второго).
Средний размер вклада найдем по формуле средней арифметической взвешенной:
Дисперсию вклада найдем по формуле:
Аналогичные действия произведем для банка без рекламы:
2) Найдем средний размер вклада для двух банков вместе. Хср =(580×50+542,8×50)/100 = 561,4 руб.
3) Дисперсию вклада, для двух банков, зависящую от рекламы найдем по формуле: σ 2 =pq (формула дисперсии альтернативного признака). Здесь р=0,5 – доля факторов, зависящих от рекламы; q=1-0,5, тогда σ 2 =0,5*0,5=0,25.
4) Поскольку доля остальных факторов равна 0,5, то дисперсия вклада для двух банков, зависящая от всех факторов кроме рекламы тоже 0,25.
5) Определим общую дисперсию, используя правило сложения.
= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96
σ 2 = σ 2 факт + σ 2 ост = 552,08+345,96 = 898,04
7) Эмпирическое корреляционное отношение η = √η 2 = √0,39 = 0,62 – связь достаточно тесная.
Задача 2. Имеется группировка предприятий по величине товарной продукции:
Определить: 1) дисперсию величины товарной продукции; 2) среднее квадратическое отклонение; 3) коэффициент вариации.
Решение
В группах с нижней границей – суммой этой нижней границы и половины размера предыдущего интервала (800+(800-600):2=900).
Расчет средней величины товарной продукции делаем по формуле:
Итак, средняя величина товарной продукции за изучаемый период в целом равна Хср = (-5:37)×200+500=472,97 тыс. руб.
2) Дисперсию найдем по следующей формуле:
σ 2 = (33/37)*2002-(472,97-500)2 = 35 675,67-730,62 = 34 945,05
3) среднее квадратическое отклонение: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 тыс. руб.
4) коэффициент вариации: V = (σ /Хср)*100 = (186,94 / 472,97)*100 = 39,52%
Другие статьи по данной теме:
Список использованных источников
2012 © Лана Забродская. При копировании материалов сайта ссылка на источник обязательна
Показатели размера и интенсивности вариации
Основным этапом в изучении вариационных рядов является расчет показателей размера и интенсивности вариации.
Для характеристикиразмера вариации в статистике применяются абсолютные показатели вариации:
— среднее линейное отклонение;
— среднее квадратическое отклонение;
Размах вариации, среднее линейное отклонение и среднее квадратическое отклонение являются величинами именованными, т.е. имеют ту же единицу измерения, что и изучаемый признак. Дисперсия единиц измерения не имеет.
Размах вариации (размах колебаний) представляет собой разность между максимальным и минимальным значениями признака в совокупности:
Для группировок с открытыми первым и последним интервалами, когда неизвестны реальные минимальное и максимальное значения признака в совокупности, расчет размаха вариации некорректен.
Размах вариации зависит от величины только крайних значений признака. Более точно характеризуют вариацию признака показатели, основанные на учете колеблемости всех значений признака, — среднее линейное отклонение ( ) и среднее квадратическое отклонение (σ). Среднее квадратическое отклонение называют также стандартным отклонением.
Среднее линейное и среднее квадратическое отклонения рассчитываются по формулам:
-для несгруппированных данных :
;
;
где xi—значение признака у i-ой единицы совокупности;
— средняя величина признака в совокупности,
n— число единиц совокупности.
— для сгруппированных данных:
;
;
где xi—значение признака в i-ой группе (дня интервальных вариационных рядов—середина i-го интервала);
— средняя величина признака в совокупности;
— частота (частость) i-ой группы;
Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем величина изучаемого признака у отдельных единиц совокупности отличается от среднего значения признака в совокупности.
Среднее квадратическое отклонение по величине всегда больше среднего линейного отклонения. Соотношение σ: зависит от наличия в совокупности резких отклонений и может служить индикатором «засоренности» совокупности нетипичными, выделяющимися из основной массы единицами. Для нормального распределения это соотношение равно 1,25.
Квадрат среднего квадратического отклонения называется дисперсией (σ 2 ).Для несгруппированных данных дисперсия рассчитывается по формуле:
Для сгруппированных данных:
Рассчитать дисперсию можно также по преобразованной формуле:
,
где —средний квадрат значений признака в совокупности:
— квадрат среднего значения признака в совокупности.
Определим среднее линейное, среднее квадратическое отклонение и дисперсию для распределения работников по величине начисленной заработной платы. Все промежуточные вычисления приведены в табл. 7.5.
Начисленная заработная плата за месяц, тыс. руб. | Число работников, в % к итогу (fi) | Середина интервала (xi) | ( =2,5) | ||
До 1,0 | 14,4 | 0,6 | 1,9 | 27,36 | 51,984 |
1,0 – 1,8 | 24,3 | 1,4 | 1,1 | 26,73 | 29,403 |
1,8 – 2,6 | 19,8 | 2,2 | 0,3 | 5,94 | 1,782 |
2,6 – 3,4 | 18,0 | 3,0 | 0,5 | 9,00 | 4,500 |
3,4 – 4,2 | 9,7 | 3,8 | 1,3 | 12,61 | 16,393 |
4,2 – 5,0 | 5,7 | 4,6 | 2,1 | 11,97 | 25,137 |
5,0 – 5,8 | 3,7 | 5,4 | 2,9 | 10,73 | 31,117 |
5,8 и более | 4,4 | 6,2 | 3,7 | 16,28 | 60,236 |
Итого | — | — | 120,62 | 220,552 |
Среднее линейное отклонение, дисперсия и среднее квадратическое отклонение соответственно составят:
тыс. руб.;
тыс. руб.
Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем величина начисленной заработной платы у отдельных работников жилищно-коммунального хозяйства и производственных видов бытового обслуживания отличалась от средней заработной платы по этим отраслям. По формуле среднего линейного отклонения это отличие составляло ±1206 руб., по формуле среднего квадратического отклонения ±1485 руб.
Для оценкиинтенсивности вариации, а также для сравнения ее величины в разных совокупностях или по разным признакам используют относительные показатели вариации, которые рассчитываются как отношение абсолютных показателей вариации к средней величине признака:
— относительный размах вариации (коэффициент осцилляции);
— относительное линейное отклонение;
— относительное квадратическое отклонение и др.
Наиболее часто на практике применяют коэффициент вариации (ν), который представляет собой относительное квадратическое отклонение:
По величине коэффициента вариации можно судить об интенсивности отклонений значений признака от средней величины, а следовательно, и об однородности изучаемой совокупности. Чем больше величина коэффициента вариации, тем больше разброс значений признака вокруг средней, и выше неоднородность совокупности. Средняя, рассчитанная для неоднородной совокупности, не является ее типической характеристикой.
Существует шкала определения степени однородности совокупности в зависимости от значений коэффициента вариации:
Коэффициент вариации (%) | Степень однородности совокупности |
До 30 | высокая |
30-60 | средняя |
60 и более | низкая |
Отметим, что данная шкала оценки однородности совокупности весьма условна. Вопрос о степени интенсивности вариации должен решаться для каждого изучаемого признака индивидуально исходя из сравнения наблюдаемой вариации с некоторой ее обычной интенсивностью, принимаемой за норму.
Для нашего примера коэффициент вариации составил:
что свидетельствует о высокой колеблемости признака, т.е. неоднородности совокупности работников по размеру начисленной заработной платы.
Моменты распределения
Моментом распределения называется средняя арифметическая тех или иных степеней отклонений индивидуальных значений признака от определенной исходной величины.
Моменты распределения рассчитывается по формуле:
,
— степень отклонения (порядок момента),
— частота (частость) i-го интервала,
В зависимости от величины А, различают три вида моментов:
1) При А= 0 получают начальные моменты :
.
Начальный момент первого порядка представляет собой среднюю арифметическую
2) При А= получают центральные моменты :
.
Центральный момент первого порядка (в соответствии с нулевым свойством средней арифметической) всегда равен нулю.
Центральный момент второго порядка представляет собой дисперсию.
3) При А не равном среднему значению признака и отличному от нуля получают условные моменты :
.
Наиболее часто используются моменты первого, второго, третьего и четвертого порядков.