Что такое медианное время
Что такое медианное время
а. В основной статистике в аккаунте администратора. Речь идёт о показателях, которые касаются скорости:
в. В выгрузке списка обращений (CSV/XLS) из аккаунта сотрудника.
Предположим, что у вас поддержка работает с понедельника по пятницу с 10:00 до 21:00. Рассмотрим, три возможных варианта:
Этот момент мы обсуждали со многими клиентами, которые просили учёт рабочего времени. У нас изначально было мнение, что стоит учитывать, но все клиенты высказались против.
Ситуаций, когда скорость ответа в выходные больше скорости ответа в рабочие часы, очень мало. То есть сотрудник может выдать больше, чем должен, но это проявляется именно в том, что он в принципе отвечает, а не отвечает быстро. В итоге учёт такого ответа испортит его показатель скорости ответов.
К примеру, клиент написал в субботу в 23:00. Сотрудник ответил в воскресенье в 13:00. Если мы такое будем считать, он получит обращение со скоростью ответа в 14:00, что для многих клиентов очень медленно 🙂
(!) Подсчёт статистики ведётся согласно текущим настройкам рабочего времени: если изменить настройки рабочего времени и посмотреть статистику, данные пересчитаются.
медианное значение
3.1.2 медианное значение (median value): Полученные результаты располагают в ряд в порядке возрастания (или убывания) числовых значений и определяют медианное значение, которое находится в середине ряда, если число полученных результатов является нечетным, или усредненным из двух, находящихся в середине ряда, если число результатов четное.
7.5 Медианное значение: Полученные результаты располагают в ряд в порядке возрастания или убывания числовых значений и определяют медианное значение, которое находится в середине ряда, если число полученных результатов нечетное, или является средним арифметическим двух значений, находящихся в середине ряда, если число результатов четное.
Полезное
Смотреть что такое «медианное значение» в других словарях:
медианное значение интенсивности отказов — — [http://slovarionline.ru/anglo russkiy slovar neftegazovoy promyishlennosti/] Тематики нефтегазовая промышленность EN median failure rate … Справочник технического переводчика
МЕДИАННОЕ ЗНАЧЕНИЕ ДОХОДА — – доход, меньше и больше которого получают равные численности населения … Словарь терминов по социальной статистике
МЕДИАННОЕ ЗНАЧЕНИЕ ДОХОДА — – доход, меньше и больше которого получают равные численности населения … Социальная статистика. Словарь
МЕДИАННОЕ РАЗРУШАЮЩЕЕ ПОЛЕ — (Нм) значение напряженности переменного магнитного поля, разрушающего половину величины остаточной намагниченности. Вид разрушаемой остаточной намагниченности изображается в индексе Нм: например, Нmn – медианное поле разрушения естественной… … Палеомагнитология, петромагнитология и геология. Словарь-справочник.
Медиана ME — значение признака, приходящееся на центральный член ранжированного ряда. У одной половины членов такого ряда значения данного признака меньше, чем медианное, у другой больше. На медианное значение признака влияют лишь центральные значения его,… … Социологический справочник
ГОСТ Р МЭК 60840-2011: Кабели силовые с экструдированной изоляцией и арматура к ним на номинальное напряжение свыше 30 кВ (U (индекса m) = 36 кВ) до 150 кВ (U (индекса m) = 170 кВ). Методы испытаний и требования к ним — Терминология ГОСТ Р МЭК 60840 2011: Кабели силовые с экструдированной изоляцией и арматура к ним на номинальное напряжение свыше 30 кВ (U (индекса m) = 36 кВ) до 150 кВ (U (индекса m) = 170 кВ). Методы испытаний и требования к ним оригинал… … Словарь-справочник терминов нормативно-технической документации
ГОСТ IEC 60811-1-1-2011: Общие методы испытаний материалов изоляции и оболочек электрических и оптических кабелей. Измерение толщины и наружных размеров. Методы определения механических свойств — Терминология ГОСТ IEC 60811 1 1 2011: Общие методы испытаний материалов изоляции и оболочек электрических и оптических кабелей. Измерение толщины и наружных размеров. Методы определения механических свойств: 7.1 максимальное растягивающее усилие … Словарь-справочник терминов нормативно-технической документации
Эффект Флинна — статистический феномен, выражающийся в постепенном повышении показателей коэффициента интеллекта (IQ) с течением лет как в отдельных странах, так и в целом по миру. Эффект назван в честь американского ученого политолога Джеймса Флинна,… … Википедия
Доход — (Income) Понятие доходов, виды доходов, доходы организации Информация о понятии доходов, виды доходов, доходы организации, налоговые доходы Содержание Содержание Что такое Реальные Национальный профит Виды выгоды Реальный профит Номинальный… … Энциклопедия инвестора
Коммуна (Франция) — У этого термина существуют и другие значения, см. Коммуна. Коммуна (фр. commune от лат. communia общность) во Франции административно территориальная единица самого нижнего структурного уровня (за исключением таких коммун, как Париж,… … Википедия
Медиана в статистике
Центральную тенденцию данных можно рассматривать не только, как значение с нулевым суммарным отклонением (среднее арифметическое) или максимальную частоту (мода), но и как некоторую отметку (значение в совокупности), делящую ранжированные данные (отсортированные по возрастанию или убыванию) на две равные части. Половина исходных данных меньше этой отметки, а половина – больше. Это и есть медиана.
Итак, медиана в статистике – это уровень показателя, который делит набор данных на две равные половины. Значения в одной половине меньше, а в другой больше медианы. В качестве примера обратимся к набору нормально распределенных случайных чисел.
Очевидно, что при симметричном распределении середина, делящая совокупность пополам, будет находиться в самом центре – там же, где средняя арифметическая (и мода). Это, так сказать, идеальная ситуация, когда мода, медиана и средняя арифметическая совпадают и все их свойства приходятся на одну точку – максимальная частота, деление пополам, нулевая сумма отклонений – все в одном месте. Однако, жизнь не так симметрична, как нормальное распределение.
Допустим, мы имеем дело с техническими замерами отклонений от ожидаемой величины чего-нибудь (содержания элементов, расстояния, уровня, массы и т.д. и т.п.). Если все ОК, то отклонения, скорее всего, будут распределены по закону, близкому к нормальному, примерно, как на рисунке выше. Но если в процессе присутствует важный и неконтролируемый фактор, то могут появиться аномальные значения, которые в значительной мере повлияют на среднюю арифметическую, но при этом почти не затронут медиану.
Медиана выборки – это альтернатива средней арифметической, т.к. она устойчива к аномальным отклонениям (выбросам).
Математическим свойством медианы является то, что сумма абсолютных (по модулю) отклонений от медианного значения дает минимально возможное значение, если сравнивать с отклонениями от любой другой величины. Даже меньше, чем от средней арифметической, о как! Данный факт находит свое применение, например, при решении транспортных задач, когда нужно рассчитать место строительства объектов около дороги таким образом, чтобы суммарная длина рейсов до него из разных мест была минимальной (остановки, заправки, склады и т.д. и т.п.).
Формула медианы
Формула медианы в статистике для дискретных данных чем-то напоминает формулу моды. А именно тем, что формулы как таковой нет. Медианное значение выбирают из имеющихся данных и только, если это невозможно, проводят несложный расчет.
Первым делом данные ранжируют (сортируют по убыванию). Далее есть два варианта. Если количество значений нечетно, то медиана будет соответствовать центральному значению ряда, номер которого можно определить по формуле:
№Me – номер значения, соответствующего медиане,
N – количество значений в совокупности данных.
Тогда медиана обозначается, как
Это первый вариант, когда в данных есть одно центральное значение. Второй вариант наступает тогда, когда количество данных четно, то есть вместо одного есть два центральных значения. Выход прост: берется средняя арифметическая из двух центральных значений:
В интервальных данных выбрать конкретное значение не представляется возможным. Медиану рассчитывают по определенному правилу.
Для начала (после ранжирования данных) находят медианный интервал. Это такой интервал, через который проходит искомое медианное значение. Определяется с помощью накопленной доли ранжированных интервалов. Где накопленная доля впервые перевалила через 50% всех значений, там и медианный интервал.
Не знаю, кто придумал формулу медианы, но исходили явно из того предположения, что распределение данных внутри медианного интервала равномерное (т.е. 30% ширины интервала – это 30% значений, 80% ширины – 80% значений и т.д.). Отсюда, зная количество значений от начала медианного интервала до 50% всех значений совокупности (разница между половиной количества всех значений и накопленной частотой предмедианного интервала), можно найти, какую долю они занимают во всем медианном интервале. Вот эта доля аккурат переносится на ширину медианного интервала, указывая на конкретное значение, именуемое впоследствии медианой.
Обратимся к наглядной схеме.
Немного громоздко получилось, но теперь, надеюсь, все наглядно и понятно. Чтобы при расчете каждый раз не рисовать такой график, можно воспользоваться готовой формулой. Формула медианы имеет следующий вид:
где xMe — нижняя граница медианного интервала;
iMe — ширина медианного интервала;
∑f/2 — количество всех значений, деленное на 2 (два);
S(Me-1)— суммарное количество наблюдений, которое было накоплено до начала медианного интервала, т.е. накопленная частота предмедианного интервала;
fMe — число наблюдений в медианном интервале.
Как нетрудно заметить, формула медианы состоит из двух слагаемых: 1 – значение начала медианного интервала и 2 – та самая часть, которая пропорциональна недостающей накопленной доли до 50%.
Для примера рассчитаем медиану по следующим данным.
Требуется найти медианную цену, то есть ту цену, дешевле и дороже которой по половине количества товаров. Для начала произведем вспомогательные расчеты накопленной частоты, накопленной доли, общего количества товаров.
По последней колонке «Накопленная доля» определяем медианный интервал – 300-400 руб (накопленная доля впервые более 50%). Ширина интервала – 100 руб. Теперь остается подставить данные в приведенную выше формулу и рассчитать медиану.
То есть у одной половины товаров цена ниже, чем 350 руб., у другой половины – выше. Все просто. Средняя арифметическая, рассчитанная по этим же данным, равна 355 руб. Отличие не значительное, но оно есть.
Расчет медианы в Excel
Медиану для числовых данных легко найти, используя функцию Excel, которая так и называется — МЕДИАНА. Другое дело интервальные данные. Соответствующей функции в Excel нет. Поэтому нужно задействовать приведенную выше формулу. Что поделаешь? Но это не очень трагично, так как расчет медианы по интервальным данным – редкий случай. Можно и на калькуляторе разок посчитать.
Напоследок предлагаю задачку. Имеется набор данных. 15, 5, 20, 5, 10. Каково среднее значение? Четыре варианта:
Мода, медиана и среднее значение выборки – это разный способ определить центральную тенденцию в выборке.
Ниже видеоролик о том, как рассчитать медиану в Excel.
Медианная зарплата — что это такое простыми словами
Какие виды зарплаты различают для целей статистики
Наверняка многие слышали такие понятия, как медианная зарплата, модальная зарплата, средняя зарплата, минимальный размер оплаты труда (МРОТ). Что означают эти понятия и для чего они используются? В чем различия средней и медианной зарплаты? Как соотносятся медианная и модальная зарплаты?
Включаются ли доплаты и надбавки в размер МРОТ, мы писали в статье «Что не входит в МРОТ в 2021 году».
Любую из этих величин можно считать по региону, предприятию, отрасли. В общем, в любом разрезе, необходимом тому, кто данный расчет производит.
ОБРАТИТЕ ВНИМАНИЕ! Расчет производит Росстат на основании официальных данных по заработной плате. При этом доход индивидуальных предпринимателей, самозанятых, зарплаты в конвертах учету не подвергаются. Модальная, средняя и медианная заплаты в России являются одними из основных социально-экономических показателей мониторинга уровня и качества жизни населения.
Дадим определения этим понятиям.
Для раскрытия понятия средней зарплаты обратимся к арифметике. Средняя зарплата считается как среднее арифметическое значение. То есть берем значения всех зарплат и делим на количество работников. Полученное значение — средняя зарплата.
Модальная зарплата — это наиболее часто встречающееся значение среди рассматриваемых видов зарплаты.
А вот на том, как рассчитывается медианная зарплата, остановимся подробнее. В конце статьи, после того как раскроем понятие медианной зарплаты в России, произведем расчет средней, медианной и модальной зарплат на примере.
Определение медианной зарплаты и медианного дохода
Медиана переводится с латыни как середина. Это значит, что медианная зарплата является серединой ряда всех исследуемых зарплат. Как считается медианная зарплата: все значения исследуемых зарплат выстраивают в ряд по возрастанию. Ряд делят пополам. Значение зарплаты, оказавшейся посередине, — медианная зарплата.
Если рассматриваемый ряд состоит из четного числа членов, то берут два средних значения и считают среднее арифметическое.
Медианный доход рассчитывают по аналогичной формуле.
Рассчитывает медианную зарплату Росстат по разработанной им методике. За основу статистика берет данные Пенсионного фонда.
Сравнение модальной, медианной и средней зарплат
Теперь покажем на примерах, чем медианная зарплата отличается от средней и модальной.
Будем делать расчет по условной организации.
Пусть в ООО «Предмет» работают 6 сотрудников, которые получают следующие зарплаты:
Рассчитываем среднюю зарплату:
(80 000 + 60 000 + 50 000 + 40 000 + 30 000 + 30 000) / 6 = 48 333 руб.
Рассчитываем модальную зарплату. Наибольшее количество работников (2 чел.) получают 30 000 руб.
Рассчитываем медианную зарплату: в ряду из представленных зарплат середина — это значения 50 000 руб. и 40 000 руб. Из них мы считаем среднее арифметическое:
(50 000 + 40 000) / 2 = 45 000 руб.
Как видно из примера, модальная, средняя и медианная зарплаты различаются, причем весомо. При достаточно плавном графике зарплат рассматриваемые параметры отражают действительность. Но если разброс выплат увеличить и положить, например, директору более 150 000 руб., то средняя зарплата необоснованно вырастет. При этом значения модальной и медианной зарплат не изменятся. Это показывает, что средняя зарплата — несколько далекий от реальности показатель или, как говорят статистики, холодный.
Как применяется медианная зарплата
Что означает медианная зарплата для бухгалтера, как он может использовать этот показатель в работе? Напрямую бухгалтер модальную, медианную и среднюю зарплаты не применяет в своей деятельности. Но мы упомянули еще об одном показателе в начале статьи — минимальном размере оплаты труда (МРОТ). Вот его бухгалтер использует очень часто для определения среднего заработка при расчете отпускных и больничных, а также взносов на медицинское, пенсионное и социальное страхование.
Как применять МРОТ, мы писали в статьях:
Федеральный закон от 19.06.2000 № 82-ФЗ «О минимальном размере оплаты труда» устанавливает с 2021 года прямую зависимость между МРОТ и медианной зарплатой.
С 2021 года коэффициент медианной зарплаты к МРОТ равен 42%. Медианная зарплата в России в 2020 году составила 30 457 руб. Напоминаем, о чем это говорит: 50% населения России получают больше данной суммы, а другая половина — меньше.
Таким образом, мы имеем МРОТ в 2021 году, равный 42% от 30 457 руб., то есть 12 792 руб.
Соотношение МРОТ и медианной зарплаты в России по годам полагается пересматривать каждые пять лет.
Здесь речь идет о федеральном МРОТ. Регионы самостоятельно могут поднимать у себя размер минимальной оплаты труда.
Чтобы не ошибиться в размере заработной платы, которую допустимо установить работнику, необходимо отслеживать свой региональный МРОТ. Оформите пробный бесплатный доступ к системе «КонсультантПлюс» и сверьте зарплаты своих работников с МРОТ вашего региона.
Сравнение значений медианной зарплаты
Интересным может быть сравнение значений медианной зарплаты по регионам и по отраслям.
Сравним медианную зарплату в Москве и медианную зарплату в Санкт-Петербурге:
Если выбирать наибольшую медианную зарплату в России по регионам, то это будет Ямало-Ненецкий автономный округ со значением медианной зарплаты, равным 77 542 руб.
Наименьшее значение медианной зарплаты в России в Кабардино-Балкарской республике — 17 976 руб.
Средняя медианная зарплата в России в 2020 году составила 34 335 руб., если считать по медианной зарплате регионов.
Если рассматривать разброс медианной зарплаты по отраслям, то самой доходной будет добыча полезных ископаемых — 64 800 руб., а самой низкодоходной — легкая промышленность с медианной зарплатой в размере 20 500 руб.
Итоги
Для целей статистики различают модальную, медианную и среднюю зарплаты. Считают эти показатели по-разному. Методику для расчета разрабатывает Росстат. Размер МРОТ привязан к значению медианной зарплаты и составляет в 2021 году 42 % от нее. Пересматривать данный коэффициент положено не реже, чем один раз в пять лет.
Мой любимый алгоритм: нахождение медианы за линейное время
Нахождение медианы за O(n log n)
У этого способа самый простой код, но он определённо не самый быстрый.
Нахождение медианы за среднее время O(n)
Следующим нашим шагом будет нахождение медианы в среднем за линейное время, если нам будет везти. Этот алгоритм, называемый «quickselect», разработан Тони Хоаром, который также изобрёл алгоритм сортировки с похожим названием — quicksort. Это рекурсивный алгоритм, и он может находить любой элемент (не только медиану).
Чтобы найти с помощью quickselect медиану, мы выделим quickselect в отдельную функцию. Наша функция quickselect_median будет вызывать quickselect с нужными индексами.
Доказательство среднего времени O(n)
В среднем pivot разбивает список на две приблизительно равных части. Поэтому каждая последующая рекурсия оперирует с 1 ⁄2 данных предыдущего шага.
Существует множество способов доказательства того, что этот ряд сходится к 2n. Вместо того, чтобы приводить их здесь, я сошлюсь на замечательную статью в Википедии, посвящённую этому бесконечному ряду.
Quickselect даёт нам линейную скорость, но только в среднем случае. Что, если нас не устраивает среднее, и мы хотим гарантированного выполнения алгоритма за линейное время?
Детерминированное O(n)
С учётом этого, нам нужен алгоритм для подбора опорных элементов. Нашей целью будет выбор за линейное время pivot, который в худшем случае удаляет достаточное количество элементов для обеспечения скорости O(n) при использовании его вместе с quickselect. Этот алгоритм был разработан в 1973 году Блумом (Blum), Флойдом (Floyd), Праттом (Pratt), Ривестом (Rivest) и Тарьяном (Tarjan). Если моего объяснения вам не хватит, то можете изучить их статью 1973 года. Вместо того, чтобы описывать алгоритм, я подробно прокомментирую мою реализацию на Python:
Давайте докажем, что медиана медиан является хорошим pivot. Нам поможет, если мы представим визуализацию нашего алгоритма выбора опорных элементов:
Но достаточно ли нам отбрасывать 30% элементов на каждом этапе? На каждом этапе наш алгоритм должен выполнять следующее:
Подводим итог
У нас есть quickselect, алгоритм, который находит медиану за линейное время при условии наличия достаточно хорошей опорного элемента. У нас есть алгоритм медианы медиан, алгоритм O(n) для выбора опорного элемента (который достаточно хорош для quickselect). Соединив их, мы получили алгоритм нахождения медианы (или n-ного элемента в списка) за линейное время!
Медианы за линейное время на практике
В завершение приведу сравнение элементов, используемых в каждой из реализаций. Это не скорость выполнения, а общее количество элементов, которые рассматривает функция quickselect. Здесь не учитывается работа по вычислению медианы медиан.
Именно этого мы и ожидали! Детерминированный опорный элемент почти всегда рассматривает при quickselect меньшее количество элементов, чем случайный. Иногда нам везёт и мы угадываем pivot с первой попытки, что проявляется как впадины на зелёной линии. Математика работает!