Статистическая значимость результата (p-уровень)
Смотреть что такое «Статистическая значимость результата (p-уровень)» в других словарях:
Статистическая значимость (statistical significance) — Исследователи часто используют статистические критерии для оценки получаемых результатов. Эти критерии позволяют исследователю оценить вероятность того, что такие результаты могли появиться чисто случайно. Термин С. з. употребляется как раз в… … Психологическая энциклопедия
Коэффициент корреляции — (Correlation coefficient) Коэффициент корреляции это статистический показатель зависимости двух случайных величин Определение коэффициента корреляции, виды коэффициентов корреляции, свойства коэффициента корреляции, вычисление и применение… … Энциклопедия инвестора
Корреляция — (Correlation) Корреляция это статистическая взаимосвязь двух или нескольких случайных величин Понятие корреляции, виды корреляции, коэффициент корреляции, корреляционный анализ, корреляция цен, корреляция валютных пар на Форекс Содержание… … Энциклопедия инвестора
оценка — 3.9 оценка (evaluation): Систематическое определение степени соответствия объекта установленным критериям. Источник: ГОСТ Р ИСО/МЭК 12207 99: Информационная технология. Процессы жизненного цикла программных средств … Словарь-справочник терминов нормативно-технической документации
Медицина — I Медицина Медицина система научных знаний и практической деятельности, целями которой являются укрепление и сохранение здоровья, продление жизни людей, предупреждение и лечение болезней человека. Для выполнения этих задач М. изучает строение и… … Медицинская энциклопедия
Государственная программа — (Government program) Государственная программа это инструмент государственного регулирования экономики, обеспечивающий достижение перспективных целей Понятие государственной программы, виды государственных федеральных и муниципальных программ,… … Энциклопедия инвестора
Отрасль — (Branch) Определение отрасли экономики, экономические циклы отрасли Информация об определении отрасли экономики, экономические циклы отрасли Содержание Содержание экономики Отрасли экономики Экономические циклы, их виды и влияние на различные… … Энциклопедия инвестора
Статистическая значимость
Статистическая значимость результата (p-значение) представляет собой оцененную меру уверенности в его «истинности» (в смысле «репрезентативности выборки»). Выражаясь более технически, p-значение ‑ это показатель, находящийся в убывающей зависимости от надежности результата. Более высокое p-значение соответствует более низкому уровню доверия к найденной в выборке зависимости между переменными. Именно, p-значение представляет собой вероятность ошибки, связанной с распространением наблюдаемого результата на всю популяцию. Например, p-значение=0.05 (т.е. 1/20) показывает, что имеется 5% вероятность, что найденная в выборке связь между переменными является лишь случайной особенностью данной выборки. Иными словами, если данная зависимость в популяции отсутствует, а вы многократно проводили бы подобные эксперименты, то примерно в одном из двадцати повторений эксперимента можно было бы ожидать такой же или более сильной зависимости между переменными.
Во многих исследованиях p-значение=0.05 рассматривается как «приемлемая граница» уровня ошибки.
Не существует никакого способа избежать произвола при принятии решения о том, какой уровень значимости следует действительно считать «значимым». Выбор определенного уровня значимости, выше которого результаты отвергаются как ложные, является достаточно произвольным. На практике окончательное решение обычно зависит от того, был ли результат предсказан априори (т.е. до проведения опыта) или обнаружен апостериорно в результате многих анализов и сравнений, выполненных с множеством данных, а также на традиции, имеющейся в данной области исследований. Обычно во многих областях результат p 



Как было уже сказано, величина зависимости и надежность представляют две различные характеристики зависимостей между переменными. Тем не менее, нельзя сказать, что они совершенно независимы. Говоря общим языком, чем больше величина зависимости (связи) между переменными в выборке обычного объема, тем более она надежна.
Если предполагать отсутствие зависимости между соответствующими переменными в популяции, то наиболее вероятно ожидать, что в исследуемой выборке связь между этими переменными также будет отсутствовать. Таким образом, чем более сильная зависимость обнаружена в выборке, тем менее вероятно, что этой зависимости нет в популяции, из которой она извлечена.
Объем выборки влияет на значимость зависимости. Если наблюдений мало, то соответственно имеется мало возможных комбинаций значений этих переменных и таким образом, вероятность случайного обнаружения комбинации значений, показывающих сильную зависимость, относительно велика.
Как вычисляется уровень статистической значимости. Предположим, вы уже вычислили меру зависимости между двумя переменными (как объяснялось выше). Следующий вопрос, стоящий перед вами: «насколько значима эта зависимость?» Например, является ли 40% объясненной дисперсии между двумя переменными достаточным, чтобы считать зависимость значимой? Ответ: «в зависимости от обстоятельств». Именно, значимость зависит в основном от объема выборки. Как уже объяснялось, в очень больших выборках даже очень слабые зависимости между переменными будут значимыми, в то время как в малых выборках даже очень сильные зависимости не являются надежными. Таким образом, для того чтобы определить уровень статистической значимости, вам нужна функция, которая представляла бы зависимость между «величиной» и «значимостью» зависимости между переменными для каждого объема выборки. Данная функция указала бы вам точно «насколько вероятно получить зависимость данной величины (или больше) в выборке данного объема, в предположении, что в популяции такой зависимости нет». Другими словами, эта функция давала бы уровень значимости (p-значение), и, следовательно, вероятность ошибочно отклонить предположение об отсутствии данной зависимости в популяции. Эта «альтернативная» гипотеза (состоящая в том, что нет зависимости в популяции) обычно называется нулевой гипотезой. Было бы идеально, если бы функция, вычисляющая вероятность ошибки, была линейной и имела только различные наклоны для разных объемов выборки. К сожалению, эта функция существенно более сложная и не всегда точно одна и та же. Тем не менее, в большинстве случаев ее форма известна, и ее можно использовать для определения уровней значимости при исследовании выборок заданного размера. Большинство этих функций связано с очень важным классом распределений, называемым нормальным.
Статистическая значимость
Статистическая значимость часто применяется в маркетинге. С ее помощью определяют правильность выдвинутых предположений и вероятность их результатов. Она позволяет сделать выбор среди представленных теорий, что приводит к получению отличных результатов на практике.
Что такое статистическая значимость
Суть статистической значимости состоит в определении того, существует ли реальное основание в разнице между выбранными для исследования показателями, или это случайность? С данным понятием тесно связаны «нулевая» и «альтернативная» гипотезы.
Для лучшего понимания термина «статистическая значимость» необходимо понять, что такое «проверка гипотез». Эти два термина тесно взаимосвязаны.
Гипотеза иначе называется теорией. После окончания ее разработки требуется установить порядок по сбору достаточного количества доказательств этой теории и собрать их. Существует два типа гипотез: нулевая и альтернативная.
Нулевая гипотеза представляет собой теорию, которая гласит, что внесение коррективов ничего не поменяет, то есть сравниваемые объекты равнозначны в своих свойствах и нет смысла что-либо менять. Суть исследования заключается в опровержении гипотезы.
Альтернативная (исследовательская) гипотеза подразумевает сравнение, в результате которого один объект показывает себя эффективнее, чем другой.
Статистическая значимость как количественный показатель требует оценки. Оценка проходит поэтапно.
Постановка эксперимента
Все начинается с формулировки гипотезы. При этом должно быть выдвижение и нулевой, и альтернативной гипотезы. Придется сравнивать два набора данных для выяснения схожести и отличий. Эти утверждения требуют подтверждения с помощью экспериментальных данных.
Данный уровень представляет собой порог статистической значимости, который каждый устанавливает сам. Этот уровень носит название displaystyle \alpha >\alpha – уровня. Чаще всего, устанавливают значение в 0,05. Вероятность найти разницу составляет 5%. Чем выше уровень, тем достовернее результаты.
Когда нужна максимальная достоверность, стоит снизить значение с 0,05 до 0,01. Чаще всего, такие показатели применяют в производстве для выявления брака. Однако для большинства экспериментов достаточно значения в 0,05.
Решение об используемом критерии
После установки уровня требуется определить, какой критерий использовать: одно- или двусторонний. Здесь стоит опираться на t-критерии Стьюдента. Они показывают, насколько нормально распределены данные. Графически они представлены в виде колоколообразной кривой. Большее количество результатов расположено в середине.
Критерий Стьюдента позволяет математически проверить расположены ли данные в установленных пределах или же выпадают из нормального распределения.
Двусторонний критерий нужен, когда нет уверенности в том, что показатели находятся выше или ниже установленной нормы распределения.
Когда есть точная уверенность, в каком направлении может наблюдаться выход за пределы нормы, нужно использовать односторонний критерий.
Определение объема выборки
Здесь потребуется статистическая мощность. Она представляет собой вероятность, что при выбранном объеме будет получен ожидаемый результат. Распространенный порог — 80%. Для анализа можно использовать специальные онлайн-калькуляторы. Это позволит определить оптимальный объем выборки.
Часто проводят пробное исследование, которое позволяет получить данные для анализа и установить объем выборки. Когда такой возможности нет, стоит поискать в тематической литературе усредненные значения.
Вычисление стандартного отклонения
Стандартное отклонение показывает величину разброса данных. Оно позволяет сделать выбор о близости или отдаленности данных. Их вычисляют по следующей формуле: s = √∑((xi – µ)2/(N – 1)).
s — стандартное отклонение;
∑ указывает на необходимость суммировать полученные данные по выборке;
xi соответствует значению i, то есть отдельному полученному результату;
µ — это среднее значение для данной группы;
N — общее число данных в выборке.
Теперь потребуется отыскать среднее значение для каждой группы. Для этого суммируют средние значения каждой группы и делят на объем выборки.
Далее необходимо определить разницу (xi – µ). Для этого следует вычесть из найденной средней величины каждое полученное значение.
Теперь каждую полученную величину умножают на саму себя или возводят во вторую степень и суммируют величины. После этой операции не должно остаться отрицательных значений.
Следующий шаг — деление объема минус один. Делят полученную в предыдущем шаге сумму на величину, полученную от вычитания единицы. После этого извлекают квадратный корень из величины. Это и будет нужная величина стандартного отклонения.
Определение значимости
Для определения значимости потребуется взять две группы данных. Для последней вычисляют стандартное отклонение, после чего вычисляют дисперсию между обеими группами по формуле:
sd — дисперсия между двумя группами;
s1 — стандартное отклонение в группе 1, N1 — объем выборки в группе 1;
s2 — стандартное отклонение в группе 2, N2 — объем выборки в группе 2.
Необходимо определить t-оценку показателей для перевода полученных данных в стандартизированную форму, которая позволить провести сравнение с другими данными. Эта оценка делает возможным проверку t-критерия, а также выяснение величины отличия одной группы от другой. Для определения t-оценки применяют формулу: t = (µ1 – µ2)/sd:
µ1 — среднее значение для первой группы;
µ2 — среднее значение для второй группы;
sd — дисперсия между двумя выборками.
Совет: первым используют большее среднее значение, чтобы итоговая величина не была отрицательной.
Далее требуется определить степень свободы выборки. Для этого вычисляют объем: суммируют объемы двух выборок и вычитают 2. Полученная величина станет окончательной. Ее оценивают по таблице значений критерия Стьюдента (t-критерия). Таблица представлена ниже.
Пользоваться представленной таблицей просто: находите строку в соответствии с полученной степенью свободы и определяете соответствующее t-оценке Р-значение.
Например, при степени свободы 8 и t-оценке 2,61 Р-значение для одностороннего критерия попадает между 0,01 и 0,025. При выбранном показателе в 0,05 эти данные попадают в категорию «статистически значимые». Это помогает сделать выбор в пользу альтернативной гипотезы и отказаться от нулевой.
Заключение
Определение статистической значимости помогает решать маркетинговые задачи и минимизировать риски. Такие расчеты часто проводятся при A/B тестированиях и помогают узнать, как будет вести себя клиент в будущем, окупится ли товар и т.д.
Статистическая значимость в экспериментах и анализе данных
Что именно имеют в виду ученые и исследователи, когда заявляют, что что-то является или не является статистически значимым? Как установить статистическую значимость и как ее интерпретировать?
Добро пожаловать в 11-ю часть серии статей о статистике в электротехнике. До сих пор мы рассматривали как высокоуровневые определения, так и конкретные примеры статистических концепций, полезных для инженера-практика. Чтобы узнать больше о том, что мы рассмотрели, ознакомьтесь со статьями, перечисленными в меню с оглавлением выше, над статьей.
Статистическая значимость: туманная концепция?
Любой, кто обычно читает исследовательские статьи, часто сталкивается со «статистической значимостью», часто сопровождаемой загадочной ссылкой на p 
Порог вероятности
Статистическая значимость основана на вероятности получения результата при предположении, что нулевая гипотеза верна. Предположим, что в ходе нашего эксперимента мы получили число x (это может быть что угодно: артериальное давление, доход от продаж, средний балл теста).
Обращаясь к функции плотности вероятности, связанной с нулевой гипотезой, мы можем определить, будет ли вероятность получения x или какого-либо другого числа, которое более маловероятно, чем x, менее 5% (p 
Если p-значение достаточно низкое, нет смысла продолжать предполагать, что между двумя переменными нет никакой связи. Таким образом, мы отвергаем нулевую гипотезу и утверждаем, что связь существует.
Интерпретация статистической значимости
Предыдущее объяснение описывает статистическую значимость способом, который я считаю наиболее простым и математически последовательным: если p-значение наблюдаемого результата меньше заранее определенного порога, который мы называем уровнем значимости, наблюдаемый результат очень маловероятен, если нулевая гипотеза верна. Поэтому, когда мы отвергаем нулевую гипотезу, это равносильно подтверждению того, что эксперимент обнаружил связь между интересующими переменными.
Это же общее сообщение можно передать другими способами, которые могут оказаться полезными:
Толкование слова «значимость»
Большая путаница в отношении статистической значимости возникает из-за использования слова «значимость», которое в данном контексте ограничивается конкретным статистическим использованием и не совпадает со словом «значимость» в обычном языке.
Статистически значимые результаты не обязательно являются важными или значимыми результатами. Статистическая значимость не означает практической значимости, а также отсутствие статистической значимости не означает, что экспериментальные результаты не имеют практической ценности.
Уровень значимости
Чтобы установить статистическую значимость, мы должны сравнить p-значение с уровнем значимости, обозначенным как ⍺. Уровни значимости в некоторой степени произвольны и выбираются в соответствии с условиями заданной области. Как было указано выше, часто используются ⍺ = 0,05 и ⍺ = 0,01, хотя в некоторых случаях выбирается более высокое или гораздо более низкое значение.
Заключение
Несмотря на возможное неправильное использование статистической значимости и доказательства широко распространенной неверной интерпретации, она остается важным методом в исследованиях и экспериментах. Мы продолжим изучение этой темы в следующей статье.
Что такое теоретическая и практическая значимость научной работы 1929
В статье о научной новизне мы говорили, что этот компонент делает работу достойной внимания. Но попробуем поставить более высокую цель. Пусть нашу работу не просто прочитают авторитетные ученые, а еще и используют ее основные результаты. Для достижения этого необходимо убедить аудиторию в наличии теоретической и практической значимости представленного исследования. Выясним, что это такое, чем они отличаются и как их обосновать.
Теоретическая значимость
Теоретическая значимость научной работы – это ее академическая ценность. По смыслу она близка к научной новизне. Только последняя в упрощенном понимании характеризуется соответствием критерию «чего не было в науке», а теоретическая значимость – «чего не было в науке и чего ей не хватало».
В зависимости от категории выполняемой работы, отличаются и требования к этому элементу. Это может быть
В более узком смысле теоретическую значимость результатов понимают как возможность пополнения общепризнанной базы знаний в выбранной сфере этими результатами. Проще говоря, если ваша работа обладает академической ценностью, ее выводы имеют шансы попасть на страницы учебников.
Практическая значимость
Практическая значимость – это прагматическая ценность исследования. Здесь уже недостаточно попасть на страницы отраслевой литературы. Практическая значимость работы означает, что ее результаты можно использовать на практике.
Понимание прагматической ценности отличается для технических, естественных и гуманитарных наук. Первые и вторые, как правило, имеют прикладной характер, и результаты исследований проще реализовать. Иногда для подтверждения практической значимости работы достаточно приложить акт внедрения.
В гуманитарных науках прагматическая ценность не так очевидна. Она может заключаться в:
Отличается и масштаб практической значимости. В курсовой или дипломной работе студента она может отсутствовать вовсе или сводиться к пользе для единственного предприятия, на котором автор проходил практику и получил необходимые материалы.
В статьях и диссертациях прагматическая ценность должна распространяться более широко – на всю отрасль или сферу жизни общества.
Где искать значимость, если идей не хватает
Если не получается сформулировать теоретическую и практическую значимость своего исследования, следует проанализировать результаты с точки зрения эффективности. Есть 3 основных направления:
По первому направлению в большей степени находится теоретическая значимость, по третьему – практическая. Под социальной эффективностью могут одновременно скрываться оба вида ценности исследования.
Удачные формулировки теоретической и практической ценности
Предлагаем ознакомиться с выдержками из научных работ. Анализируя примеры опытных коллег, вы быстрее научитесь формулировать теоретическую и практическую ценность своих работ.
Изложение теоретической и практической значимости данной работы – практически образцовое. Академическую ценность составляют две разработанные автором модели и предложенный им оригинальный метод оценки перфузии. Новизна сочетается с нужностью, а две отрасли – техническая и медицинская – пополняются принципиально новыми знаниями. Прагматическая ценность обоснована довольно грамотно. Автор не просто перечисляет значимые результаты, но и объясняет причины их ценности.
Нормативные рекомендации – достойный вариант обоснования практической значимости. К тому же для архитектурных наук они действительно имеют большую ценность. Усиливает впечатление предложение использовать результаты исследования для решения социальных задач национального проекта.
Наглядный пример того, как практическая значимость формулировалась через поиск социальной эффективности. Для медицинских наук это очень важно. Автор утверждает, что разработанные им методики улучшат качество жизни больных, повысят эффективность их лечения и не приведут к ухудшению состояния здоровья. Также он упоминает и о ценности результатов для врачей-онкологов, которым точно облегчит работу составленный алгоритм схем лечения.
В искусствоведении сформулировать теоретическую значимость значительно проще, чем практическую. Автор использовал возможности по максимуму: упомянул новые ракурсы исследования, расширение научных представлений об оперном театре, наметил дальнейшие направления работы. Практическая значимость не ограничилась использованием материалов работы для преподавания. Автор сумел найти ценность непосредственно для практиков театра, что ощутимо повысило ценность работы.
Этот пример показывает, как практическую значимость выражают через экономическую эффективность. Работа предлагает сочетание форматов занятости, позволяющее высвободить трудоспособность персонала. В целом, как подчеркивает автор, исследование поможет модернизировать систему управления персоналом.
Социологические науки дают возможность проводить исследования, имеющие одинаково ярко выраженные теоретическую и практическую ценность. Академическая значимость представлена ценными знаниями для социологии по крайне актуальному вопросу – нахождению баланса работы и родительства. Прагматическая значимость работы заключается в ее высоком потенциале для переориентации всей социальной политики в отношении работающих родителей.
Исследования в сфере языкознания позволяют получить результаты, теоретически значимые для множества смежных отраслей. Данная работа обогатила понятийный аппарат и методологический инструментарий нескольких наук и пограничных научных направлений. Новый подход к реконструкции гуманитарного знания – неожиданный результат для лингвистического исследования, а потому обещает революционные изменения в гуманитаристике в целом.
Применимость результатов для формальной реконструкции научных теорий – как раз тот случай, когда выявляется скрытая прагматическая ценность гуманитарного исследования. А когда философское исследование раскрывает процедуры, которые можно использовать в процессе автоматического моделирования теоретико-познавательной деятельности, это полностью меняет представления о философии. Подобный результат действительно имеет именно практическую ценность.
Юридические науки – самые «удобные» среди прочих гуманитарных в плане написания практически значимых работ. Рекомендации по внесению поправок в законодательство – беспроигрышный вариант, чем и воспользовался автор данной работы.
Теоретическая значимость данного исследования обеспечивается созданием научных основ для прикладного объекта исследования. Практическая ценность сводится к предложенным рекомендациям, значимость которых автор раскрывает через открывающиеся возможности для оптимизации работы геологов.
Также рекомендуем прочитать
Вредные советы по составлению аннотаций
Мы часто говорим о том, как правильно написать научную статью или отдельные ее части. Но наши читатели – молодые ученые – хотят не только учиться, но и веселиться. Поэтому мы начинаем цикл юмористических статей «Вредные советы». Надеемся, вы посмеетесь вместе с нами и лучше считаете заложенный в них смысл. Начинаем с аннотаций.
Обзор лучших статей «Молодого ученого» №31 (321)
Еженедельный обзор самых интересных и удачно подобранных названий, аннотаций, ключевых слов, введение и заключений.
Остаться в уникальных: обзор сервисов проверки на плагиат
В нашей статье мы расскажем, какие сервисы доступны в интернете, чего стоит опасаться при бесплатной проверке, а также поделимся секретами, как грамотно повысить процент оригинальности.














