Что такое нулевая гипотеза в статистике

Нулевая гипотеза в статистике: пример. Проверка нулевой гипотезы

Статистика — сложная наука об измерении и анализе различных данных. Как и во многих других дисциплинах, в этой отрасли существует понятие гипотезы. Так, гипотеза в статистике — это какое-либо положение, которое нужно принять или отвергнуть. Причём в данной отрасли есть несколько видов таких допущений, схожих между собой по определению, но отличающихся на практике. Нулевая гипотеза — сегодняшний предмет изучения.

От общего к частному: гипотезы в статистике

От основного определения предположений отходит ещё одно, не менее важное, — статистическая гипотеза есть изучение генеральной совокупности важных для науки объектов, относительно коих учёными делаются выводы. Ее можно проверить с помощью выборки (части генеральной совокупности). Приведём несколько примеров статистических гипотез:

Что такое нулевая гипотеза в статистике. Смотреть фото Что такое нулевая гипотеза в статистике. Смотреть картинку Что такое нулевая гипотеза в статистике. Картинка про Что такое нулевая гипотеза в статистике. Фото Что такое нулевая гипотеза в статистике1. Успеваемость всего класса, возможно, зависит от уровня образования каждого учащегося.

2. Начальный курс математики в равной степени усваивается как детьми, пришедшими в школу в 6 лет, так и детьми, пришедшими в 7.

Простой гипотезой в статистике называют такое предположение, которое однозначно характеризует определённый параметр величины, взятой учёным.

Сложная состоит из нескольких или бесконечного множества простых. Указывается некоторая область или нет точного ответа.

Полезно понимать несколько определений гипотез в статистике, чтобы не путать их на практике.

Концепция нулевой гипотезы

Нулевая гипотеза — это теория о том, что есть некие две совокупности, которые не различаются между собой. Однако на научном уровне нет понятия «не различаются», но есть «их сходство равно нулю». От этого определения и было образовано понятие. В статистике нулевая гипотеза обозначается как Н0. Причём крайним значением невозможного (маловероятного) считается от 0.01 до 0.05 или менее.

Лучше разобрать, что такое нулевая гипотеза, пример из жизни поможет. Педагог в университете предположил, что различный уровень подготовки учащихся двух групп к зачётной работе вызван незначительными параметрами, случайными причинами, не влияющими на общий уровень образования (разница в подготовке двух групп студентов равна нулю).

Однако встречно стоит привести пример альтернативной гипотезы — допущения, опровергающего утверждение нулевой теории (Н1). Например: директор университета предположил, что различный уровень в подготовке к зачётной работе у учащихся двух групп вызван применением педагогами разных методик обучения (разница в подготовке двух групп существенна и на то есть объяснение).

Что такое нулевая гипотеза в статистике. Смотреть фото Что такое нулевая гипотеза в статистике. Смотреть картинку Что такое нулевая гипотеза в статистике. Картинка про Что такое нулевая гипотеза в статистике. Фото Что такое нулевая гипотеза в статистикеТеперь сразу видна разница между понятиями «нулевая гипотеза» и «альтернативная гипотеза». Примеры иллюстрируют эти понятия.

Проверка нулевой гипотезы

Создать предположение — это ещё полбеды. Настоящей проблемой для новичков считается проверка нулевой гипотезы. Именно тут многих и ожидают трудности.

Используя метод альтернативной гипотезы, утверждающей нечто обратное нулевой теории, можно сравнить оба варианта и выбрать верный. Так действует статистика.

Пусть нулевая гипотеза Н0, а альтернативная Н1, тогда:

Здесь c — это некое среднее значение генеральной совокупности, которое предстоит найти, а c0 — данное изначально значение, по отношению к которому проверяется гипотеза. Также есть некоторое число Х — среднее значение выборки, по которому определяется c0.

«Доверительный» способ проверки

Существует наиболее действенный способ, с помощью которого нулевая статистическая гипотеза легко проверяется на практике. Он заключается в построении диапазона значений до 95% точности.

Итак, предположим ситуацию. До ремонта конвейер в день выпускал 32.1 кг конечной продукции, а после ремонта, как утверждает предприниматель, коэффициент полезного действия вырос, и конвейер, по недельной проверке, начал выпускать 39.6 кг в среднем.

Что такое нулевая гипотеза в статистике. Смотреть фото Что такое нулевая гипотеза в статистике. Смотреть картинку Что такое нулевая гипотеза в статистике. Картинка про Что такое нулевая гипотеза в статистике. Фото Что такое нулевая гипотеза в статистикеНулевая гипотеза будет утверждать, что ремонт никак не повлиял на КПД конвейера. Альтернативная гипотеза скажет, что ремонт коренным образом изменил КПД конвейера, поэтому производительность его повысилась.

По таблице находим n=7, t = 2,447, откуда формула примет следующий вид:

39,6 – 2,447*4,2 ≤ с ≤ 39,6 + 2,447*4,2;

Разновидности отрицания

До этого рассматривался такой вариант построения гипотезы, где Н0 утверждает что-либо, а Н1 это опровергает. Откуда можно было составить подобную систему:

Но существует ещё два родственных способа опровержения. К примеру, нулевая гипотеза утверждает, что средняя оценка успеваемости класса больше 4.54, а альтернативная тогда скажет, что средняя успеваемость того же класса менее 4.54. И выглядеть в виде системы это будет так:

Источник

Мир статистических гипотез

В современном мире мы обладаем все большим и большим объемом данных о событиях, происходящих вокруг. Зачастую у нас появляются вопросы, на которые хотелось бы быстро ответить на основе имеющейся информации, для этого как нельзя лучше подходит процесс, связанный с проверкой статистических гипотез. Однако, многие считают, что это занятие подразумевает под собой большое число вычислений и в принципе довольно сложно для понимания. На самом деле, алгоритм проверки гипотез достаточно прост, а для осуществления расчетов с каждым годом появляется все больше и больше готовых инструментальных средств, не требующих от человека глубоких познаний в области. Далее я попытаюсь показать, что мало того, что процесс проверки гипотез может быть полезным, так и осуществляется достаточно быстро и без серьезных усилий.

Что такое нулевая гипотеза в статистике. Смотреть фото Что такое нулевая гипотеза в статистике. Смотреть картинку Что такое нулевая гипотеза в статистике. Картинка про Что такое нулевая гипотеза в статистике. Фото Что такое нулевая гипотеза в статистике

Статистические гипотезы и области их применения

Проверка статистических гипотез является важнейшим классом задач математической статистики. С помощью данного инструмента можно подтвердить или отвергнуть предположение о свойствах случайной величины путем применения методов статистического анализа для элементов выборки. Если в предыдущем предложении какие-либо термины являются не совсем понятными, ниже можно найти пояснение на простом языке.

Для проверки статистических гипотез зачастую применяются статистические тесты, о которых будет рассказано далее.

Алгоритм проверки статистической гипотезы

В обобщенном виде алгоритм выглядит таким образом:

Формулировка основной (H0) и альтернативной (H1) гипотез

Выбор уровня значимости

Выбор статистического критерия

Определения правила принятия решения

Итоговое принятие решения на основе исходной выборки данных

Данные шаги являются унифицированными и схему можно использовать почти во всех случаях. Далее подробнее рассмотрим пример работы данного алгоритма на конкретных данных.

Пример проверки статистической гипотезы

Итак, как вы, наверное, догадались по вышеприведенным примерам, будем проверять гипотезу о том, что имеется существенное различие между числом созданных европейских AI-стартапов в 2019-м и 2020-м годах. Пример достаточно простой, чтобы было проще разобраться в ходе работы алгоритма.

Проверка гипотезы о законе распределения

Для данных 2019-го года проверим нормальность распределения.

H0: случайная величина распределена нормально

H1: случайная величина не распределена нормально

Пусть уровень значимости alpha = 0.05 (как и в 95-ти процентах статистических тестов). Определение уровня значимости достойно отдельного поста, так что не будем заострять на нем внимание.

Будет использован критерий Шапиро-Уилка.

Что такое нулевая гипотеза в статистике. Смотреть фото Что такое нулевая гипотеза в статистике. Смотреть картинку Что такое нулевая гипотеза в статистике. Картинка про Что такое нулевая гипотеза в статистике. Фото Что такое нулевая гипотеза в статистике, Что такое нулевая гипотеза в статистике. Смотреть фото Что такое нулевая гипотеза в статистике. Смотреть картинку Что такое нулевая гипотеза в статистике. Картинка про Что такое нулевая гипотеза в статистике. Фото Что такое нулевая гипотеза в статистике, Что такое нулевая гипотеза в статистике. Смотреть фото Что такое нулевая гипотеза в статистике. Смотреть картинку Что такое нулевая гипотеза в статистике. Картинка про Что такое нулевая гипотеза в статистике. Фото Что такое нулевая гипотеза в статистике, Что такое нулевая гипотеза в статистике. Смотреть фото Что такое нулевая гипотеза в статистике. Смотреть картинку Что такое нулевая гипотеза в статистике. Картинка про Что такое нулевая гипотеза в статистике. Фото Что такое нулевая гипотеза в статистике;

Можно сравнить статистику W с критическим значением Wкрит. Критическое значение чаще всего приведено в готовых таблицах (по строкам/столбцам там отмечен объем выборки и уровень значимости, а на пересечении как раз-таки и лежит Wкрит.). Если W>Wкрит., то не отвергаем H0 и наоборот. Но это не очень удобно, поэтому чаще используется второй способ.

Разнообразие статистических критериев

Как мы увидели на примере, важным шагом в проверке статистической гипотезы является выбор критерия. В примере выше я использовала лишь два статистических критерия, но по факту их гораздо больше, так сказать, на все случаи жизни. Данные критерии важно знать и четко нужно осознавать, когда и какой можно применить. Многие из них направлены на сравнение центров распределений случайных величин, например, сравнение средних, медиан, равенство параметра распределения какому-либо числу и т. д. В основном они делятся на параметрические (знаем закон распределения случайной величины) и непараметрические.

Для вашего удобства внизу (рис. 3) приведена таблица с основными, с моей точки зрения, критериями сравнения центров распределения и их классификацией. Надеюсь, она будет вам полезна, ее можно дополнять и расширять по вашему желанию.

Источник

Нулевая гипотеза в статистике – определение, проверка и примеры

Что такое нулевая гипотеза в статистике. Смотреть фото Что такое нулевая гипотеза в статистике. Смотреть картинку Что такое нулевая гипотеза в статистике. Картинка про Что такое нулевая гипотеза в статистике. Фото Что такое нулевая гипотеза в статистикеСтатистика — это наука об измерениях различных данных и их анализе. Как и в других дисциплинах, в статистике есть понятие гипотезы. В данном случае, гипотеза – это какое-либо состояние, которое нужно принять или исключить. В данном направлении существуют несколько похожих между собой допущений, но имеющих некоторое отличие.

Статистическая гипотеза — это изучение генеральной совокупности (множество возможных результатов исследований) основных для науки объектов, относительно которых делаются выводы.

Как проверить гипотезу

Проверить ее возможно посредством выборки. Например, рассмотрим несколько статистических гипотез:

Предположение, характеризующее конкретные границы величины, взятые учеными, называется простой гипотезой. Из множества простых гипотез складывается сложная гипотеза, указывается какое-либо направление либо четкого ответа нет.

Подробности

Пример

Таким образом, нулевая гипотеза – это теория, утверждающая, что между сравнимыми характеристиками отсутствуют различия, а видимые колебания можно объяснить случайными отклонениями в выборках, которые лежат в основе проводимых сравнений. Иными словами, имеются две совокупности, сходство которых равно нулю.

Рассмотрим другой пример альтернативной теории – профессор в институте предположил, что разная степень подготовленности студентов двух групп к зачетной сессии обусловлена применением двух различных по сути методов обучения (подготовленность двух групп существенно отличается и на это есть разъяснение).

Из этих примеров видно, чем отличаются две гипотезы (нулевая и альтернативная) друг от друга

При использовании способа альтернативной гипотезы, которая утверждает обратное понятие по отношению к нулевой, можно путем сравнения из двух вариантов выбрать правильный. Это принцип статистики.

Если нулевая гипотеза в науке – НО, а альтернативная — Н1, отсюда следует формула:

где, с — некоторая средняя величина генеральной совокупности, которую нужно найти, а с0 — это изначальная величина, по отношению к которой исследуется гипотеза. Так же имеется число Х — средняя величина выборки, по которой определяется с0.

Исследование заключается в сравнении величин Х и с0, в случае если они равны – принимается нулевая гипотеза, если неравны, то правильной является альтернативная гипотеза.

Проверка нулевой гипотезы в статистике состоит в применении статистического критерия, который подчиняется разным законам распределения. Статистические критерии используются для опровержения правильности нулевой гипотезы, а не для ее доказательства.

Например, есть F — критерий, рассчитываемый по распределению Фишера, Т – критерий, который рассчитывается по распределению Стьюдента и т.д. Возьмем отрезок либо точку на оси Х (область допустимых значений), на которой имеется много величин статистики (при этих значениях нулевая гипотеза верна). Критическими значениями будем считать крайние точки отрезка, а соответственно, лучи расположенные в стороны отрезка (левую и правую) называются критическими областями. В случае, если вычисленное значение входит в них, то нулевая гипотеза опровергается, а альтернативная будет верной.

В процессе проверки нулевой теории возможны ошибки двух видов:

Надо сказать, что это различные параметры, результаты ошибок могут иметь различные выборки и отличаться между собой. Рассмотрим на примере:

В производстве нового медицинского препарата необходима большая осторожность, потому что повышенная доза одного из входящих в состав компонентов может губительно сказаться на жизни пациентов. Рассчитать передозировку на химическом уровне не представляется возможным. Поэтому, перед запуском в продажу, медицинский препарат испытывают на кроликах либо крысах.

В случае, если в результате применения большинство животных не выживает, препарат в продажу не допускается, если, наоборот, все подопытные животные выжили – лекарство поступает в аптечную сеть. В первом случае медицинский препарат не был токсичен, просто во время испытания допустили ошибку и лекарство посчитали токсичным из-за гибели подопытных животных, и, соответственно, запретили к продаже — А=1.

Для того, чтобы исключить ошибку, необходимо проверить правильность нулевой гипотезы

Для этого существует несколько этапов:

По этому принципу действует статистика: при правильной проверке нулевая гипотеза будет либо принята, либо отвергнута. Первые три этапа проверки самые сложные, чаще всего их доверяют специалистам-математикам, 4 и 5 пункты, зная статистические методы, может применить любой человек.

Источник

Объясняем p-значения для начинающих Data Scientist’ов

Я помню, когда я проходил свою первую зарубежную стажировку в CERN в качестве практиканта, большинство людей все еще говорили об открытии бозона Хиггса после подтверждения того, что он соответствует порогу «пять сигм» (что означает наличие p-значения 0,0000003).

Что такое нулевая гипотеза в статистике. Смотреть фото Что такое нулевая гипотеза в статистике. Смотреть картинку Что такое нулевая гипотеза в статистике. Картинка про Что такое нулевая гипотеза в статистике. Фото Что такое нулевая гипотеза в статистике

Тогда я ничего не знал о p-значении, проверке гипотез или даже статистической значимости.

Я решил загуглить слово — «p-значение», и то, что я нашел в Википедии, заставило меня еще больше запутаться…

При проверке статистических гипотез p-значение или значение вероятности для данной статистической модели — это вероятность того, что при истинности нулевой гипотезы статистическая сводка (например, абсолютное значение выборочной средней разницы между двумя сравниваемыми группами) будет больше или равна фактическим наблюдаемым результатам.
— Wikipedia

Хорошая работа, Википедия.

Ладно. Я не понял, что на самом деле означает р-значение.

Углубившись в область науки о данных, я наконец начал понимать смысл p-значения и то, где его можно использовать как часть инструментов принятия решений в определенных экспериментах.

Поэтому я решил объяснить р-значение в этой статье, а также то, как его можно использовать при проверке гипотез, чтобы дать вам лучшее и интуитивное понимание р-значений.

Также мы не можем пропустить фундаментальное понимание других концепций и определение p-значения, я обещаю, что сделаю это объяснение интуитивно понятным, не подвергая вас всеми техническими терминами, с которыми я столкнулся.

Всего в этой статье четыре раздела, чтобы дать вам полную картину от построения проверки гипотезы до понимания р-значения и использования его в процессе принятия решений. Я настоятельно рекомендую вам пройтись по всем из них, чтобы получить подробное понимание р-значений:

1. Проверка гипотез

Что такое нулевая гипотеза в статистике. Смотреть фото Что такое нулевая гипотеза в статистике. Смотреть картинку Что такое нулевая гипотеза в статистике. Картинка про Что такое нулевая гипотеза в статистике. Фото Что такое нулевая гипотеза в статистике

Прежде чем мы поговорим о том, что означает р-значение, давайте начнем с разбора проверки гипотез, где р-значение используется для определения статистической значимости наших результатов.

Наша конечная цель — определить статистическую значимость наших результатов.

И статистическая значимость построена на этих 3 простых идеях:

Другими словами, мы создадим утверждение (нулевая гипотеза) и используем пример данных, чтобы проверить, является ли утверждение действительным. Если утверждение не соответствует действительности, мы выберем альтернативную гипотезу. Все очень просто.

Чтобы узнать, является ли утверждение обоснованным или нет, мы будем использовать p-значение для взвешивания силы доказательств, чтобы увидеть, является ли оно статистически значимым. Если доказательства подтверждают альтернативную гипотезу, то мы отвергнем нулевую гипотезу и примем альтернативную гипотезу. Это будет объяснено в следующем разделе.

Давайте воспользуемся примером, чтобы сделать эту концепцию более ясной, и этот пример будет использоваться на протяжении всей этой статьи для других концепций.

Пример. Предположим, что в пиццерии заявлено, что время их доставки составляет в среднем 30 минут или меньше, но вы думаете, что оно больше чем заявленное. Таким образом, вы проводите проверку гипотезы и случайным образом выбираете время доставки для проверки утверждения:

Одним из распространенных способов проверки гипотез является использование Z-критерия. Здесь мы не будем вдаваться в подробности, так как хотим лучше понять, что происходит на поверхности, прежде чем погрузиться глубже.

2. Нормальное распределение

Что такое нулевая гипотеза в статистике. Смотреть фото Что такое нулевая гипотеза в статистике. Смотреть картинку Что такое нулевая гипотеза в статистике. Картинка про Что такое нулевая гипотеза в статистике. Фото Что такое нулевая гипотеза в статистике

Нормальное распределение — это функция плотности вероятности, используемая для просмотра распределения данных.

Нормальное распределение имеет два параметра — среднее (μ) и стандартное отклонение, также называемое сигма (σ).

Среднее — это центральная тенденция распределения. Оно определяет местоположение пика для нормальных распределений. Стандартное отклонение — это мера изменчивости. Оно определяет, насколько далеко от среднего значения склонны падать значения.

Нормальное распределение обычно связано с правилом 68-95-99.7 (изображение выше).

Классно. Теперь вы можете задаться вопросом: «Как нормальное распределение относится к нашей предыдущей проверке гипотез?»

Поскольку мы использовали Z-тест для проверки нашей гипотезы, нам нужно вычислить Z-баллы (которые будут использоваться в нашей тестовой статистике), которые представляют собой число стандартных отклонений от среднего значения точки данных. В нашем случае каждая точка данных — это время доставки пиццы, которое мы получили.

Что такое нулевая гипотеза в статистике. Смотреть фото Что такое нулевая гипотеза в статистике. Смотреть картинку Что такое нулевая гипотеза в статистике. Картинка про Что такое нулевая гипотеза в статистике. Фото Что такое нулевая гипотеза в статистике

Обратите внимание, что когда мы рассчитали все Z-баллы для каждого времени доставки пиццы и построили стандартную кривую нормального распределения, как показано ниже, единица измерения на оси X изменится с минут на единицу стандартного отклонения, так как мы стандартизировали переменную, вычитая среднее и деля его на стандартное отклонение (см. формулу выше).

Изучение стандартной кривой нормального распределения полезно, потому что мы можем сравнить результаты теста с ”нормальной» популяцией со стандартизированной единицей в стандартном отклонении, особенно когда у нас есть переменная, которая поставляется с различными единицами.

Что такое нулевая гипотеза в статистике. Смотреть фото Что такое нулевая гипотеза в статистике. Смотреть картинку Что такое нулевая гипотеза в статистике. Картинка про Что такое нулевая гипотеза в статистике. Фото Что такое нулевая гипотеза в статистике

Z-оценка может сказать нам, где лежат общие данные по сравнению со средней популяцией.

Мне нравится, как Уилл Кёрсен выразился: чем выше или ниже Z-показатель, тем менее вероятным будет случайный результат и тем более вероятным будет значимый результат.

Но насколько высокий (или низкий) показатель считается достаточно убедительным, чтобы количественно оценить, насколько значимы наши результаты?

Кульминация

Здесь нам нужен последний элемент для решения головоломки — p-значение, и проверить, являются ли наши результаты статистически значимыми на основе уровня значимости (также известного как альфа), который мы установили перед началом нашего эксперимента.

3. Что такое P-значение?

Наконец… Здесь мы говорим о р-значении!

Все предыдущие объяснения предназначены для того, чтобы подготовить почву и привести нас к этому P-значению. Нам нужен предыдущий контекст и шаги, чтобы понять это таинственное (на самом деле не столь таинственное) р-значение и то, как оно может привести к нашим решениям для проверки гипотезы.

Если вы зашли так далеко, продолжайте читать. Потому что этот раздел — самая захватывающая часть из всех!

Вместо того чтобы объяснять p-значения, используя определение, данное Википедией (извини Википедия), давайте объясним это в нашем контексте — время доставки пиццы!

Напомним, что мы произвольно отобрали некоторые сроки доставки пиццы, и цель состоит в том, чтобы проверить, превышает ли время доставки 30 минут. Если окончательные доказательства подтверждают утверждение пиццерии (среднее время доставки составляет 30 минут или меньше), то мы не будем отвергать нулевую гипотезу. В противном случае мы опровергаем нулевую гипотезу.

Поэтому задача p-значения — ответить на этот вопрос:

Если я живу в мире, где время доставки пиццы составляет 30 минут или меньше (нулевая гипотеза верна), насколько неожиданными являются мои доказательства в реальной жизни?

Р-значение отвечает на этот вопрос числом — вероятностью.

Чем ниже значение p, тем более неожиданными являются доказательства, тем более нелепой выглядит наша нулевая гипотеза.

И что мы делаем, когда чувствуем себя нелепо с нашей нулевой гипотезой? Мы отвергаем ее и выбираем нашу альтернативную гипотезу.

Если р-значение ниже заданного уровня значимости (люди называют его альфа, я называю это порогом нелепости — не спрашивайте, почему, мне просто легче понять), тогда мы отвергаем нулевую гипотезу.

Теперь мы понимаем, что означает p-значение. Давайте применим это в нашем случае.

P-значение в расчете времени доставки пиццы

Теперь, когда мы собрали несколько выборочных данных о времени доставки, мы выполнили расчет и обнаружили, что среднее время доставки больше на 10 минут с p-значением 0,03.

Это означает, что в мире, где время доставки пиццы составляет 30 минут или меньше (нулевая гипотеза верна), есть 3% шанс, что мы увидим, что среднее время доставки, по крайней мере, на 10 минут больше, из-за случайного шума.

Чем меньше p-значение, тем более значимым будет результат, потому что он с меньшей вероятностью будет вызван шумом.

В нашем случае большинство людей неправильно понимают р-значение:

Р-значение 0,03 означает, что есть 3% (вероятность в процентах), что результат обусловлен случайностью — что не соответствует действительности.

Р-значение ничего не *доказывает*. Это просто способ использовать неожиданность в качестве основы для принятия разумного решения.
— Кэсси Козырков

Вот как мы можем использовать p-значение 0,03, чтобы помочь нам принять разумное решение (ВАЖНО):

По моему мнению, p-значения используются в качестве инструмента для оспаривания нашего первоначального убеждения (нулевая гипотеза), когда результат является статистически значимым. В тот момент, когда мы чувствуем себя нелепо с нашим собственным убеждением (при условии, что р-значение показывает, что результат статистически значим), мы отбрасываем наше первоначальное убеждение (отвергаем нулевую гипотезу) и принимаем разумное решение.

4. Статистическая значимость

Наконец, это последний этап, когда мы собираем все вместе и проверяем, является ли результат статистически значимым.

Недостаточно иметь только р-значение, нам нужно установить порог (уровень значимости — альфа). Альфа всегда должна быть установлена ​​перед экспериментом, чтобы избежать смещения. Если наблюдаемое р-значение ниже, чем альфа, то мы заключаем, что результат является статистически значимым.

Основное правило — установить альфа равным 0,05 или 0,01 (опять же, значение зависит от вашей задачи).

Как упоминалось ранее, предположим, что мы установили альфа равным 0,05, прежде чем мы начали эксперимент, полученный результат является статистически значимым, поскольку р-значение 0,03 ниже, чем альфа.

Для справки ниже приведены основные этапы всего эксперимента:

Если вы хотите узнать больше о статистической значимости, не стесняйтесь посмотреть эту статью — Объяснение статистической значимости, написанная Уиллом Керсеном.

Последующие размышления

Здесь много чего нужно переваривать, не так ли?

Я не могу отрицать, что p-значения по своей сути сбивают с толку многих людей, и мне потребовалось довольно много времени, чтобы по-настоящему понять и оценить значение p-значений и то, как они могут быть применены в рамках нашего процесса принятия решений в качестве специалистов по данным.

Но не слишком полагайтесь на p-значения, поскольку они помогают только в небольшой части всего процесса принятия решений.

Я надеюсь, что мое объяснение p-значений стало интуитивно понятным и полезным в вашем понимании того, что в действительности означают p-значения и как их можно использовать при проверке ваших гипотез.

Сам по себе расчет р-значений прост. Трудная часть возникает, когда мы хотим интерпретировать p-значения в проверке гипотез. Надеюсь, что теперь трудная часть станет для вас немного легче.

Если вы хотите узнать больше о статистике, я настоятельно рекомендую вам прочитать эту книгу (которую я сейчас читаю!) — Практическая статистика для специалистов по данным, специально написанная для data scientists, чтобы разобраться с фундаментальными концепциями статистики.

Что такое нулевая гипотеза в статистике. Смотреть фото Что такое нулевая гипотеза в статистике. Смотреть картинку Что такое нулевая гипотеза в статистике. Картинка про Что такое нулевая гипотеза в статистике. Фото Что такое нулевая гипотеза в статистике

Узнайте подробности, как получить востребованную профессию с нуля или Level Up по навыкам и зарплате, пройдя платные онлайн-курсы SkillFactory:

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *