Что такое стандартная ошибка в статистике

Понятие об ошибке выборки.

Поможем написать любую работу на аналогичную тему

Стандартная ошибка статистики, т.е. оценка стандартного отклонения ее выборочного распределения, приближенно показывает, насколько значение статистики может отличаться от своего среднего значения (параметра генеральной совокупности).

Стандартная ошибка среднего (или просто стандартная ошибка) приближенно показывает, насколько ее выборочная средняя Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике(случайная наблюдаемая величина) отличается от среднего генеральной совокупности μ (фиксированная неизвестная величина):

Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике(7.1)

Стандартная ошибка уменьшается с увеличением размера выборки n (при прочих равных условиях), отражая тот факт, что большая по размеру выборка содержит больше информации и таким образом достигается большая точность.

Когда объем генеральной совокупности настолько мал, что выборка составляет достаточно большую часть генеральной совокупности, стандартную ошибку можно уменьшить, введя в формулу корректирующий (поправочный) коэффициент для конечной совокупности, чтобы получить уточненную (откорректированную) стандартную ошибку:

Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике(7.2)

Кроме того, формулу (7.1) используют повторной выборке, а формулу (7.2) – для бесповторной, однако, если объем выборочной совокупности достаточно большой, то поправочный коэффициент не играет большой роли и стандартная ошибка для бесповторной выборки определяется по формуле (7.1).

Для измерения стандартной ошибки доли альтернативного признака применяют другие формулы. При повторной выборке:

Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике(7.3)

При бесповторной выборке:

Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике(7.4)

Теоретическую (идеальную) генеральную совокупность можно определить; как очень большую, иногда предполагаемую (воображаемую) генеральную совокупность, которую представляет ваша выборка. Если вас интересует теоретическая генеральная совокупность, не используйте поправку на конечность генеральной совокупности. С другой стороны, если необходимо сделать вывод об основе выборки, не выходя за ее пределы, то поправка может быть полезной, так как ее использование уменьшает вариацию системы. Если есть сомнения, лучше не использовать поправку.

Стандартная ошибка доли Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистикепоказывает неопределенность, или изменчивость, в наблюдаемой доле Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике, а стандартная ошибка среднегоЧто такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике–неопределенность в наблюдаемой частоте х.

Доверительным интервалом называют интервал, рассчитанный из данных таким образом, что существует известная вероятность включения интересующего вас (неизвестного) параметра генеральной совокупности в интервал, и эта вероятность интерпретируется с точки зрения случайного эксперимента начинающегося с извлечения случайной выборки. Границы доверительного интервала определяются на основе точечной оценки и предельной ошибки выборки, которая равна произведению стандартной ошибки и Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике— критерия Стьюдента. Предельная ошибка выборки показывает максимально возможную ошибку для принятой вероятности, а доверительное число Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике– как соотносятся предельная и стандартная ошибки.

Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике(7.3)

Вероятность того, что параметр совокупности будет принадлежать доверительному интервалу называют уровнем доверительности, который обычно устанавливают равным 95%, хотя часто используют и другие уровни – 90; 99; 99,9%. Чем выше уровень доверительности, тем шире (а значит, и менее полезен) доверительный интервал. Приблизительная обобщенная формулировка утверждения о доверительном интервале имеет следующий вид: мы уверены на 95%, что значение параметра генеральной совокупности находится между значением оценки минус две стандартные ошибки оценки и значением оценки плюс две стандартные ошибки оценки.

Это утверждение основано на том факте, что при нормальном распределении с вероятностью 0,95 следует ожидать значения на расстоянии Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике, т.е. приблизительно два стандартных отклонения от среднего.

Формулировка утверждения о двустороннем 95% доверительном интервале для среднего генеральной совокупности имеет следующий вид:

мы уверены, на 95%, что среднее генеральной совокупности m находится между Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистикеи Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике, где значение t берется из t-таблицы.

Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике(7.4)

Формулировка утверждения о двустороннем 95% доверительном интервале для генеральной доли имеет следующий вид:

мы уверены на 95%, что доля интересующего нас свойства в генеральной совокупности р находится между Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике и Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике, где значение t берется из t-таблицы.

Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике(7.5)

Чтобы получить доверительный уровень, отличный от 95%, следует просто при построении доверительного интервала использовать соответствующее значение. t-таблицу используют для коррекции дополнительной неопределенности, обусловленной тем, что вместо неизвестного точного значения изменчивости генеральной совокупности используют оценку (стандартную ошибку). Когда вы работаете с бесповторной выборкой размера п, число степеней свободы, равное Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике, представляет собой количество независимых элементов информации, использованных при вычислении стандартной ошибки (поскольку при вычислении стандартного отклонения из наблюдаемых значений вычитают среднее). Если известно точное значение стандартной ошибки, используют t-значение для бесконечного числа степеней свободы.

Для того чтобы использование доверительного интервала было корректным, необходимо выполнение двух следующих условий:

(1) данные должны представлять собой случайную выборку из рассматриваемой генеральной совокупности;

(2) измеренные значения должны подчиняться нормальному распределению.

Первое условие гарантирует, что данные правильно представляют неизвестный параметр, а второе дает основание использовать t-таблицу для вычисления вероятности.

Односторонний доверительный интервал с известной доверительностью указывает, что среднее генеральной совокупности либо не меньше, либо не больше некоторого вычисленного значения. Граничное значение для одностороннего доверительного интервала вычисляется таким же образом, как и для двустороннего интервала, только t-значение для двустороннего интервала заменяется на t-значение для одностороннего интервала и выбирается граничная точка интервала так, чтобы построенный односторонний интервал включал выборочное среднее Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике.

При использовании одностороннего интервала вы должны быть уверены, что независимо от поведения данных вы будете использовать односторонний интервал с той же стороны (т.е. открытый в сторону больших значений или открытый в сторону меньших значений). В противном случае использование одностороннего доверительного интервала некорректно. При наличии сомнений лучше использовать двусторонний интервал. Утверждение об одностороннем доверительном интервале формулируется следующим образом:

мы уверены на 95%, что среднее генеральной совокупности не меньше, чем Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике; или мы уверены на 95%, что среднее генеральной совокупности не больше, чем Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике.

Интервал предсказания позволяет использовать данные выборки для предсказания с известной вероятностью значения нового наблюдения при условии, что это новое наблюдение получено тем же способом, что и предшествующие. В качестве меры неопределенности здесь используется стандартная ошибка предсказания Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике, мера изменчивости расстояния между средним значением выборки и новым наблюдением. Интервал предсказания строят тем же способом, что и доверительный интервал; просто заменяют стандартную ошибку среднего на, стандартную ошибку предсказания. Формулировка утверждения об интервале предсказания (двустороннем) для значения нового наблюдения будет следующей:

Мы уверены на 95%, что новое наблюдение будет находиться между Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистикеи Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике.

Формулировка утверждения об интервале предсказания (одностороннем) для значения нового наблюдения будет такой:

Мы уверены на 95%, что новое наблюдение будет не меньше, чем Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике; или мы уверены на 95%, что новое наблюдение будет не больше, чем Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике.

Выбирая соответствующие t-значение из таблицы, интервалы предсказания для уровней доверительности, отличных от 95%, необходимо помнить, что доверительный интервал дает информацию о среднем генеральной совокупности, в то время как интервал предсказания дает информацию о единственном наблюдении, случайно выбранном из той же генеральной совокупности.

Источник

Ранее мы рассматривали пример анализа, где аналитик оценивал средние планируемые капитальные затраты клиентов на телекоммуникационное оборудование.

Если предположить, что выборка репрезентативна для совокупности, то как аналитик может оценить ошибку выборки при расчете среднего значения по совокупности?

Рассматриваемое как формула, которая использует функцию случайных исходов случайной величины, выборочное среднее само по себе является случайной величиной с распределением вероятностей. Это распределение вероятностей называется выборочным распределением статистики (англ. ‘sampling distribution’).

Иногда возникает путаница, потому что термин «выборочное среднее» также используется в другом смысле. При расчете выборочного среднего для конкретной выборки, мы получаем определенное число, скажем, 8.

Если мы говорим, что «выборочное среднее равно 8», мы используем термин «выборочное среднее» в смысле конкретного исхода выборочного среднего как случайной величины. Число 8 является, конечно же, постоянной величиной и не имеет распределения вероятностей.

В данном обсуждении, мы не рассматриваем «выборочное среднее» как постоянную величину, относящуюся к конкретной выборке.

Центральная предельная теорема.

Формально она формулируется следующим образом:

Центральная предельная теорема позволяет сделать довольно точные вероятностные утверждения о среднем значении совокупности на основе выборочного среднего, независимо от размера распределения совокупности (так как оно имеет конечную дисперсию), потому что выборочное среднее приблизительно соответствует нормальному распределению для выборок большого размера.

Тут сразу возникает очевидный вопрос:

«Какой размер выборки можно считать достаточно большим, чтобы мы могли считать, что выборочное среднее соответствует нормальному распределению?»

В целом, если размер выборки \( n \) больше или равен 30, то можно считать, что выборочное среднее приблизительно нормально распределено.

Центральная предельная теорема утверждает, что дисперсия распределения выборочного среднего равна \( \sigma^2 / n \). Положительный квадратный корень из дисперсии является стандартным отклонением.

Стандартное отклонение выборочной статистики также называют стандартной ошибкой статистики (англ. ‘standard error’).

Стандартная ошибка выборочного среднего является важной величиной в применении центральной предельной теоремы на практике.

Определение стандартной ошибки среднего значения выборки.

Для среднего значения выборки \( \overline X\) рассчитанного на основе выборки из совокупности со стандартным отклонением \( \sigma \), стандартная ошибка среднего значения выборки определяется одним из двух выражений:

\( \Large \dst \sigma_ <\overline X>= <\sigma \over \sqrt n>\) (Формула 1)

когда мы знаем стандартное отклонение совокупности \( \sigma \), или

\( \Large \dst s_ <\overline X>= \) (Формула 2)

когда нам не известно стандартное отклонение совокупности и необходимо использовать стандартное отклонение выборки \(s\), чтобы оценить его.

Необходимо отметить технический момент: Когда мы делаем выборку размера \(n\) из конечной совокупности размера \(N\), мы применяем уменьшающий коэффициент к стандартной ошибке выборочного среднего, который называется поправкой для конечной совокупности (или FPC, от англ. ‘finite population correction factor’).

Если мы рассчитали стандартную ошибку равную, скажем, 20, в соответствии с Формулой 1 или Формулой 2, то оценка ошибки с поправкой составляет \( 20(0.898933) = 17.978663 \).

FPC применяется только когда мы делаем выборку из конечной совокупности без замены.

На практике, большинство аналитиков не применяют FPC, если размер выборки \(n\) слишком мал по сравнению с \( N \) (скажем, менее 5% от \(N\) ).

Для получения дополнительной информации о поправке для конечной совокупности см. Daniel and Terrell (1995).

На практике, нам почти всегда приходится использовать Формулу 2. Стандартное отклонение выборки \(s\) можно рассчитать, найдя квадратный корень из дисперсии выборки \(s^2\), которая рассчитывается следующим образом:

Мы скоро увидим, как мы можем использовать среднее значение выборки и его стандартную ошибку, чтобы сделать вероятностные утверждения о среднем значении совокупности, используя технику доверительных интервалов.

Но сначала мы проиллюстрируем всю силу центральной предельной теоремы.

Пример (3) применения центральной предельной теоремы.

Примечательно, что выборочное среднее для выборок больших размеров будет распределяться нормально, независимо от распределения генеральной совокупности.

Чтобы проиллюстрировать центральную предельную теорему в действии, мы используем в этом примере явное ненормальное распределение и используем его для создания большого количества случайных выборок размером 100.

Затем мы рассчитываем выборочное среднее для каждой выборки. Частотное распределение рассчитываемых выборочных средних является приближением распределения выборочного среднего для данного размера выборки.

Выглядит ли выборочное распределение как нормальное распределение?

Вернемся к примеру с аналитиком, изучающим планы капитальных затрат клиентов на покупку телекоммуникационного оборудования.

Функция вероятности этой непрерывной равномерной случайной величины имеет довольно простую форму, не соответствующую нормальному распределению. Это горизонтальная линия с пересечением на вертикальной оси в точке 1/100. В отличии от нормальной случайной величины, для которой близкие к среднему исходы были бы наиболее вероятны, для равномерной случайной величины все возможные исходы равновероятны.

Чтобы проиллюстрировать силу центральной предельной теоремы, мы проводим моделирование методом Монте-Карло для изучения планируемых капитальных расходов на телекоммуникационное оборудование.

Моделирование методом Монте-Карло предполагает использование компьютера, чтобы смоделировать работу рассматриваемой системы с учетом риска. Составной частью моделирования методом Монте-Карло является генерация большого числа случайных выборок из заданного распределения вероятностей или распределений.

В этом моделировании мы делаем 200 случайных выборок капитальных затрат 100 компаний (200 сгенерированных случайных исходов, каждый из которых состоит из капитальных затрат 100 компаний при \(n = 100 \)).

В каждом испытании моделирования, 100 значений капитальных затрат генерируются из равномерного распределения (0, 100). Для каждой случайной выборки, мы вычисляем выборочное среднее. Всего мы проводим 200 имитационных испытаний.

Результаты этого моделирования методом Монте-Карло приведены в Таблице 2 в виде частотного распределения. Это распределение является рассчитанным выборочным распределением среднего значения.

Таблица 2. Частотное распространение:
200 случайных выборок
равномерной случайной величины (0,100).

Диапазон выборки
средних значений ($ млн.)

42.5 \(\leq \overline X

Полученное распределение частот можно описать как колоколообразное, с центром, расположенным близко к среднему значению совокупности: 50. Наиболее частый или модальный диапазон, с 41 наблюдениями: от 48.5 до 50.

Расхождение между вычисленными и ожидаемыми значениями среднего и стандартного отклонения, полученными в соответствии с центральной предельной теоремой, является результатом случайности (ошибка выборки).

Таким образом, хотя распределение совокупности очень не нормальное, моделирование показало, что нормальное распределение хорошо описывает рассчитанное распределение выборочного среднего. При этом среднее и стандартная ошибка приближительно равны значениям, предсказанным с помощью центральной предельной теоремы.

Итак, в соответствии с центральной предельной теоремой, когда мы делаем выборку из любого распределения, распределение выборочного среднего будет иметь следующие свойства, если размер нашей выборки достаточно велик:

Далее мы обсудим концепции и инструменты, связанные с оценкой параметров совокупности, с особым акцентом на среднее значение совокупности.

Мы фокусируем внимание на среднем значении совокупности, потому что интервальные оценки среднего значения совокупности интересуют финансовых аналитиков, как правило, больше, чем любой другой тип интервальных оценок.

Источник

Стандартная ошибка средней арифметической

Среднее арифметическое, как известно, используется для получения обобщающей характеристики некоторого набора данных. Если данные более-менее однородны и в них нет аномальных наблюдений (выбросов), то среднее хорошо обобщает данные, сведя к минимуму влияние случайных факторов (они взаимопогашаются при сложении).

Когда анализируемые данные представляют собой выборку (которая состоит из случайных значений), то среднее арифметическое часто (но не всегда) выступает в роли приближенной оценки математического ожидания. Почему приближенной? Потому что среднее арифметическое – это величина, которая зависит от набора случайных чисел, и, следовательно, сама является случайной величиной. При повторных экспериментах (даже в одних и тех же условиях) средние будут отличаться друг от друга.

Для того, чтобы на основе статистического анализа данных делать корректные выводы, необходимо оценить возможный разброс полученного результата. Для этого рассчитываются различные показатели вариации. Но то исходные данные. И как мы только что установили, среднее арифметическое также обладает разбросом, который необходимо оценить и учитывать в дальнейшем (в выводах, в выборе метода анализа и т.д.).

Интуитивно понятно, что разброс средней должен быть как-то связан с разбросом исходных данных. Основной характеристикой разброса средней выступает та же дисперсия.

Дисперсия выборочных данных – это средний квадрат отклонения от средней, и рассчитать ее по исходным данным не составляет труда, например, в Excel предусмотрены специальные функции. Однако, как же рассчитать дисперсию средней, если в распоряжении есть только одна выборка и одно среднее арифметическое?

Расчет дисперсии и стандартной ошибки средней арифметической

Чтобы получить дисперсию средней арифметической нет необходимости проводить множество экспериментов, достаточно иметь только одну выборку. Это легко доказать. Для начала вспомним, что средняя арифметическая (простая) рассчитывается по формуле:

Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике

где xi – значения переменной,
n – количество значений.

Теперь учтем два свойства дисперсии, согласно которым, 1) — постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат и 2) — дисперсия суммы независимых случайных величин равняется сумме соответствующих дисперсий. Предполагается, что каждое случайное значение xi обладает одинаковым разбросом, поэтому несложно вывести формулу дисперсии средней арифметической:

Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике

Используя более привычные обозначения, формулу записывают как:

Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике

где σ 2 – это дисперсия, случайной величины, причем генеральная.

На практике же, генеральная дисперсия известна далеко не всегда, точнее совсем редко, поэтому в качестве оной используют выборочную дисперсию:

Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике

Стандартное отклонение средней арифметической называется стандартной ошибкой средней и рассчитывается, как квадратный корень из дисперсии.

Формула стандартной ошибки средней при использовании генеральной дисперсии

Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике

Формула стандартной ошибки средней при использовании выборочной дисперсии

Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике

Последняя формула на практике используется чаще всего, т.к. генеральная дисперсия обычно не известна. Чтобы не вводить новые обозначения, стандартную ошибку средней обычно записывают в виде соотношения стандартного отклонения выборки и корня объема выборки.

Назначение и свойство стандартной ошибки средней арифметической

Стандартная ошибка средней много, где используется. И очень полезно понимать ее свойства. Посмотрим еще раз на формулу стандартной ошибки средней:

Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике

Числитель – это стандартное отклонение выборки и здесь все понятно. Чем больше разброс данных, тем больше стандартная ошибка средней – прямо пропорциональная зависимость.

Посмотрим на знаменатель. Здесь находится квадратный корень из объема выборки. Соответственно, чем больше объем выборки, тем меньше стандартная ошибка средней. Для наглядности изобразим на одной диаграмме график нормально распределенной переменной со средней равной 10, сигмой – 3, и второй график – распределение средней арифметической этой же переменной, полученной по 16-ти наблюдениям (которое также будет нормальным).

Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике

Судя по формуле, разброс стандартной ошибки средней должен быть в 4 раза (корень из 16) меньше, чем разброс исходных данных, что и видно на рисунке выше. Чем больше наблюдений, тем меньше разброс средней.

Казалось бы, что для получения наиболее точной средней достаточно использовать максимально большую выборку и тогда стандартная ошибка средней будет стремиться к нулю, а сама средняя, соответственно, к математическому ожиданию. Однако квадратный корень объема выборки в знаменателе говорит о том, что связь между точностью выборочной средней и размером выборки не является линейной. Например, увеличение выборки с 20-ти до 50-ти наблюдений, то есть на 30 значений или в 2,5 раза, уменьшает стандартную ошибку средней только на 36%, а со 100-а до 130-ти наблюдений (на те же 30 значений), снижает разброс данных лишь на 12%.

Лучше всего изобразить эту мысль в виде графика зависимости стандартной ошибки средней от размера выборки. Пусть стандартное отклонение равно 10 (на форму графика это не влияет).

Что такое стандартная ошибка в статистике. Смотреть фото Что такое стандартная ошибка в статистике. Смотреть картинку Что такое стандартная ошибка в статистике. Картинка про Что такое стандартная ошибка в статистике. Фото Что такое стандартная ошибка в статистике

Видно, что примерно после 50-ти значений, уменьшение стандартной ошибки средней резко замедляется, после 100-а – наклон постепенно становится почти нулевым.

Таким образом, при достижении некоторого размера выборки ее дальнейшее увеличение уже почти не сказывается на точности средней. Этот факт имеет далеко идущие последствия. Например, при проведении выборочного обследования населения (опроса) чрезмерное увеличение выборки ведет к неоправданным затратам, т.к. точность почти не меняется. Именно поэтому количество опрошенных редко превышает 1,5 тысячи человек. Точность при таком размере выборки часто является достаточной, а дальнейшее увеличение выборки – нецелесообразным.

Подведем итог. Расчет дисперсии и стандартной ошибки средней имеет довольно простую формулу и обладает полезным свойством, связанным с тем, что относительно хорошая точность средней достигается уже при 100 наблюдениях (в этом случае стандартная ошибка средней становится в 10 раз меньше, чем стандартное отклонение выборки). Больше, конечно, лучше, но бесконечно увеличивать объем выборки не имеет практического смысла. Хотя, все зависит от поставленных задач и цены ошибки. В некоторых опросах участие принимают десятки тысяч людей.

Дисперсия и стандартная ошибка средней имеют большое практическое значение. Они используются в проверке гипотез и расчете доверительных интервалов.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *