Что такое объем ряда чисел
Статистические исследования числовых рядов. Статистические характеристики числовых рядов
Очень часто из-за дороговизны или слишком большого числа наблюдений невозможно получить полной информации об объектах, событиях или наблюдениях. По этой причине информацию получают на основе анализа части всего множества объектов, событий или наблюдений, называемой рядом числовых данных, рядом выборочных данных или, просто, выборкой.
Выборка представляет собой конечный ряд чисел (выборочных данных), количество чисел в котором называют объемом выборки
Для обеспечения достоверности информации об объектах, событиях или наблюдениях, полученных на основе статистических исследований числовых рядов (анализа выборочных данных), отбор выборочных данных должен носить случайный характер и иметь достаточно большой объем, то есть выборка должны быть репрезентативной (представительной).
Статистические исследования числовых рядов (рядов чисел, рядов выборочных данных) удобно проводить в соответствии со следующей схемой, которую мы изложим на примере следующей выборки X :
Определяем объем выборки (число чисел в числовом ряде).
В числовом ряде (1) десять чисел, поэтому объем выборки равен 10.
Вычисляем среднее арифметическое числового ряда X (среднее выборочное значение), которое обозначают .
Для числового ряда (1)
Для числового ряда X вариационный ряд X1 имеет следующий вид:
Вычисляем медиану числового ряда.
В случае, когда объем выборки (число членов числового ряда) – чётное число, медианой числового ряда является число, равное половине суммы двух чисел, стоящих в середине вариационного ряда.
В случае, когда объем выборки (число членов числового ряда) – нечётное число, медианой числового ряда является число, стоящее в середине вариационного ряда.
Например, медианой числового ряда
Составляем таблицу частот числового ряда.
ТАБЛИЦА ЧАСТОТ ЧИСЛОВОГО РЯДА
Числа, составляющие вариационный ряд (без повторений) | 3,12 | 3,24 | 3,25 | 3,34 | 3,37 | 3,44 |
Частоты | 3 | 2 | 1 | 1 | 1 | 2 |
Числа, составляющие вариационный ряд (без повторений) | Частоты |
3,12 | 3 |
3,24 | 2 |
3,25 | 1 |
3,34 | 1 |
3,37 | 1 |
3,44 | 2 |
Составляем таблицу относительных частот (в процентах).
Для того, чтобы сформировать таблицу относительных частот числового ряда, заменим частоты, записанные во второй строке таблицы частот числового ряда, на соответствующие им относительные частоты. В результате получим следующую таблицу.
ТАБЛИЦА ОТНОСИТЕЛЬНЫХ ЧАСТОТ (В ПРОЦЕНТАХ)
Числа, составляющие вариационный ряд (без повторений) | 3,12 | 3,24 | 3,25 | 3,34 | 3,37 | 3,44 |
Относительные частоты (%) | 30% | 20% | 10% | 10% | 10% | 20% |
Числа, составляющие вариационный ряд (без повторений) | Относительные частоты (%) |
3,12 | 30% |
3,24 | 20% |
3,25 | 10% |
3,34 | 10% |
3,37 | 10% |
3,44 | 20% |
Находим моду числового ряда.
Математическая статистика — основы
Слово «статистика» происходит от латинского слова «status» (статус), что означает «состояние и положение дел/вещей».
Статистика занимается изучением количественной стороны массовых общественных явлений и процессов в числовой форме, выявляя особые закономерности.
На сегодняшний день статистика применяется практически во всех сферах общественной жизни, начиная от моды, кулинарии, садоводства и заканчивая астрономией, экономикой, медициной.
Перво-наперво, при знакомстве со статистикой необходимо изучить основные статистические характеристики, применяемые для анализа данных.
Ну вот, с этого и начнем!
Математическая статистика — коротко о главном
Определения математической статистики:
Статистическая выборка – выбранное из всего числа объектов конкретное число объектов для исследования.
Объем выборки – количество элементов \( <
_<1>>,< _<2>>,\ …,\ < _ >\), попавших в выборку.
Размах выборки – разность между максимальным и минимальным значениями элементов выборки.
Среднее арифметическое ряда чисел – это частное от деления суммы этих чисел на их количество (объем выборки).
Среднее арифметическое ряда чисел \( \left( <
_ > \right)\) – это частное от деления суммы этих чисел \( \left( < _<1>>+< _<2>>+…+< _ > \right)\) на их количество \( \left( n \right)\)
Модой ряда чисел называется число, наиболее часто встречающееся в данном ряду.
Медиана упорядоченного ряда чисел с нечетным числом членов – число, которое окажется посередине.
Медиана упорядоченного ряда чисел с четным числом членов –среднее арифметическое двух чисел, записанных посередине.
Частота представляет собой число повторений, сколько раз за какой-то период происходило некоторое событие, проявлялось определенное свойство объекта либо наблюдаемый параметр достигал данной величины.
Частота – число повторений определенного значения параметра в выборке.
Относительная частота – это отношение частоты к общему числу данных в ряду.
Для наглядности удобно представлять данные в виде соответствующих диаграмм/графиков.
Статистические характеристики
К основным статистическим характеристикам выборки данных…
Какая еще такая «выборка»!?
Под словом «выборка» подразумевается просто данные, которые ты собираешься исследовать.
Дальше на примерах будет все понятно.
Так вот к основным статистическим характеристикам выборки данных относятся:
Стоп-стоп-стоп! Сколько новых слов! Давай обо всем по порядку.
Объем и размах выборки
Выборка состоит из элементов \( <
_<1>>,< _<2>>,\ …,\ < _ >\), попавших в нее. Количество этих элементов \( \left( n \right)\) называется объемом выборки.
Например, в таблице ниже приведен рост игроков сборной по футболу:
Данная выборка представлена \( \displaystyle 11\) элементами \( \displaystyle \left( <
Таким образом, объем выборки \( \displaystyle \left( n \right)\) равен \( \displaystyle 11\).
Разность между максимальным и минимальным значениями элементов выборки называется размахом выборки.
Размах представленной выборки составляет \( <
Среднее арифметическое выборки
Среднее арифметическое ряда чисел \( \left( <
_ > \right)\) – это частное от деления суммы этих чисел \( \left( < _<1>>+< _<2>>+…+< _ > \right)\) на их количество \( \left( n \right)\).
Не очень понятно? Давай смотреть на наш пример.
Определите средний рост игроков.
Ну что, приступим? Мы уже разбирались, что \( \displaystyle <
Можем сразу смело все подставлять в нашу формулу:
Таким образом, средний рост игрока сборной составляет \( \displaystyle 183,8\) см.
Ну или вот такой пример:
Ученикам 9 класса на неделю было задано решить как можно больше примеров из задачника. Количество примеров, решенных учениками за неделю, приведены ниже:
Найдите среднее количество решенных задач.
Итак, в таблице нам представлены данные по \( \displaystyle 20\) ученикам. Таким образом, \( \displaystyle n=20\). \( \displaystyle <
Ну что ж, найдем для начала сумму (общее количество) всех решенных задач двадцатью учениками:
Теперь можем смело приступать к расчету среднего арифметического решенных задач, зная, что \( \displaystyle <
Таким образом, в среднем ученики 9 класса решили по \( \displaystyle 78\) задач.
Еще один пример:
На рынке помидоры реализуются \( \displaystyle 7\) продавцами, причем цены за \( \displaystyle 1\) кг распределены следующим образом (в руб.): \( \displaystyle 60,\text< >55,\text< >54,\text< >70,\text< >65,\text< >67,\text< >63\).
Какова средняя цена килограмма помидоров на рынке?
Решение.
Итак, чему в данном примере равно \( \displaystyle n\)? Все верно: семь продавцов предлагают семь цен, значит, \( \displaystyle n=7\)! \( \displaystyle <
Ну вот, со всеми составляющими разобрались, теперь можем приступить к расчету средней цены:
Тогда посчитай самостоятельно среднее арифметическое в следующих выборках:
Ответы: \( \displaystyle 48,17;\text< >9;\ 168\).
Решил? Можем двигаться дальше.
Мода и медиана
Модой ряда чисел называется число, наиболее часто встречающееся в данном ряду.
Обратимся снова к нашему примеру со сборной по футболу:
Чему в данном примере равна мода? Какое число наиболее часто встречается в этой выборке?
Все верно, это число \( \displaystyle 181\), так как два игрока имеют рост \( \displaystyle 181\) см; рост же остальных игроков не повторяется.
Тут все должно быть ясно и понятно, да и слово знакомое, правда?
Перейдем к медиане, ты ее должен знать из курса геометрии. Но мне не сложно напомнить, что в геометрии медиана (в переводе с латинского- «средняя») — отрезок внутри треугольника, соединяющий вершину треугольника с серединой противоположной стороны.
Ключевое слово – СЕРЕДИНА. Если ты знал это определение, то тебе легко будет запомнить, что такое медиана в статистике.
Медианой ряда чисел с нечетным числом членов называется число, которое окажется посередине, если этот ряд упорядочить (проранжировать, т.е. расположить значения в порядке убывания или возрастания).
Медианой ряда чисел с четным числом членов называется среднее арифметическое двух чисел, записанных посередине, если этот ряд упорядочить.
Ну что, вернемся к нашей выборке футболистов?
Ты заметил в определении медианы важный момент, который нам еще здесь не встречался? Конечно, «если этот ряд упорядочить»!
Для того, чтобы в ряду чисел был порядок, можно расположить значения роста футболистов как в порядке убывания, так и в порядке возрастания. Мне удобней выстроить этот ряд в порядке возрастания (от самого маленького к самому большому).
Вот, что у меня получилось:
Так, ряд упорядочили, какой еще есть важный момент в определении медианы? Правильно, четное и нечетное количество членов в выборке.
Заметил, что для четного и нечетного количества даже определения отличаются? Да, ты прав, не заметить – сложно. А раз так, то нам надо определиться, четное у нас количество игроков в нашей выборке или нечетное?
Все верно – игроков \( \displaystyle 11\), значит, количество нечетное! Теперь можем применять к нашей выборке менее заковыристое определение медианы для нечетного количества членов в выборке.
Ищем число, которое оказалось посередине в нашем упорядоченном ряду:
Ну вот, чисел у нас \( \displaystyle 11\), значит, по краям остается по пять чисел, а рост \( \displaystyle 183\) см будет медианой в нашей выборке.
Не так уж и сложно, правда?
А теперь разберем пример с нашими отчаянными ребятами из 9 класса, которые решали примеры в течение недели:
Готов искать в этом ряду моду и медиану?
Для начала, упорядочим этот ряд чисел (расположим от самого маленького числа к самому большому). Получился вот такой вот ряд:
Теперь можно смело определить моду в данной выборке. Какое число встречается чаще других? Все верно, \( \displaystyle 77\)!
Таким образом, мода в данной выборке равна \( \displaystyle 77\).
Моду нашли, теперь можем приступать к нахождению медианы. Но прежде, ответь мне: каков объем рассматриваемой выборки? Посчитал? Все верно, объем выборки равен \( \displaystyle 20\).
А \( \displaystyle 20\) – это четное число. Таким образом, применяем определение медианы для ряда чисел с четным количеством элементов.
То есть нам надо в нашем упорядоченном ряду найти среднее арифметическое двух чисел, записанных посередине. Какие два числа располагаются посередине?
Все верно, \( \displaystyle 80\) и \( \displaystyle 81\)!
Таким образом, медианой этого ряда будет среднее арифметическое чисел \( \displaystyle 80\) и \( \displaystyle 81\):
\( 80,5\)— медиана рассматриваемой выборки.
Частота и относительная частота
Частота представляет собой число повторений, сколько раз за какой-то период происходило некоторое событие, проявлялось определенное свойство объекта либо наблюдаемый параметр достигал данной величины.
То есть частота определяет то, как часто повторяется та или иная величина в выборке.
Разберемся на нашем примере с футболистами. Перед нами вот такой вот упорядоченный ряд:
Частота – это число повторений какой-либо величины параметра. В нашем случае, это можно считать вот так. Сколько игроков имеет рост \( 176\)?
Все верно, один игрок. Таким образом, частота встречи игрока с ростом \( 176\) в нашей выборке равна \( 1\).
Сколько игроков имеет рост \( 178\)? Да, опять же один игрок. Частота встречи игрока с ростом \( 178\) в нашей выборке равна \( 1\).
Задавая такие вопросы и отвечая на них, можно составить вот такую табличку:
Ну вот, все довольно просто. Помни, что сумма частот должна равняться количеству элементов в выборке (объему выборки).
То есть в нашем примере: \( 1+1+1+2+1+1+1+1+1+1=11\)
Перейдем к следующей характеристике – относительная частота.
Относительная частота – это отношение частоты к общему числу данных в ряду. Как правило, относительная частота выражается в процентах. |
Рассчитываем относительную частоту для каждого значения роста и получаем вот такую табличку:
А теперь сам составь таблицы частот и относительных частот для примера с 9-классниками, решающими задачи.
Графическое изображение данных
Очень часто для наглядности данные представляются в виде диаграмм/графиков. Остановимся на рассмотрении основных из них:
Столбчатая диаграмма
Столбчатые диаграммы используют тогда, когда хотят продемонстрировать динамику изменения данных во времени или распределения данных, полученных в результате статистического исследования.
Например, у нас есть вот такие данные об оценках написанной контрольной работы в одном классе:
Количество получивших такую оценку – это у нас и есть частота. Зная это, мы можем составить вот такую вот табличку:
Теперь мы можем построить наглядные столбчатые графики на основе такого показателя как частота (на горизонтальной оси отражены оценки \( \displaystyle \left( 2,3,4,5 \right)\) на вертикальной оси откладываем количество учеников, получивших соответствующие оценки):
Или же можем построить соответствующий столбчатый график на основе относительной частоты:
Рассмотрим пример по типу задания из ЕГЭ.
Пример.
На диаграмме показано распределение добычи нефти в \( \displaystyle 7\) странах мира (в тоннах) за 2011 год.
Среди стран первое место по добыче нефти занимала Саудовская Аравия, седьмое место – Объединенные Арабские Эмираты. Какое место занимали США?
Ответ: третье.
Круговая диаграмма
Для наглядного изображения соотношения между частями исследуемой выборки удобно использовать круговые диаграммы.
По нашей табличке с относительными частотами распределения оценок в классе мы можем построить круговую диаграмму, разбив круг на секторы, пропорциональные относительным частотам.
Круговая диаграмма сохраняет свою наглядность и выразительность только при небольшом числе частей совокупности. В нашем случае, таких частей четыре (в соответствии с возможными оценками \( \displaystyle 2,3,4,5\)), поэтому применение такого типа диаграммы достаточно эффективно.
Рассмотрим пример по типу задания 18 из ГИА.
Пример.
На диаграмме показано распределение расходов семьи во время отдыха на море. Определите, на что семья потратила больше всего?
Ответ: проживание.
Полигон
Динамику изменения статистических данных во времени часто изображают с помощью полигона.
Для построения полигона отмечают в координатной плоскости точки, абсциссами которых служат моменты времени, а ординатами – соответствующие им статистические данные.
Соединив последовательно эти точки отрезками, получают ломанную, которую называют полигоном.
Вот, к примеру, нам даны среднемесячные температуры воздуха в Москве.
Сделаем приведенные данные более наглядными – построим полигон.
На горизонтальной оси отражены месяцы, на вертикальной – температура. Строим соответствующие точки и соединяем их.
Вот, что получилось:
Согласись, сразу стало наглядней!
Полигон, используют также для наглядного изображения распределения данных, полученных в результате статистического исследования.
Вот построенный полигон на основе нашего примера с распределением оценок:
Рассмотрим типовое задание из ЕГЭ.
Пример.
На рисунке жирными точками показана цена алюминия на момент закрытия биржевых торгов во все рабочие дни с \( \displaystyle 7\) по \( \displaystyle 20\) августа \( \displaystyle 2014\) года.
По горизонтали указываются числа месяца, по вертикали — цена тонны алюминия в долларах США. Для наглядности жирные точки на рисунке соединены линией.
Определите по рисунку, какого числа цена алюминия на момент закрытия торгов была наименьшей за данный период.
Ответ: \( \displaystyle 14\).
Гистограмма
Интервальные ряды данных изображают с помощью гистограммы.
Гистограмма представляет собой ступенчатую фигуру, составленную из сомкнутых прямоугольников. Основание каждого прямоугольника равно длине интервала, а высота – частоте или относительной частоте.
Таким образом, в гистограмме, в отличие от обычной столбчатой диаграммы, основания прямоугольника выбираются не произвольно, а строго определены длиной интервала.
Вот, к примеру, у нас есть следующие данные о росте игроков, вызванных в сборную:
Итак, нам дана частота (количество игроков с соответствующим ростом). Мы можем дополнить табличку, рассчитав относительную частоту:
Ну вот, теперь можем строить гистограммы. Сначала построим на основании частоты.
Вот, что получилось:
А теперь на основании данных об относительной частоте:
Пример.
На выставку по инновационным технологиям приехали представители \( \displaystyle 50\) компаний. На диаграмме показано распределение этих компаний по количеству персонала.
По горизонтали представлено количество сотрудников в компании, по вертикали — количество компаний, имеющих данное число сотрудников.
Какой процент составляют компании с общим числом сотрудников больше \( \displaystyle 50\) человек?
Ответ: \( \displaystyle 68\%\).
Бонус: Вебинары с нашего курса по подготовке к ЕГЭ
Этот вебинар по родственной математической статистике теме — теории вероятности.
ЕГЭ №4 Теория вероятности
Что вы узнаете на этом уроке?
80% урока — решение задач