Что такое перцентиль простыми словами

Что такое процентиль?

Что такое перцентиль простыми словами. Смотреть фото Что такое перцентиль простыми словами. Смотреть картинку Что такое перцентиль простыми словами. Картинка про Что такое перцентиль простыми словами. Фото Что такое перцентиль простыми словами

Что такое процентиль?

Термин ″процентиль″ (percentile) часто встречается в зарубежной литературе про инвестиции и вообще в статистических исследованиях – одно из таких исследований я упоминал в этой статье. Другими вариантами русских названий являются ″персентиль″ и ″перцентиль″. Думаю, что небольшая известность термина в России не вполне заслужена, поскольку нередко именно в процентилях удобно выразить полученные результаты.

Процентиль это определенная часть выборки данных

Возьмем простой пример. Группа студентов из 200 человек пишет тест, состоящий из 100 вопросов. Проходной порог, когда тест считается сданным, составляет 2/3 правильных ответов, т.е. не менее 66. Что получается с точки зрения отдельного студента?

Допустим, Иван правильно ответил на 70 вопросов. Задачу он выполнил — тест засчитан. Результат каждого участника теста также сравнивается с числом 66: если правильных ответов больше, тест сдан. В результате формируется список сдавших и не сдавших: каждый студент проходил через это. Пока ничего нового.

Что такое перцентиль простыми словами. Смотреть фото Что такое перцентиль простыми словами. Смотреть картинку Что такое перцентиль простыми словами. Картинка про Что такое перцентиль простыми словами. Фото Что такое перцентиль простыми словами

Но задачу можно поставить и по-другому: нужно сравнить результаты студентов не с проходным баллом в 66 пунктов, а между собой. Зачем это нужно? В данном случае, например, для объективной оценки сложность теста, что достигается группировкой результатов.

Вернемся к Ивану, который получил 70 правильных ответов. Много это или мало по сравнению с остальными? Это и покажет процентиль.

Процентили делят всю выборку на определенные части. Например, пятый процентиль охватывает 5% объема выборки. Предположим, показатель Ивана равен пятому процентилю. Это означает, что Иван написал тест лучше, чем 5% студентов (10 человек из 200 получили от нуля до 70 баллов). Не густо, поскольку в этом случае остальные 190 человек набрали больше, чем 70. Значит, тест был очень легкий и порог в 66 баллов можно и повысить.

Но в том же самом тесте может быть и обратная ситуация: результат Ивана равен 90-ому процентилю. Это значит, что Иван написал тест лучше, чем 90% студентов. Или по другому: только 10% (20 человек) набрали более 70 правильных ответов. Следовательно, тест был весьма трудным. Преимущество метода еще и в том, что разбивкой на процентили можно сравнивать тесты с разным числом участников.

Функция Гаусса

Что такое перцентиль простыми словами. Смотреть фото Что такое перцентиль простыми словами. Смотреть картинку Что такое перцентиль простыми словами. Картинка про Что такое перцентиль простыми словами. Фото Что такое перцентиль простыми словами

Чем более высок процентиль, тем больше данных он включает

Расчет процентиля в Excel

Процентиль несложно вычислить по формуле:

Что такое перцентиль простыми словами. Смотреть фото Что такое перцентиль простыми словами. Смотреть картинку Что такое перцентиль простыми словами. Картинка про Что такое перцентиль простыми словами. Фото Что такое перцентиль простыми словами

но проще обрабатывать массив данных одноименной функцией Excel. Для примера возьмем произвольную выборку полученных баллов и рассчитаем в ней процентили:

Что такое перцентиль простыми словами. Смотреть фото Что такое перцентиль простыми словами. Смотреть картинку Что такое перцентиль простыми словами. Картинка про Что такое перцентиль простыми словами. Фото Что такое перцентиль простыми словами

Функция PERCENTILE (ПЕРСЕНТИЛЬ) включает в себя ввод диапазона ячеек данных (А1:А10) и значения процентиля К, деленного на 100%. Т.е. в данном случае ввод 0.3 означает нахождение тридцатого процентиля. Смысл расчета: к 30-му процентилю будут относиться все результаты, меньше или равные 7.9.

Если мы хотим узнать процентиль участника, получившего 10 баллов, то это несложно сделать, варьируя значение К до тех пор, пока значение в ячейке С12 не станет близким 10. Получится примерно 34-ый процентиль. При увеличении процентиля в выборку попадает больше табличных значений:

Что такое перцентиль простыми словами. Смотреть фото Что такое перцентиль простыми словами. Смотреть картинку Что такое перцентиль простыми словами. Картинка про Что такое перцентиль простыми словами. Фото Что такое перцентиль простыми словами

Итого, в 80-ый процентиль попадает уже 8 табличных значений из 10, которые меньше или равны 47.2. При этом подчеркнуть результат можно диапазоном процентилей — например, между восьмидесятым и сотым. В этом случае значения будут лежать между 47.2 и 67 (максимальным числом выборки).

Источник

Перцентиль: Альтернативный взгляд на данные

Сегодня поделюсь переводом интересной статьи от лондонского аналога нашего qRUG, QlikDevGroup.

Введение

Из этой статьи вы узнаете, как создать выражения для расчета распределения по перцентилям по вашему набору данных. Т.е., если сказать проще, такой график:

Что такое перцентиль простыми словами. Смотреть фото Что такое перцентиль простыми словами. Смотреть картинку Что такое перцентиль простыми словами. Картинка про Что такое перцентиль простыми словами. Фото Что такое перцентиль простыми словами

Вы сможете превратить в нечто подобное:

Что такое перцентиль простыми словами. Смотреть фото Что такое перцентиль простыми словами. Смотреть картинку Что такое перцентиль простыми словами. Картинка про Что такое перцентиль простыми словами. Фото Что такое перцентиль простыми словами

Перцентиль – это способ посмотреть на ваши данные в отношении ко всем другим значениям набора данных. Например, если вы хотите определить 10% самых активных покупателей за прошлый месяц, по сути, вы хотите увидеть всех покупателей выше границы в 90%.

Основная причина использования распределения по перцентилям – слишком плотное распределение данных. Например, на графике выше вы видите, как большинство точек в пузырьковой диаграмме сосредоточено внизу.

Таким образом, для того, чтобы понять распределение данных нам нужно увеличить график, при этом мы потерям полную картину данных и связей между ними. По этой причине предлагаю воспользоваться альтернативным способом представления данных – по перцентилю.

Проблемы при работе по средним:

Выход из этой ситуации – перцентили.

НА ЗАМЕТКУ! Перцентили (квантили — в более широком представлении) часто превозносятся как средство преодоления фундаментального недостатка средних значений. Однако не стоит забывать, что перцентиль — это всего лишь число, так же как и среднее. Среднее отображает центр масс выборки, а перцентиль же показывает отметку верхнего уровня указанной доли выборки.

Фрактальный подход

В QlikView и QlikSense достаточно просто рассчитываются перцентили. Функция FRACTILE() будет показывать соответствующее значение перцентиля.

Так, для того чтобы найти ТОП 10% ваших клиентов (то есть тех, которые выше границы 90%), вам нужно использовать следующее выражение:

Например, если вы хотите показать перцентиль 90% по продажам ваших продуктов, то вам нужно использовать следующее выражение:

Подход ранжирования

Фрактальный подход отлично подходит для отображения значений перцентиля. Но для того, чтобы показать значения нескольких процентилей в одно и то же время, нужно использовать функцию RANK(), которая будет распределять данные по группам с одинаковыми значениями.

Например, если у нас есть следующий набор данных:

Применив RANK (), получим ранжирование в виде:

где группа 1-5 – отранжированные ТОП-5 значений.

Второй режим функции ранжирования возвращает значение DUAL.

В примере выше Qlik хранит группу 1-5 как двоичное значение (‘1-5’,1.5)

На следующем шаге следует взять нумерическую часть значений ранжирования и разделить ее на общее число уникальных значений в наборе данных. Так, мы увидим процентные значение, но наименьшие значения (те, которые имеют высший рейтинг), будут отражаться как топовые. Ну а дальше самым простым способом будет минусовать значения этого процента, чтобы инвертировать значения.

Так, если мы продолжим пример с продажами, выражение примет вид:

Эта функция – рабочая, но с некоторыми ограничениями:

В итоге получаем улучшенную формулу:

Практический пример:

Далее рассмотрим пример создания диаграммы с процентилями для QlikSense 2.0.7

Диаграмма представляет продажу по каждому продукту в сравнении с процентильным ранжированием в 2007 и 2008 годах, а также объемом продаж в 2008. Также на графике выделены продукты, которые выросли и упали в перцентилях.

В жизни все не так просто, поэтому добавим немного сложностей и в тестовый пример J Некоторые продукты в 2008 не продавались, поэтому нам придется добавить дополнительную проверку на NULL значения продаж в случае применения фильтров.

Выражение для перцентиля 2007 года получается таким:

Выражение для вычисления размера пузырьков:

И в завершении выражение для цветов диаграммы:

И в заключение я добавил дополнительные линии от 50% на обоих осях:

Что такое перцентиль простыми словами. Смотреть фото Что такое перцентиль простыми словами. Смотреть картинку Что такое перцентиль простыми словами. Картинка про Что такое перцентиль простыми словами. Фото Что такое перцентиль простыми словами

Заключение

Распределение по перцентилю помогает выявить паттерны между данными, которые могут быть скрыты при нормальном распределении. Рекомендую использовать анализ по перцентилям совместно с реальными объемами, чтобы посмотреть на данные с разных точек зрения.

Источник

Перцентили как инструмент управления вознаграждением

Вознаграждение – это один из наиболее комплексных компонентов, составляющих набор компенсаций каждого сотрудника, поэтому компании стараются скрупулёзно анализировать материальное вознаграждение и искать баланс между требованиями рынка и объемом фонда оплаты труда. Даже HR с опытом и хорошим знанием рынка затрудняются сформировать политику вознаграждения в компании, и не всегда уверены, на какие показатели или компании ориентироваться. Для количественного описания положения компаний на рынке принято использовать методы и термины, заимствованные из статистики: уровни рынка или перцентили.

Что такое перцентиль простыми словами. Смотреть фото Что такое перцентиль простыми словами. Смотреть картинку Что такое перцентиль простыми словами. Картинка про Что такое перцентиль простыми словами. Фото Что такое перцентиль простыми словами

В HR перцентили позволяют сопоставить вознаграждение компании с данными рынка, что необходимо по ряду причин:

Проиллюстрировать опасность такого подхода можно следующим примером. У нас есть 3 сотрудника на идентичной должности с зарплатами 50,000.00, 50,000.00 и 80,000.00 в месяц. Наше среднее равно 60,000.00. То есть на 10,000.00 в месяц больше медианы. Теперь умножаем 10,000.00 на 12 месяцев, и переплата составляет 120,000.00 рублей. Вам может показаться, что в масштабах крупной компании это мелочь, но если мы применим наши расчеты к более высоким зарплатам, и возьмем среднее от 500,000.00, 500,000.00 и 600,000.00, то переплата составит 1,200,000.00, и это только для одной группы должностей. Данная сумма уже более весома. Всем нам хороша известна крылатая фраза «средняя температура по больнице», которая достаточно ярко раскрывает коварность среднего.

Высокоэффективные и опытные сотрудники чаще всего знают себе цену и выберут того работодателя, который готов справедливо вознаграждать работника за его вклад в результаты компании, поэтому они стремятся к тем работодателям, которые платят выше медианы.

И все равно остается открытым вопрос, как же правильно установить сотрудникам уровень оплаты. Стоит ли в попытках заполучить в свою компанию лучшие кадры ориентироваться на 90 перцентиль? Конечно, все не так просто. Для того чтобы оставаться на оптимальном уровне оплаты для вашей компании, необходимо проводить аудит вознаграждения в разбивках по категориям сотрудников, по департаментам и периодически сравнивать данные вашей компании с рынком. Чтобы понять, необходимо ли вам проводить аудит вознаграждения, можно воспользоваться небольшим планом:

Если вы являетесь опытным HR и уже проводили аудит вознаграждения, то смело приступайте к данному проекту. Если же у вас не было подобного опыта, то лучше обратиться к специалистам. Помните о том, что аудит вознаграждения – это не только анализ рынка, но и глубокая экспертиза касательно того, как «дышит» индустрия, каждый департамент в ней, каждая категория сотрудников. Ошибка может привести к большим потерям временных и денежных ресурсов – и это в лучшем случае.

Источник

Перцентиль

Кванти́ль (или проценти́ль) в математической статистике — число, такое что заданная случайная величина не превышает его лишь с фиксированной вероятностью.

Содержание

Определение

Что такое перцентиль простыми словами. Смотреть фото Что такое перцентиль простыми словами. Смотреть картинку Что такое перцентиль простыми словами. Картинка про Что такое перцентиль простыми словами. Фото Что такое перцентиль простыми словами.

Квантили нормального распределения

Вероятность,%99,9999,9099,0097,7297,5095,0090,0084,1350,00
Квантиль3,7153,0902,3262,0001,9601,6451,2821,0000,000

Замечания

где FX — функция распределения Что такое перцентиль простыми словами. Смотреть фото Что такое перцентиль простыми словами. Смотреть картинку Что такое перцентиль простыми словами. Картинка про Что такое перцентиль простыми словами. Фото Что такое перцентиль простыми словами.

Медиана и квантили

Примеры

Полезное

Смотреть что такое «Перцентиль» в других словарях:

ПЕРЦЕНТИЛЬ — [англ. percentile] доля площади экосистем (в %), которая не будет защищена от воздействия анализируемого неблагоприятного фактора при принятой для расчетов величине экологического норматива (критической нагрузки, критического уровня и др.).… … Экологический словарь

Квантиль — в математической статистике значение, которое заданная случайная величина не превышает с фиксированной вероятностью. Содержание 1 Определение 2 Замечания 3 Медиан … Википедия

Статистика — Гистограмма (метод графических изображений) У этого термина существуют и другие значения, с … Википедия

Среднее значение — Среднее значение числовая характеристика множества чисел или функций; некоторое число, заключённое между наименьшим и наибольшим из их значений. Содержание 1 Основные сведения 2 Иерархи … Википедия

Процент — % Процент (лат. per cent на сотню) одна сотая доля. Обозначается знаком «%». Используется для обозначения доли чего либо по отношению к целому. Например, 17 % от 500 кг означает 17 частей по 5 кг каждая, то есть… … Википедия

Среднее степенное — У этого термина существуют и другие значения, см. среднее значение. Среднее степени d (или просто среднее степенное) набора положительных вещественных чисел определяется как При этом по непрерывности доопределяются следующие величины … Википедия

Среднее геометрическое — Средним геометрическим нескольких положительных вещественных чисел называется такое число, которым можно заменить каждое из этих чисел так, чтобы их произведение не изменилось. Более формально: Среднее геометрическое двух чисел также называется… … Википедия

Мода (статистика) — У этого термина существуют и другие значения, см. Мода (значения). Мода значение во множестве наблюдений, которое встречается наиболее часто. Случайная величина может не иметь моды. Иногда в совокупности встречается более чем одна мода (например … Википедия

Медиана (статистика) — В этой статье не хватает ссылок на источники информации. Информация должна быть проверяема, иначе она может быть поставлена под сомнение и удалена. Вы можете … Википедия

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *