Эмпирическое правило - обзор, формула для стандартного отклонения, использование

В математике эмпирическое правило гласит, что в нормальном наборе данных практически каждый фрагмент данных будет находиться в пределах трех стандартных отклонений. Стандартное отклонение С точки зрения статистики стандартное отклонение набора данных является мерой величины отклонений между значениями. наблюдений, содержащихся в среднем. Среднее значение - это среднее всех чисел в наборе.

Эмпирическое правило также называют правилом трех сигм или правилом 68-95-99.7, потому что:

  • В пределах первого стандартного отклонения от среднего значения приходится 68% всех данных.
  • 95% всех данных будут находиться в пределах двух стандартных отклонений.
  • Почти все данные - 99,7% - попадают в пределы трех стандартных отклонений (оставшиеся 0,3% используются для учета выбросов, которые существуют почти в каждом наборе данных)

Эмпирическое правило

Нормальное распределение

Эмпирическое правило появилось потому, что одна и та же форма кривых распределения продолжала появляться перед статистиками снова и снова. Эмпирическое правило применяется к нормальному распределению. При нормальном распределении практически все данные находятся в пределах трех стандартных отклонений от среднего. Среднее Среднее Среднее - важное понятие в математике и статистике. В общем, среднее значение относится к среднему или наиболее распространенному значению в наборе, когда режим и медиана равны.

  • Среднее значение - это среднее значение всех чисел в наборе данных.
  • Режим - это число, которое наиболее часто повторяется в наборе данных.
  • Медиана - это значение разницы между наибольшим и наименьшим числами в наборе.

Это означает, что среднее значение, мода и медиана Median Median - это статистическая мера, которая определяет среднее значение набора данных, перечисленных в порядке возрастания (т. Е. От наименьшего к наибольшему значению). Медиана должна находиться в центре набора данных. Половина данных должна быть на верхнем конце набора, а другая половина - ниже.

Определение стандартного отклонения

Эмпирическое правило особенно полезно для прогнозирования результатов в пределах набора данных. Сначала необходимо рассчитать стандартное отклонение. Формула приведена ниже:

Стандартное отклонение - формула

Сложная формула выше распадается следующим образом:

  1. Определите среднее значение набора данных, которое представляет собой сумму набора данных, разделенную на количество чисел.
  2. Для каждого числа в наборе вычтите среднее значение, а затем возведите полученное число в квадрат.
  3. Используя квадраты значений, определите среднее значение для каждого.
  4. Найдите квадратный корень из средних, вычисленных на шаге 3.

Это стандартное отклонение между тремя первичными процентами нормального распределения, в которые должна попадать большая часть данных в наборе, за исключением незначительного процента для выбросов.

Использование эмпирического правила

Как упоминалось выше, эмпирическое правило особенно полезно для прогнозирования результатов в пределах набора данных. Статистически, как только стандартное отклонение определено, набор данных можно легко подчинить эмпирическому правилу, показывающему, где части данных находятся в распределении.

Прогнозирование Прогнозирование Прогнозирование относится к практике прогнозирования того, что произойдет в будущем, с учетом событий в прошлом и настоящем. По сути, это инструмент для принятия решений, который помогает предприятиям справиться с влиянием неопределенности будущего путем изучения исторических данных и тенденций. Это возможно, потому что, даже не зная всей специфики данных, можно делать прогнозы относительно того, где данные попадут в набор, на основе 68%, 95% и 99,7%, указывающих, где должны находиться все данные.

В большинстве случаев эмпирическое правило имеет первостепенное значение для определения результатов, когда доступны не все данные. Это позволяет статистикам - или тем, кто изучает данные, - понять, куда эти данные попадут, когда они будут доступны. Эмпирическое правило также помогает проверить, насколько нормален набор данных. Если данные не соответствуют эмпирическому правилу, это не является нормальным распределением и должно быть рассчитано соответствующим образом.

Связанные чтения

Финансы - официальный провайдер глобальной сертификации финансового моделирования и оценки (FMVA) ™. Сертификация FMVA®. Присоединяйтесь к 350 600+ студентам, которые работают в таких компаниях, как Amazon, JP Morgan и Ferrari. Программа сертификации разработана, чтобы помочь любому стать финансовым аналитиком мирового уровня. . Чтобы продолжать учиться и продвигаться по карьерной лестнице, вам будут полезны следующие дополнительные финансовые ресурсы:

  • Центральная тенденция Центральная тенденция Центральная тенденция - это описательная сводка набора данных через одно значение, которое отражает центр распределения данных. Наряду с изменчивостью
  • Номинальные данные Номинальные данные В статистике номинальные данные (также известные как номинальная шкала) - это тип данных, которые используются для маркировки переменных без предоставления какого-либо количественного значения.
  • Непараметрические тесты Непараметрические тесты В статистике непараметрические тесты - это методы статистического анализа, которые не требуют распределения для соответствия необходимым допущениям для анализа.
  • Волатильность Волатильность Волатильность - это мера скорости колебаний цены ценной бумаги с течением времени. Он указывает уровень риска, связанного с изменением цены ценной бумаги. Инвесторы и трейдеры рассчитывают волатильность ценной бумаги, чтобы оценить прошлые изменения цен.