Що таке дисперсія?
Дисперсія відповідає на питання, яке середнє саме по собі не закриває — наскільки щільно дані тримаються довкола центру, виміряне у квадратних одиницях. Уявіть два класи з однаковим середнім балом 75: при дисперсії 4 учні показують майже однакові результати, при дисперсії 144 розрив між найсильнішим і найслабшим перевищує 30 балів. Середнє вказує на місце, дисперсія — на розкид; ANOVA, регресія та решта інференційної статистики тримається саме на тому, що дисперсія розповідає про цей розкид.
Калькулятор вище приймає числа, розділені комами, пробілами або переходами рядка, і повертає вибіркову дисперсію (s²) разом із генеральною (σ²) та проміжними сумами для перевірки рукою. Якщо потрібен результат у первісних одиницях вимірювання — візьміть квадратний корінь, і ви отримаєте стандартне відхилення.
Формули
Дисперсія генеральної сукупності (σ²)
σ² = Σ(xᵢ − μ)² / N
Використовуйте, коли набір даних містить усі значення групи — увесь клас, усі товари, відвантажені зі складу за день, усі ігри одного гравця.
Вибіркова дисперсія (s²)
s² = Σ(xᵢ − x̄)² / (n − 1)
Використовуйте, коли дані — лише підмножина більшої сукупності. Поправка Бесселя — ділення на (n−1) замість n — прибирає зміщення, яке інакше занижує оцінку дисперсії.
Як обчислити дисперсію вручну
- Обчисліть середнє набору (сума ÷ кількість).
- Від кожного значення відніміть середнє — отримаєте відхилення від середнього.
- Піднесіть кожне відхилення до квадрата. Це і робить дисперсію дисперсією — прибирає знаки й посилює вплив значень, далеких від центру.
- Додайте квадрати відхилень — це проміжне число називається сумою квадратів (SS).
- Поділіть SS на N для генеральної дисперсії або на (n−1) для вибіркової.
Часті запитання
Що таке дисперсія?
Дисперсія — це середня квадратична відстань між кожним значенням і середнім. Піднесення відхилень до квадрата робить їх внесок завжди додатним і непропорційно посилює вплив великих відхилень — і саме ця властивість лежить в основі ANOVA, регресії та решти інференційної статистики.
Вибіркова чи генеральна дисперсія — яку використовувати?
Дисперсія генеральної сукупності (σ²) ділить на N і застосовується, коли в наборі є всі значення групи. Вибіркова дисперсія (s²) ділить на (n−1) — поправка Бесселя — і застосовується, коли ваші дані лише підмножина більшої сукупності. У дослідженнях і більшості домашніх завдань за замовчуванням вибирають вибіркову формулу.
Чи може дисперсія бути від'ємною?
Ні. Дисперсія — це середнє квадратів, а тому її мінімум — нуль, і це можливо лише коли всі значення збігаються із середнім. Від'ємна дисперсія завжди свідчить про обчислювальну помилку — найчастіше це або помилка знака на кроці піднесення в квадрат, або програмний баг, який сумує відхилення до того, як їх підняли до квадрата.
Як обчислити дисперсію в Excel?
Excel використовує =VAR.S() для вибіркової дисперсії та =VAR.P() для генеральної — наприклад, =VAR.S(A1:A10) повертає вибіркову дисперсію клітинок A1:A10. Стара =VAR() за замовчуванням рахує вибіркову, що нерідко спантеличує тих, хто чекає на генеральну формулу від такого узагальненого імені.