Як читати таблицю хі-квадрат
У лівому стовпці розташовані ступені свободи (df). Кожен заголовок стовпця вгорі — це рівень значущості α (ймовірність правого хвоста). Число на перетині рядка та стовпця — критичне значення, яке повинна перевищити ваша хі-квадрат статистика, щоб відхилити нульову гіпотезу на цьому рівні значущості.
Наприклад, ви провели тест на відповідність з 5 категоріями, тобто df = 4, і хочете перевірити на рівні α = 0.05. Знайдіть рядок 4 і стовпець 0.05 — на перетині буде 9.488. Якщо ваше χ² перевищує 9.488, дані дають достатньо підстав відхилити нульову гіпотезу на рівні 5%. Карл Пірсон запропонував цей тест у 1900 році, і з того часу ця таблиця є невід'ємною частиною курсів статистики.
Коли використовується розподіл хі-квадрат
Розподіл хі-квадрат зустрічається у трьох основних контекстах. Тест на відповідність перевіряє, чи збігаються спостережувані частоти з гіпотетичним розподілом — df дорівнює кількості категорій мінус один. Тест незалежності з'ясовує, чи пов'язані дві категоріальні змінні в таблиці спряженості — df дорівнює (рядки − 1) × (стовпці − 1). Тест дисперсії порівнює вибіркову дисперсію з гіпотетичною популяційною — df дорівнює n − 1.
Припущення тесту
Хі-квадрат тест працює з категоріальними даними (підрахунками), а не з безперервними вимірюваннями. Кожне спостереження повинно бути незалежним — одна особа не може з'являтися одночасно в двох комірках. Очікувані частоти мають бути не менше 5 у кожній комірці — інакше наближення хі-квадрат стає ненадійним і краще використовувати точний тест Фішера. Кокрен опублікував це правило в 1954 році, і воно залишається стандартом у більшості підручників.
Часті запитання
Як знайти критичне значення за таблицею хі-квадрат?
Знайдіть ваші ступені свободи в лівому стовпці, потім перейдіть до стовпця з потрібним рівнем значущості α. Число на перетині — ваше критичне значення. Якщо статистика χ² з вашого тесту перевищує це число, відхиляєте нульову гіпотезу.
Який рівень значущості обрати?
В академічних дослідженнях стандартом є α = 0.05. Медичні та критичні для безпеки дослідження зазвичай використовують α = 0.01 або навіть α = 0.001. Пошукові дослідження інколи допускають α = 0.10. Вибір залежить від того, який ризиб хибнопозитивного результату ви готові прийняти.
Яка різниця між таблицею хі-квадрат і тестом хі-квадрат?
Таблиця — це довідковий інструмент, який зіставляє df і α з критичними значеннями. Тест — це статистична процедура: збираєте дані, обчислюєте очікувані частоти, підсумовуєте (спостережуване − очікуване)² / очікуване по всіх комірках і порівнюєте результат з таблицею. Таблиця — лінійка, тест — вимірювання.