Таблиця хі-квадрат — Критичні значення за ступенями свободи

Критичні значення розподілу хі-квадрат — знайдіть значення для будь-якого df та рівня значущості.

df	0.995	0.99	0.975	0.95	0.9	0.1	0.05	0.025	0.01	0.005
1	3.93e-5	1.57e-4	9.82e-4	0.004	0.016	2.706	3.841	5.024	6.635	7.879
2	0.010	0.020	0.051	0.103	0.211	4.605	5.991	7.378	9.210	10.597
3	0.072	0.115	0.216	0.352	0.584	6.251	7.815	9.348	11.345	12.838
4	0.207	0.297	0.484	0.711	1.064	7.779	9.488	11.143	13.277	14.860
5	0.412	0.554	0.831	1.145	1.610	9.236	11.070	12.833	15.086	16.750
6	0.676	0.872	1.237	1.635	2.204	10.645	12.592	14.449	16.812	18.548
7	0.989	1.239	1.690	2.167	2.833	12.017	14.067	16.013	18.475	20.278
8	1.344	1.646	2.180	2.733	3.490	13.362	15.507	17.535	20.090	21.955
9	1.735	2.088	2.700	3.325	4.168	14.684	16.919	19.023	21.666	23.589
10	2.156	2.558	3.247	3.940	4.865	15.987	18.307	20.483	23.209	25.188
11	2.603	3.053	3.816	4.575	5.578	17.275	19.675	21.920	24.725	26.757
12	3.074	3.571	4.404	5.226	6.304	18.549	21.026	23.337	26.217	28.300
13	3.565	4.107	5.009	5.892	7.042	19.812	22.362	24.736	27.688	29.819
14	4.075	4.660	5.629	6.571	7.790	21.064	23.685	26.119	29.141	31.319
15	4.601	5.229	6.262	7.261	8.547	22.307	24.996	27.488	30.578	32.801
16	5.142	5.812	6.908	7.962	9.312	23.542	26.296	28.845	32.000	34.267
17	5.697	6.408	7.564	8.672	10.085	24.769	27.587	30.191	33.409	35.718
18	6.265	7.015	8.231	9.390	10.865	25.989	28.869	31.526	34.805	37.156
19	6.844	7.633	8.907	10.117	11.651	27.204	30.144	32.852	36.191	38.582
20	7.434	8.260	9.591	10.851	12.443	28.412	31.410	34.170	37.566	39.997
21	8.034	8.897	10.283	11.591	13.240	29.615	32.671	35.479	38.932	41.401
22	8.643	9.542	10.982	12.338	14.041	30.813	33.924	36.781	40.289	42.796
23	9.260	10.196	11.689	13.091	14.848	32.007	35.172	38.076	41.638	44.181
24	9.886	10.856	12.401	13.848	15.659	33.196	36.415	39.364	42.980	45.559
25	10.520	11.524	13.120	14.611	16.473	34.382	37.652	40.646	44.314	46.928
26	11.160	12.198	13.844	15.379	17.292	35.563	38.885	41.923	45.642	48.290
27	11.808	12.879	14.573	16.151	18.114	36.741	40.113	43.195	46.963	49.645
28	12.461	13.565	15.308	16.928	18.939	37.916	41.337	44.461	48.278	50.993
29	13.121	14.256	16.047	17.708	19.768	39.087	42.557	45.722	49.588	52.336
30	13.787	14.953	16.791	18.493	20.599	40.256	43.773	46.979	50.892	53.672
40	20.707	22.164	24.433	26.509	29.051	51.805	55.758	59.342	63.691	66.766
50	27.991	29.707	32.357	34.764	37.689	63.167	67.505	71.420	76.154	79.490
60	35.534	37.485	40.482	43.188	46.459	74.397	79.082	83.298	88.379	91.952
70	43.275	45.442	48.758	51.739	55.329	85.527	90.531	95.023	100.43	104.21
80	51.172	53.540	57.153	60.391	64.278	96.578	101.88	106.63	112.33	116.32
90	59.196	61.754	65.647	69.126	73.291	107.57	113.15	118.14	124.12	128.30
100	67.328	70.065	74.222	77.929	82.358	118.50	124.34	129.56	135.81	140.17
150	109.14	112.67	117.98	122.69	128.28	172.58	179.58	185.80	193.21	198.36
200	152.24	156.43	162.73	168.28	174.84	226.02	233.99	241.06	249.45	255.26
300	240.66	245.97	253.91	260.88	269.07	331.79	341.40	349.87	359.91	366.84
500	422.30	429.39	439.94	449.15	459.93	540.93	553.13	563.85	576.49	585.21
1000	888.56	898.91	914.26	927.59	943.13	1057.72	1074.68	1089.53	1106.97	1118.95

Як читати таблицю хі-квадрат

У лівому стовпці розташовані ступені свободи (df). Кожен заголовок стовпця вгорі — це рівень значущості α (ймовірність правого хвоста). Число на перетині рядка та стовпця — критичне значення, яке повинна перевищити ваша хі-квадрат статистика, щоб відхилити нульову гіпотезу на цьому рівні значущості.

Наприклад, ви провели тест на відповідність з 5 категоріями, тобто df = 4, і хочете перевірити на рівні α = 0.05. Знайдіть рядок 4 і стовпець 0.05 — на перетині буде 9.488. Якщо ваше χ² перевищує 9.488, дані дають достатньо підстав відхилити нульову гіпотезу на рівні 5%. Карл Пірсон запропонував цей тест у 1900 році, і з того часу ця таблиця є невід'ємною частиною курсів статистики.

Коли використовується розподіл хі-квадрат

Розподіл хі-квадрат зустрічається у трьох основних контекстах. Тест на відповідність перевіряє, чи збігаються спостережувані частоти з гіпотетичним розподілом — df дорівнює кількості категорій мінус один. Тест незалежності з'ясовує, чи пов'язані дві категоріальні змінні в таблиці спряженості — df дорівнює (рядки − 1) × (стовпці − 1). Тест дисперсії порівнює вибіркову дисперсію з гіпотетичною популяційною — df дорівнює n − 1.

Припущення тесту

Хі-квадрат тест працює з категоріальними даними (підрахунками), а не з безперервними вимірюваннями. Кожне спостереження повинно бути незалежним — одна особа не може з'являтися одночасно в двох комірках. Очікувані частоти мають бути не менше 5 у кожній комірці — інакше наближення хі-квадрат стає ненадійним і краще використовувати точний тест Фішера. Кокрен опублікував це правило в 1954 році, і воно залишається стандартом у більшості підручників.

Поширені критичні значення

Наведена нижче таблиця охоплює комбінації ступенів свободи та рівнів значущості, які зустрічаються в переважній більшості наукових досліджень. Для df понад 30 використовуйте інтерактивну таблицю вгорі сторінки.

df	α = 0.10	α = 0.05	α = 0.01
1	2.706	3.841	6.635
2	4.605	5.991	9.210
3	6.251	7.815	11.345
4	7.779	9.488	13.277
5	9.236	11.070	15.086
6	10.645	12.592	16.812
7	12.017	14.067	18.475
8	13.362	15.507	20.090
9	14.684	16.919	21.666
10	15.987	18.307	23.209
12	18.549	21.026	26.217
15	22.307	24.996	30.578
20	28.412	31.410	37.566
25	34.382	37.652	44.314
30	40.256	43.773	50.892

Критичні значення зростають разом зі ступенями свободи, бо розподіл вищої розмірності потребує більшого χ², щоб досягти тієї самої ймовірності хвоста. При df = 1 значення 3.841 відповідає 95-му перцентилю, а при df = 30 той самий поріг становить 43.773. Різниця між α = 0.05 і α = 0.01 звужується зі зростанням df — розподіл наближається до нормального при великих ступенях свободи.

Повний приклад: від даних до висновку

Критичне значення стає зрозумілішим, коли воно вирішує реальне питання. Уявіть, що дослідник ринку опитує 400 покупців і записує, якому з п'яти брендів кожен віддає перевагу. Нульова гіпотеза проста: усі п'ять брендів однаково популярні, тож від кожного очікується по 80 виборів.

Підрахунки виходять нерівними — 90, 60, 104, 95 і 51. Статистика хі-квадрат вимірює, наскільки далеко цей розподіл відхиляється від рівних 80, підсумовуючи (спостережуване − очікуване)² / очікуване по всіх п'яти категоріях, і дає 26.775. Найбільший внесок робить один бренд: 51 вибір замість очікуваних 80 додає 10.51 окремо, тобто майже 40% усієї статистики.

П'ять категорій фіксують ступені свободи на df = 4, адже останній підрахунок визначається, щойно відомі інші чотири та загальна сума 400. Це веде вас до рядка 4 таблиці. На рівні α = 0.05 критичне значення дорівнює 9.488, і 26.775 перевищує його із запасом, тож бренди не однаково популярні, і нульову гіпотезу відхиляють на рівні 5%.

Воно долає й суворіші пороги: 13.277 на рівні α = 0.01 і навіть 18.467 на рівні α = 0.001. Саме це останнє порівняння пояснює, чому програми позначають результат як p < 0.001, а не як межовий — точне p-значення виходить близько 0.00002. Щоб виконати обчислення на власних даних замість зчитування порогів із таблиці, калькулятор хі-квадрат тесту робить кожен крок і одразу повертає статистику.

Критичні значення для великих ступенів свободи (df > 100)

Друковані таблиці зупиняються на df = 30 чи df = 100, бо закінчується папір, а не розподіл. Реальні пошуки йдуть значно далі: тести дисперсії на великих вибірках, порівняння моделей за логарифмом правдоподібності, таблиці спряженості з робочих даних. Інтерактивна таблиця вище містить точні рядки до df = 1000, а поле швидкого пошуку обчислює значення для будь-якого df до 10 000.

Два приклади просто з таблиці: при df = 337 критичне значення для α = 0.05 дорівнює 380.809, а при α = 0.01 зростає до 400.319. При df = 1423 і α = 0.05 — 1511.872. Ці числа отримані чисельним оберненням CDF хі-квадрат, без наближень — те саме обчислення, що виконує статистичний пакет.

Класичний обхідний шлях для великих df — наближення Вілсона–Гілферті, опубліковане 1931 року: χ²_α ≈ df · (1 − 2/(9df) + z_α·√(2/(9df)))³.

У порівнянні з точними значеннями воно тримається в межах двох десяткових знаків скрізь за df = 100 — саме ця точність тримала формулу в підручниках майже століття. Сьогодні вона потрібна хіба тоді, коли під рукою лише нормальна таблиця й олівець.

Часті запитання

Як знайти критичне значення за таблицею хі-квадрат?

Знайдіть ваші ступені свободи в лівому стовпці, потім перейдіть до стовпця з потрібним рівнем значущості α. Число на перетині — ваше критичне значення. Якщо статистика χ² з вашого тесту перевищує це число, відхиляєте нульову гіпотезу.

Який рівень значущості обрати?

В академічних дослідженнях стандартом є α = 0.05. Медичні та критичні для безпеки дослідження зазвичай використовують α = 0.01 або навіть α = 0.001. Пошукові дослідження інколи допускають α = 0.10. Вибір залежить від того, який ризик хибнопозитивного результату ви готові прийняти.

Яка різниця між таблицею хі-квадрат і тестом хі-квадрат?

Таблиця — це довідковий інструмент, який зіставляє df і α з критичними значеннями. Тест — це статистична процедура: збираєте дані, обчислюєте очікувані частоти, підсумовуєте (спостережуване − очікуване)² / очікуване по всіх комірках і порівнюєте результат з таблицею. Таблиця — лінійка, тест — вимірювання.

Що таке ступені свободи в тесті хі-квадрат?

Неправильне обчислення ступенів свободи — це найшвидший спосіб використати не той рядок таблиці і отримати хибний висновок.

Для тесту на відповідність з k категоріями df = k − 1. Для таблиці спряженості r × c df = (r − 1)(c − 1). Логіка однакова в обох випадках: коли знаєш усі значення, крім одного, і загальну суму — останнє значення визначається автоматично, тому воно не є «вільним».

Чому друковані таблиці хі-квадрат зупиняються на df = 100?

Навіть таблиця 10×10 дає лише df = 81, а при df ≈ 30 і вище розподіл настільки наближається до нормального, що статистики паперової доби обирали наближення замість додаткових сторінок.

Тут такого обмеження немає: інтерактивна таблиця містить точні рядки до df = 1000, а поле швидкого пошуку миттєво обчислює точне критичне значення для будь-якого df до 10 000.

Як знайти критичне значення для df = 337 (чи будь-якого великого df)?

Введіть 337 у поле швидкого пошуку над таблицею — воно поверне 380.809 для α = 0.05 і 400.319 для α = 0.01, обчислені точно, без наближень.

Такі запити зазвичай породжують тести дисперсії чи порівняння моделей на великих вибірках, де df припадає на значення, яких не покриває жодна друкована таблиця. Будь-який df до 10 000 працює так само.

Тест хі-квадрат однобічний чи двобічний?

У тестах на відповідність і незалежність ви дивитесь лише на правий хвіст, тож пошук фактично однобічний — і це дивує багатьох, адже самі гіпотези звучать двобічно.

Причина суто механічна: піднесення (спостережуване − очікуване) до квадрата стирає напрямок кожної різниці, тому відхилення в будь-який бік штовхає χ² угору, а не вниз. Велика статистика означає лише «далеко від очікуваного», і єдине критичне значення, з яким ви порівнюєте, — верхнє в таблиці.

Таблиця розподілу хі-квадрат

Як читати таблицю хі-квадрат

Коли використовується розподіл хі-квадрат

Припущення тесту

Поширені критичні значення

Повний приклад: від даних до висновку

Критичні значення для великих ступенів свободи (df > 100)

Часті запитання

Пов'язані калькулятори

Калькулятор хі-квадрат тесту

Калькулятор P-значення

Калькулятор T-тесту

Таблиця Z-оцінок

Таблиця t-розподілу