Як читати таблицю t-розподілу
Першого разу розкладка збиває з пантелику, бо має не один заголовок, а два. Ступені свободи йдуть ліворуч. Стовпці підписані двічі — згори одностороннє α, під ним відповідне двостороннє — бо те саме критичне значення відповідає на два по-різному поставлені питання.
Припустимо, ви провели одновибірковий тест на одинадцяти спостереженнях, тож df = 10. Для 95% довірчого інтервалу потрібен двосторонній стовпець 0,05, і клітинка показує 2,228. Той самий рядок, одностороннє 0,05, дає 1,812. Обидва правильні — який саме навести, вирішує рамка.
Коли використовувати t-розподіл замість z
Чесна відповідь: майже завжди, щойно ви працюєте з реальними даними. z-розподіл припускає, що ви вже знаєте стандартне відхилення популяції, а так буває рідко. Тієї миті, коли ви оцінюєте σ із самої вибірки, ця оцінка несе власну невизначеність — і саме її враховує t-розподіл.
Вільям Госсет розв’язав це 1908 року, працюючи над контролем якості на пивоварні Guinness у Дубліні, і опублікував під псевдонімом «Student», бо роботодавець вважав метод комерційною таємницею. Його задача була точно такою ж, як сучасна: малі вибірки, невідоме σ і потреба знати, наскільки далеко може відхилитися середнє малої партії, перш ніж це щось означатиме.
Практична ознака t-розподілу — важчі хвости. Оцінка σ за небагатьма спостереженнями розширює потрібний запас, і таблиця показує це прямо: при df = 4 95% критичне значення дорівнює 2,776, приблизно в 1,4 раза більше за z = 1,960. Ця різниця — плата за малу вибірку, і вона тане зі зростанням обсягу.
Як t наближається до z
Простежте, як стовпець 95% стискається до 1,960 зі зростанням ступенів свободи. Спершу збіжність швидка, потім ледь повзе.
| df | 95% ДІ (t*) | Перевищення z = 1,960 |
|---|---|---|
| 5 | 2,571 | +31% |
| 10 | 2,228 | +14% |
| 30 | 2,042 | +4% |
| 100 | 1,984 | +1% |
| ∞ (z) | 1,960 | — |
При df = 30 два розподіли вже настільки близькі, що багато підручників переходять на z, а при df = 100 різниця ледь сягає 1%. Саме тому z-таблиця стоїть у низу кожної t-таблиці як рядок df = ∞.
Покроковий приклад
Критичне значення стає зрозумілішим, коли воно вирішує реальне питання. Уявіть лабораторію, що перевіряє, чи змінює нове живильне середовище вихід клітин. Вони засівають п’ятнадцять чашок, тож df = 14, і одновибіркова статистика t виходить 2,50.
Рядок 14, двосторонній стовпець 0,05: критичне значення 2,145. Оскільки 2,50 перевищує 2,145, результат значущий на рівні 5%, і ви відхиляєте нульову гіпотезу про відсутність ефекту. Точне двостороннє p-значення виходить 0,0255 — близько до межі, але з правильного боку.
Цей запас вартий уваги. Якби вибірка була меншою, критичне значення зросло б, і та сама t = 2,50 могла б його не подолати. Щоб виконати обчислення на власних числах, калькулятор t-тесту одразу повертає статистику й p-значення, а калькулятор p-значення переводить будь-яку статистику t в імовірність.
Поширені запитання
Коли використовувати t замість z?
Беріть t щоразу, коли оцінюєте стандартне відхилення з власної вибірки, а не знаєте справжнє значення популяції — так виглядає майже кожне реальне дослідження. z пасує лише до рідкісного випадку, коли σ справді відоме наперед. Зі зростанням вибірки обидва наближаються, тож для дуже великого n вибір перестає мати значення.
Що таке ступені свободи в t-тесті?
Помилка зі ступенями свободи відправляє вас не в той рядок. Одновибірковий чи парний тест використовує df = n − 1. Об’єднаний двовибірковий — n₁ + n₂ − 2, а версія Велча обчислює скоригований, часто нецілий df. Число, яке ви отримуєте, обирає рядок для читання.
Чому для малих вибірок критичне t більше за 1,96?
Бо оцінка σ за жменькою точок сама невизначена, і t-розподіл платить за це важчими хвостами. При df = 4 95% критичне значення дорівнює 2,776, приблизно в 1,4 раза більше за звичне 1,960. Плата найбільша для крихітних вибірок і майже зникає після df = 100.
Як знайти p-значення зі статистики t?
Введіть df і статистику t у поле над таблицею — воно одразу поверне і одностороннє, і двостороннє p-значення. Для орієнтиру: t = 2,50 при df = 14 дає двостороннє p = 0,0255, трохи нижче за поріг 0,05.