Довірчі інтервали та їх застосування. Довірчий інтервал для оцінки середнього (дисперсія відома) у EXCEL Довірчий інтервал для середнього

Довірчий інтервал для математичного очікування - це такий обчислений за даними інтервал, який з певною ймовірністю містить математичне очікування генеральної сукупності. Природною оцінкою математичного очікування є середнє арифметичне її спостережених значень. Тому далі протягом уроку ми користуватимемося термінами "середнє", "середнє значення". У завданнях розрахунку довірчого інтервалу найчастіше потрібна відповідь типу "Довірний інтервал середнього числа [величина у конкретній задачі] знаходиться від [менше значення] до [велике значення]". З допомогою довірчого інтервалу можна оцінювати як середні значення, а й питому вагу тієї чи іншої ознаки генеральної сукупності. Середні значення, дисперсія, стандартне відхилення та похибка, через які ми будемо приходити до нових визначень та формул, розібрані на уроці Характеристики вибірки та генеральної сукупності .

Точкова та інтервальна оцінки середнього значення

Якщо середнє значення генеральної сукупності оцінюється числом (точкою), то оцінку невідомої середньої величиниГенеральної сукупності приймається конкретне середнє, яке розраховане на вибірку спостережень. У разі значення середнього вибірки - випадкової величини - не збігається із середнім значенням генеральної сукупності. Тому, вказуючи середнє значення вибірки, одночасно потрібно вказувати помилку вибірки. В якості міри помилки вибірки використовується стандартна помилка, яка виражена в тих самих одиницях вимірювання, що і середнє. Тому найчастіше використовується наступний запис: .

Якщо оцінку середнього потрібно пов'язати з певною ймовірністю, то параметр генеральної сукупності, що цікавить, потрібно оцінювати не одним числом, а інтервалом. Довірчим інтервалом називають інтервал, у якому з певною ймовірністю Pперебуває значення оцінюваного показника генеральної сукупності. Довірчий інтервал, у якому із ймовірністю P = 1 - α знаходиться випадкова величина , розраховується так:

,

α = 1 - P, яке можна знайти у додатку до практично будь-якої книги зі статистики.

Насправді середнє значення генеральної сукупності і дисперсія не відомі, тому дисперсія генеральної сукупності замінюється дисперсією вибірки , а середнє генеральної сукупності - середнім значенням вибірки . Таким чином, довірчий інтервал у більшості випадків розраховується так:

.

Формулу довірчого інтервалу можна використовувати для оцінки середньої генеральної сукупності, якщо

  • відоме стандартне відхилення генеральної сукупності;
  • або стандартне відхилення генеральної сукупності не відоме, але обсяг вибірки – більше 30.

Середнє значення вибірки є незміщеною оцінкою середньої генеральної сукупності. У свою чергу, дисперсія вибірки не є незміщеною оцінкою дисперсії генеральної сукупності. Для отримання незміщеної оцінки дисперсії генеральної сукупності у формулі дисперсії вибірки обсяг вибірки nслід замінити на n-1.

приклад 1.Зібрано інформацію зі 100 випадково обраних кафе в деякому місті про те, що середня кількість працівників у них становить 10,5 зі стандартним відхиленням 4,6. Визначити довірчий інтервал 95% від кількості працівників кафе.

де - критичне значення стандартного нормального розподілу для рівня значущості α = 0,05 .

Таким чином, довірчий інтервал 95% середньої кількості працівників кафе становив від 9,6 до 11,4.

приклад 2.Для випадкової вибірки з генеральної сукупності з 64 спостережень обчислено такі сумарні величини:

сума значень у спостереженнях,

сума квадратів відхилення значень від середнього .

Обчислити довірчий інтервал 95% для математичного очікування.

обчислимо стандартне відхилення:

,

обчислимо середнє значення:

.

Підставляємо значення вираз для довірчого інтервалу:

де - критичне значення стандартного нормального розподілу для рівня значущості α = 0,05 .

Отримуємо:

Таким чином, довірчий інтервал 95% для математичного очікування цієї вибірки становив від 7,484 до 11,266.

Приклад 3.Для випадкової вибірки з генеральної сукупності зі 100 спостережень обчислено середнє значення 15,2 та стандартне відхилення 3,2. Обчислити довірчий інтервал 95% для математичного очікування, потім довірчий інтервал 99%. Якщо потужність вибірки та її варіація залишаються незмінними, а чи збільшується довірчий коефіцієнт, то довірчий інтервал звузиться чи розшириться?

Підставляємо дані значення у вираз для довірчого інтервалу:

де - критичне значення стандартного нормального розподілу для рівня значущості α = 0,05 .

Отримуємо:

.

Таким чином, довірчий інтервал 95% для середньої даної вибірки становив від 14,57 до 15,82.

Знову підставляємо дані значення вираз для довірчого інтервалу:

де - критичне значення стандартного нормального розподілу для рівня значущості α = 0,01 .

Отримуємо:

.

Таким чином, довірчий інтервал 99% для середньої даної вибірки становив від 14,37 до 16,02.

Як бачимо, при збільшенні довірчого коефіцієнта збільшується також критичне значення стандартного нормального розподілу, а отже початкова і кінцева точки інтервалу розташовані далі від середнього, і, таким чином, довірчий інтервал для математичного очікування збільшується.

Точкова та інтервальна оцінки питомої ваги

Питома вага деякої ознаки вибірки можна інтерпретувати як точкову оцінку питомої ваги pцієї ж ознаки у генеральній сукупності. Якщо ж цю величину потрібно пов'язати з ймовірністю, слід розрахувати довірчий інтервал питомої ваги pознаки в генеральній сукупності з ймовірністю P = 1 - α :

.

Приклад 4.У деякому місті два кандидати Aі Bпретендують на посаду мера Випадковим чином було опитано 200 жителів міста, з яких 46% відповіли, що голосуватимуть за кандидата A, 26% – за кандидата Bта 28% не знають, за кого голосуватимуть. Визначити довірчий інтервал 95% для частки жителів міста, які підтримують кандидата A.

У попередніх підрозділах ми розглянули питання оцінки невідомого параметра аодним числом. Така оцінка називається "точковою". У ряді завдань потрібно не тільки знайти параметр авідповідне чисельне значення, а й оцінити його точність та надійність. Потрібно знати, до яких помилок може призвести заміна параметра айого точковою оцінкою аі з яким ступенем упевненості очікується, що ці помилки не вийдуть за відомі межі?

Такі завдання особливо актуальні при малій кількості спостережень, коли точкова оцінка а взначною мірою випадкова і наближена заміна а на може призвести до серйозних помилок.

Щоб дати уявлення про точність та надійність оцінки а,

у математичній статистиці користуються так званими довірчими інтервалами та довірчими ймовірностями.

Нехай для параметра аотримана з досвіду незміщена оцінка а.Ми хочемо оцінити можливу помилку. Призначимо деяку досить велику ймовірність р (наприклад, р = 0,9, 0,95 або 0,99) таку, що подію з ймовірністю р можна вважати практично достовірною, і знайдемо таке значення s, для якого

Тоді діапазон практично можливих значеньпомилки, що виникає під час заміни ана абуде ± s; великі за абсолютною величиною помилки з'являтимуться лише з малою ймовірністю а = 1 - р. Перепишемо (14.3.1) у вигляді:

Рівність (14.3.2) означає, що з ймовірністю р невідоме значення параметра апотрапляє до інтервалу

При цьому слід зазначити одну обставину. Раніше ми неодноразово розглядали можливість потрапляння випадкової величини в заданий невипадковий інтервал. Тут справа інакша: величина ане випадкова, зате випадковий інтервал/р. Випадковим є його положення на осі абсцис, що визначається його центром а; випадкова взагалі і довжина інтервалу 2s, так як величина s обчислюється, як правило, за дослідними даними. Тому в даному випадку краще буде тлумачити величину р не як ймовірність «попадання» точки ав інтервал/р, а як ймовірність того, що випадковий інтервал/р накриє точку а(Рис. 14.3.1).

Рис. 14.3.1

Імовірність р прийнято називати довірчою ймовірністю, а інтервал/р - довірчим інтервалом.Межі інтервалу If. а х = а- s та а 2 = а +а називаються довірчими межами.

Дамо ще одне тлумачення поняттю довірчого інтервалу: його можна як інтервал значень параметра а,сумісних з досвідченими даними та не суперечать їм. Дійсно, якщо умовитися вважати подію з ймовірністю а = 1-р практично неможливим, то значення параметра а, для яких а - а> s, слід визнати такими, що суперечать досвідченим даним, а ті, для яких |а - а a t na 2 .

Нехай для параметра ає незміщена оцінка а.Якби нам був відомий закон розподілу величини а, Завдання знаходження довірчого інтервалу була б дуже проста: достатньо було б знайти таке значення s, для якого

Труднощі полягає в тому, що закон розподілу оцінки азалежить від закону розподілу величини Xі, отже, від його невідомих параметрів (зокрема, і від параметра а).

Щоб обійти цю труднощі, можна застосувати наступний грубо наближений прийом: замінити у виразі для невідомі параметри їх точковими оцінками. При порівняно великій кількості дослідів п(близько 20...30) цей прийом зазвичай дає задовільні за точністю результати.

Як приклад розглянемо завдання про довірчий інтервал для математичного очікування.

Нехай зроблено п X,характеристики якої - математичне очікування тта дисперсія D- Невідомі. Для цих параметрів отримано оцінки:

Потрібно побудувати довірчий інтервал/р, що відповідає довірчій ймовірності р, для математичного очікування твеличини X.

При вирішенні цього завдання скористаємося тим, що величина тявляє собою суму пнезалежних однаково розподілених випадкових величин X hі відповідно до центральної граничної теореми за досить великого пїї закон розподілу близький до нормального. Насправді навіть за відносно невеликій кількості доданків (близько 10...20) закон розподілу суми можна приблизно вважати нормальним. Виходитимемо з того, що величина трозподілено за нормальним законом. Характеристики цього закону – математичне очікування та дисперсія – рівні відповідно ті

(Див. розділ 13 підрозділ 13.3). Припустимо, що величина Dнам відома і знайдемо таку величину Ер, для якої

Застосовуючи формулу (6.3.5) глави 6, виразимо ймовірність у лівій частині (14.3.5) через нормальну функцію розподілу

де - середнє квадратичне відхилення оцінки т.е.

З рівняння

знаходимо значення Sp:

де arg Ф * (х) - функція, обернена Ф * (х),тобто. таке значення аргументу, при якому нормальна функція розподілу дорівнює х.

Дисперсія D,через яку виражена величина а 1П, нам точно не відома; як її орієнтовне значення можна скористатися оцінкою D(14.3.4) та покласти приблизно:

Таким чином, наближено вирішено завдання побудови довірчого інтервалу, який дорівнює:

де gp визначається формулою (14.3.7).

Щоб уникнути при обчисленні s p зворотного інтерполювання у таблицях функції Ф*(л), зручно скласти спеціальну таблицю (табл. 14.3.1), де наводяться значення величини

залежно від нар. Величина (р визначає для нормального закону число середніх квадратичних відхилень, яке потрібно відкласти праворуч і ліворуч від центру розсіювання для того, щоб ймовірність попадання в отриману ділянку дорівнювала р.).

Через величину 7 р довірчий інтервал виражається у вигляді:

Таблиця 14.3.1

Приклад 1. Проведено 20 дослідів над величиною X;результати наведено у табл. 14.3.2.

Таблиця 14.3.2

Потрібно знайти оцінку для математичного очікування від величини Xта побудувати довірчий інтервал, що відповідає довірчій ймовірності р = 0,8.

Рішення.Маємо:

Вибравши за початок відліку л: = 10, за третьою формулою (14.2.14) знаходимо незміщену оцінку D :

За табл. 14.3,1 знаходимо

Довірчі межі:

Довірчий інтервал:

Значення параметра т,лежать у цьому інтервалі, є сумісними з досвідченими даними, наведеними в табл. 14.3.2.

Аналогічним способом може бути побудований довірчий інтервал для дисперсії.

Нехай зроблено пнезалежних дослідів над випадковою величиною Xз невідомими параметрами від Л і для дисперсії Dотримано незміщену оцінку:

Потрібно приблизно побудувати довірчий інтервал для дисперсії.

З формули (14.3.11) видно, що величина Dявляє собою

суму пвипадкових величин виду. Ці величини не є

незалежними, тому що до будь-якої з них входить величина т,залежить від решти. Однак, можна показати, що при збільшенні пзакон розподілу їхньої суми теж наближається до нормального. Практично при п= 20...30 він може вважатися нормальним.

Припустимо, що це, і знайдемо характеристики цього закону: математичне очікування і дисперсію. Оскільки оцінка D- незміщена, то М [D] = D.

Обчислення дисперсії D Dпов'язано з порівняно складними викладками, тому наведемо її вираз без висновку:

де ц 4 - четвертий центральний момент величини X.

Щоб скористатися цим виразом, потрібно підставити значення ц 4 і D(хоча б наближені). Замість Dможна скористатися його оцінкою D.У принципі четвертий центральний момент теж можна замінити його оцінкою, наприклад, величиною виду:

але така заміна дасть вкрай невисоку точність, тому що взагалі при обмеженій кількості дослідів моменти високого порядку визначаються з більшими помилками. Проте практично часто буває, що вид закону розподілу величини Xвідомий наперед: невідомі лише його параметри. Тоді можна спробувати виразити ц 4 через D.

Візьмемо випадок, що найбільш часто зустрічається, коли величина Xрозподілено за нормальним законом. Тоді її четвертий центральний момент виражається через дисперсію (див. Розділ 6 підрозділ 6.2);

та формула (14.3.12) дає або

Замінюючи на (14.3.14) невідоме Dйого оцінкою D, отримаємо: звідки

Момент ц 4 можна виразити через Dтакож і в деяких інших випадках, коли розподіл величини Xперестав бути нормальним, але його відомий. Наприклад, для закону рівномірної щільності (див. розділ 5) маємо:

де (а, Р) - інтервал, у якому заданий закон.

Отже,

За формулою (14.3.12) отримаємо: звідки знаходимо приблизно

У випадках, коли вид закону розподілу величини 26 невідомий, при орієнтовній оцінці величини а/) рекомендується все ж таки користуватися формулою (14.3.16), якщо немає спеціальних підстав вважати, що цей закон сильно відрізняється від нормального (має помітний позитивний або негативний ексцес) .

Якщо орієнтовне значення а/) тим чи іншим способом отримано, можна побудувати довірчий інтервал для дисперсії аналогічно тому, як ми будували його для математичного очікування:

де величина в залежності від заданої ймовірності р знаходиться за табл. 14.3.1.

Приклад 2. Знайти приблизно 80% довірчий інтервал для дисперсії випадкової величини Xв умовах прикладу 1, якщо відомо, що величина Xрозподілено за законом, близьким до нормального.

Рішення.Розмір залишається тієї ж, що у табл. 14.3.1:

За формулою (14.3.16)

За формулою (14.3.18) знаходимо довірчий інтервал:

Відповідний інтервал значень середнього квадратичного відхилення: (0,21; 0,29).

14.4. Точні методи побудови довірчих інтервалів для параметрів випадкової величини, розподіленої за нормальним законом

У попередньому підрозділі ми розглянули грубо наближені методи побудови довірчих інтервалів для математичного очікування та дисперсії. Тут ми дамо уявлення про точні методи вирішення того ж завдання. Підкреслимо, що для точного знаходження довірчих інтервалів необхідно знати заздалегідь вид закону розподілу величини X,тоді як застосування наближених методів це обов'язково.

Ідея точних методів побудови довірчих інтервалів зводиться до наступного. Будь-який довірчий інтервал перебуває з умови, що виражає ймовірність виконання деяких нерівностей, до яких входить цікава для нас оцінка а.Закон розподілу оцінки ау випадку залежить від невідомих параметрів величини X.Однак іноді вдається перейти в нерівності від випадкової величини адо будь-якої іншої функції спостережених значень Х п Х 2 , ..., X п.закон розподілу якої не залежить від невідомих параметрів, а залежить тільки від кількості дослідів та від виду закону розподілу величини X.Такі випадкові величини грають велику роль математичної статистики; вони найбільш докладно вивчені для випадку нормального розподілу величини X.

Наприклад, доведено, що з нормальному розподілі величини Xвипадкова величина

підкоряється так званому закону розподілу Ст'юдентаз п- 1 ступенями свободи; щільність цього закону має вигляд

де Г(х) - відома гамма-функція:

Доведено також, що випадкова величина

має «розподіл %2» з п- 1 ступенями свободи (див. розділ 7), щільність якого виражається формулою

Не зупиняючись на висновках розподілів (14.4.2) та (14.4.4), покажемо, як їх можна застосувати при побудові довірчих інтервалів для параметрів ти D .

Нехай зроблено пнезалежних дослідів над випадковою величиною X,розподіленої за нормальним законом із невідомими параметрами тіо.Для цих параметрів отримано оцінки

Потрібно побудувати довірчі інтервали для обох параметрів, що відповідають довірчій ймовірності.

Побудуємо спочатку довірчий інтервал для математичного очікування. Звичайно цей інтервал взяти симетричним відносно т; позначимо s p половину довжини інтервалу. Величину s p потрібно вибрати так, щоб виконувалася умова

Спробуємо перейти до лівої частини рівності (14.4.5) від випадкової величини тдо випадкової величини Т,розподіленої згідно із законом Стьюдента. І тому помножимо обидві частини нерівності |m-w?|

на позитивну величину: або, користуючись позначенням (14.4.1),

Знайдемо таке число/р, що Величина/р знайдеться з умови

З формули (14.4.2) видно, що (1) – парна функція, тому (14.4.8) дає

Рівність (14.4.9) визначає величину/р залежно від р. Якщо мати у своєму розпорядженні таблицю значень інтеграла

то величину/р можна знайти зворотним інтерполюванням у таблиці. Проте зручніше скласти заздалегідь таблицю значень/р. Така таблиця дається у додатку (табл. 5). У цій таблиці наведено значення залежно від довірчої ймовірності р і числа ступенів свободи п- 1. Визначивши/р за табл. 5 і вважаючи

ми знайдемо половину ширини довірчого інтервалу/р і сам інтервал

Приклад 1. Зроблено 5 незалежних дослідів над випадковою величиною X,розподіленої нормально з невідомими параметрами тта о. Результати дослідів наведено у табл. 14.4.1.

Таблиця 14.4.1

Знайти оцінку тдля математичного очікування і побудувати для нього 90%-й довірчий інтервал/р (тобто інтервал, що відповідає довірчій ймовірності р=0,9).

Рішення.Маємо:

За таблицею 5 додатки для п - 1 = 4 і р = 0,9 знаходимо звідки

Довірчий інтервал буде

Приклад 2 Для умов прикладу 1 підрозділу 14.3, припускаючи величину Xрозподілений нормально, знайти точний довірчий інтервал.

Рішення.За таблицею 5 програми знаходимо при п - 1 = 19ір =

0,8/р = 1,328; звідси

Порівнюючи з рішенням прикладу 1 підрозділу 14.3 (е р = 0,072), переконуємося, що розбіжність дуже незначна. Якщо зберегти точність до другого знака після коми, то довірчі інтервали, знайдені точним та наближеним методами, збігаються:

Перейдемо до побудови довірчого інтервалу дисперсії. Розглянемо незміщену оцінку дисперсії

і висловимо випадкову величину Dчерез величину V(14.4.3), що має розподіл х 2 (14.4.4):

Знаючи закон розподілу величини V,можна знайти інтервал / (1, в який вона потрапляє із заданою ймовірністю р.).

Закон розподілу k n _ x (v)величини I 7 має вигляд, зображений на рис. 14.4.1.

Рис. 14.4.1

Виникає питання: як вибрати інтервал/р? Якби закон розподілу величини Vбув симетричним (як нормальний закон або розподіл Стьюдента), звичайно було б взяти інтервал /р симетричним щодо математичного очікування. В даному випадку закон до п _ х (v)несиметричний. Умовимося вибирати інтервал /р так, щоб ймовірність виходу величини Vза межі інтервалу вправо та вліво (заштриховані площі на рис. 14.4.1) були однакові та рівні

Щоб побудувати інтервал/р з такою властивістю, скористаємось табл. 4 додатки: у ній наведені числа у)такі, що

для величини V,що має х 2 -розподіл із г ступенями свободи. У нашому випадку г = п- 1. Зафіксуємо г = п- 1 і знайдемо у відповідному рядку табл. 4 два значення х 2 -одне, що відповідає ймовірності інше - ймовірності Позначимо ці

значення у 2і xl?Інтервал має у 2 ,своїм лівим, а у ~правим кінцем.

Тепер знайдемо по інтервалу / р шуканий довірчий інтервал /|, для дисперсії з межами D, та D 2який накриває крапку Dз ймовірністю р:

Побудуємо такий інтервал /(, = (?> ь А), який накриває точку Dтоді і лише тоді, коли величина Vпотрапляє в інтервал/р. Покажемо, що інтервал

задовольняє цій умові. Справді, нерівності рівносильні нерівностям

а ці нерівності виконуються з ймовірністю р. Таким чином, довірчий інтервал дисперсії знайдено і виражається формулою (14.4.13).

Приклад 3. Знайти довірчий інтервал дисперсії в умовах прикладу 2 підрозділу 14.3, якщо відомо, що величина Xрозподілено нормально.

Рішення.Маємо . За таблицею 4 додатки

знаходимо при г = п - 1 = 19

За формулою (14.4.13) знаходимо довірчий інтервал для дисперсії

Відповідний інтервал для середнього відхилення квадратичного: (0,21; 0,32). Цей інтервал лише трохи перевищує отриманий прикладі 2 підрозділу 14.3 наближеним шляхом інтервал (0,21; 0,29).

  • На малюнку 14.3.1 розглядається довірчий інтервал, симетричний щодо а. Взагалі, як побачимо далі, це необов'язково.

Імовірність того, що справжнє значення вимірюваної величини лежить усередині деякого інтервалу, називається довірчою ймовірністю , або коефіцієнтом надійності, а сам інтервал - довірчим інтервалом.

Кожній вірогідності відповідає свій довірчий інтервал. Зокрема, вірогідності 0,67 відповідає довірчий інтервал від до . Однак це твердження справедливе лише за достатньо великої кількості вимірювань (більше 10), та й ймовірність 0,67 не є достатньо надійною - приблизно в кожній із трьох серій вимірювань yможе бути поза довірчого інтервалу. Для отримання більшої впевненості в тому, що значення вимірюваної величини лежать усередині довірчого інтервалу, зазвичай задаються вірогідністю 0,95 - 0,99. Довірчий інтервал для заданої довірчої ймовірності з урахуванням впливу кількості вимірювань nможна знайти, помноживши стандартне відхилення середнього арифметичного

.

так званий коефіцієнт Стьюдента. Коефіцієнти Стьюдента для низки значень та nнаведено у таблиці.

Таблиця - Коефіцієнти Стьюдента

Число вимірів n Довірча ймовірність y
0,67 0,90 0,95 0,99
2,0 6,3 12,7 63,7
1,3 2,4 3,2 5,8
1,2 2,1 2,8 4,6
1,2 2,0 2,6 4,0
1,1 1,8 2,3 3,3
1,0 1,7 2,0 2,6

Остаточно, для вимірюваної величини yпри заданій довірчій ймовірності y та числі вимірювань nвиходить умова

Величину ми називатимемо випадковою похибкою величини y.

Приклад: див. лекцію №5 – ряд чисел.

Визначимо

При числі вимірів – 45 і довірчої ймовірності – 0,95 отримаємо, що коефіцієнт Стьюдента приблизно дорівнює 2,15. Тоді довірчий інтервал для цього ряду вимірювань дорівнює 62,6.

Промахи (груба похибка) -грубі похибки, пов'язані з помилками оператора або неврахованими зовнішніми впливами. Їх зазвичай виключають із результатів вимірювань. Промахи, зазвичай, викликаються неуважністю. Вони можуть також виникати внаслідок несправності приладу.

Для переважної більшості простих вимірів досить добре виконується так званий нормальний закон випадкових похибок ( закон Гауса)виведений з наступних емпіричних положень.

1) похибки вимірювань можуть набувати безперервного ряду значень;

2) при великій кількості вимірів похибки однакової величини, але різного знака зустрічаються однаково часто,

3) чим більша величина випадкової похибки, тим менша ймовірність її появи.

Графік нормального закону розподілу Гаус представлений на рис.1. Рівняння кривої має вигляд

де - Функція розподілу випадкових помилок (похибок), що характеризує ймовірність появи помилки, σ - Середня квадратична помилка.

Величина σ не є випадковою величиною та характеризує процес вимірювань. Якщо умови вимірювань не змінюються, то залишається постійною величиною. Квадрат цієї величини називають дисперсією вимірів.Чим менша дисперсія, тим менший розкид окремих значень і тим вища точність вимірів.

Точне значення середньої квадратичної помилки, як і справжнє значення вимірюваної величини, невідоме. Існує так звана статистична оцінка цього параметра, відповідно до якої середня квадратична помилка дорівнює середньої квадратичної помилки середнього арифметичного. Величина якої визначається за формулою

де - результат i-го виміру; - середнє арифметичне отриманих значень; n- Число вимірювань.

Чим більша кількість вимірів, тим менше і тим більше воно наближається до σ. Якщо справжнє значення вимірюваної величини μ, її середнє арифметичне значення, отримане в результаті вимірювань , а абсолютна випадкова похибка , то результат вимірювань запишеться у вигляді .

Інтервал значень від до , куди потрапляє справжнє значення вимірюваної величини μ, називається довірчим інтервалом.Оскільки є випадковою величиною, то справжнє значення потрапляє у довірчий інтервал із ймовірністю α, яка називається довірчою ймовірністю,або надійністювимірів. Ця величина чисельно дорівнює площі заштрихованої криволінійної трапеції. (Див. мал.)

Все це справедливо для досить великої кількості вимірів, коли близька до σ. Для пошуку довірчого інтервалу та довірчої ймовірності при невеликій кількості вимірювань, з яким ми маємо справу в ході виконання лабораторних робіт, використовується розподіл ймовірностей Стьюдента.Це розподіл ймовірностей випадкової величини коефіцієнтом Стьюдентадає значення довірчого інтервалу в частках середньої квадратичної помилки середнього арифметичного.


Розподіл ймовірностей цієї величини не залежить від σ 2 , а суттєво залежить від кількості дослідів n.Зі збільшенням кількості дослідів nРозподіл Стьюдента прагне розподілу Гауса.

Функція розподілу табульована (табл.1). Значення коефіцієнта Стьюдента знаходиться на перетині рядка, що відповідає числу вимірювань n, і стовпця, що відповідає довірчій ймовірності α

Довірчі інтервали ( англ. Confidence Intervals) однією з типів інтервальних оцінок які у статистиці, які розраховуються для заданого рівня значимості. Вони дозволяють зробити твердження, що справжнє значення невідомого статистичного параметра генеральної сукупності знаходиться в діапазоні значень з ймовірністю, яка задана обраним рівнем статистичної значущості.

Нормальний розподіл

Коли відома варіація (σ 2) генеральної сукупності даних, для розрахунку довірчих меж (граничних точок довірчого інтервалу) може бути використана z-оцінка. Порівняно із застосуванням t-розподілу, використання z-оцінки дозволить побудувати не лише вужчий довірчий інтервал, але й отримати більш надійні оцінки математичного очікування та середньоквадратичного (стандартного) відхилення (σ), оскільки Z-оцінка ґрунтується на нормальному розподілі.

Формула

Для визначення граничних точок довірчого інтервалу, за умови, що відомо середньоквадратичне відхилення генеральної сукупності даних, використовується така формула

L = X - Z α/2 σ
√n

Приклад

Припустимо, що розмір вибірки налічує 25 спостережень, математичне очікування вибірки дорівнює 15, а середньоквадратичне відхилення генеральної сукупності становить 8. Для рівня значущості α=5% Z оцінка дорівнює Z α/2 =1,96. У цьому випадку нижня та верхня межа довірчого інтервалу становитимуть

L = 15 – 1,96 8 = 11,864
√25
L = 15+1,96 8 = 18,136
√25

Таким чином, ми можемо стверджувати, що з ймовірністю 95% математичного очікування генеральної сукупності потрапить у діапазон від 11,864 до 18,136.

Методи звуження довірчого інтервалу

Припустимо, що діапазон є надто широким для цілей нашого дослідження. Зменшити діапазон довірчого інтервалу можна двома способами.

  1. Зменшити рівень статистичної значущості α.
  2. Збільшити обсяг вибірки.

Зменшивши рівень статистичної значущості до α=10%, ми отримаємо Z-оцінку рівну Z α/2 =1,64. У цьому випадку нижня та верхня межа інтервалу становитимуть

L = 15 – 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

А сам довірчий інтервал може бути записаний у вигляді

У цьому випадку ми можемо зробити припущення, що з ймовірністю 90% математичне очікування генеральної сукупності потрапить у діапазон .

Якщо хочемо не знижувати рівень статистичної значимості α, то єдиною альтернативою залишається збільшення обсягу вибірки. Збільшивши її до 144 спостережень, отримаємо такі значення довірчих меж

L = 15 – 1,96 8 = 13,693
√144
L = 15+1,96 8 = 16,307
√144

Сам довірчий інтервал матиме такий вигляд

Таким чином, звуження довірчого інтервалу без зниження рівня статистичної значимості можливе лише за рахунок збільшення обсягу вибірки. Якщо збільшення обсягу вибірки неможливо, то звуження довірчого інтервалу може досягатися виключно за рахунок зниження рівня статистичної значущості.

Побудова довірчого інтервалу при розподілі відмінному від нормального

Якщо середньоквадратичне відхилення генеральної сукупності не відоме або розподіл відмінно від нормального, для побудови довірчого інтервалу використовується t-розподіл. Ця методика є більш консервативною, що виявляється у ширших довірчих інтервалах, порівняно з методикою, що базується на Z-оцінці.

Формула

Для розрахунку нижньої та верхньої межі довірчого інтервалу на підставі t-розподілу застосовуються наступні формули

L = X - tα σ
√n

Розподіл Стьюдента або t-розподіл залежить тільки від одного параметра – кількості ступенів свободи, яка дорівнює кількості індивідуальних значень ознаки (кількість спостережень у вибірці). Значення t-критерію Стьюдента для заданої кількості ступенів свободи (n) та рівня статистичної значущості α можна дізнатися з довідкових таблиць.

Приклад

Припустимо, що розмір вибірки становить 25 індивідуальних значень, математичне очікування вибірки дорівнює 50, а середньоквадратичне відхилення вибірки дорівнює 28. Необхідно побудувати довірчий інтервал рівня статистичної значимості α=5%.

У нашому випадку кількість ступенів свободи дорівнює 24 (25-1), отже відповідне табличне значення t-критерію Стьюдента рівня статистичної значимості α=5% становить 2,064. Отже, нижня та верхня межа довірчого інтервалу становитимуть

L = 50 – 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

А сам інтервал може бути записаний у вигляді

Таким чином, ми можемо стверджувати, що з ймовірністю 95% математичне очікування генеральної сукупності опиниться в діапазоні .

Використання t-розподілу дозволяє звузити довірчий інтервал за рахунок зниження статистичної значущості, або за рахунок збільшення розміру вибірки.

Зменшивши статистичну значимість з 95% до 90% в умовах нашого прикладу, ми отримаємо відповідне табличне значення t-критерію Стьюдента 1,711.

L = 50 – 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

І тут ми можемо стверджувати, що з ймовірністю 90% математичне очікування генеральної сукупності опиниться у діапазоні .

Якщо ми хочемо знижувати статистичну значимість, то єдиною альтернативою буде збільшення обсягу вибірки. Припустимо, що він становить 64 індивідуальні спостереження, а не 25 як у початковій умові прикладу. Табличне значення t-критерію Стьюдента для 63 ступенів свободи (64-1) та рівня статистичної значущості α=5% становить 1,998.

L = 50 – 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Це дає можливість стверджувати, що з ймовірністю 95% математичне очікування генеральної сукупності опиниться в діапазоні .

Вибірки великого обсягу

До вибірок великого обсягу відносяться вибірки з генеральної сукупності даних, кількість індивідуальних спостереженьу яких перевищує 100. Статистичні дослідження показали, що вибірки більшого обсягу мають тенденцію до нормального розподілу, навіть якщо розподіл генеральної сукупності відрізняється від нормального. Крім того, для таких вибірок застосування z-оцінки та t-розподілу дають приблизно однакові результати при побудові довірчих інтервалів. Таким чином, для вибірок великого обсягу допускається застосування z-оцінки для нормального розподілу замість t-розподілу.

Підведемо підсумки