Konfidenciaintervallumok és alkalmazásuk. Konfidencia intervallum az átlag becsléséhez (ismeretes eltérés) az EXCEL-ben Az átlag konfidencia intervalluma

Konfidenciaintervallum a matematikai elvárásokhoz - ez egy olyan adatokból számolt intervallum, amely ismert valószínűséggel tartalmazza a teljes sokaság matematikai elvárását. A matematikai várakozás természetes becslése a megfigyelt értékeinek számtani átlaga. Ezért a továbbiakban az óra alatt az „átlag”, „átlagérték” kifejezéseket fogjuk használni. A konfidenciaintervallum kiszámításának problémáinál a leggyakrabban a következő válaszra van szükség: „Az átlagos szám [érték egy adott feladatban] konfidenciaintervalluma [alacsonyabb érték] és [magasabb érték] között van”. A konfidenciaintervallum segítségével nem csak az átlagértékek, hanem az általános sokaság egyik vagy másik jellemzőjének aránya is értékelhető. A leckében elemzik az átlagértékeket, a szórást, a szórást és a hibát, amelyek révén új definíciókhoz és képletekhez jutunk. Minta- és populációs jellemzők .

Az átlag pont- és intervallumbecslései

Ha az általános sokaság átlagértékét egy számmal (ponttal) becsüljük meg, akkor az ismeretlen becslésére közepes méretű az általános sokaságból egy konkrét átlagot veszünk, amelyet megfigyelések mintájából számítanak ki. Ebben az esetben a mintaátlag értéke - egy valószínűségi változó - nem esik egybe az általános sokaság átlagértékével. Ezért a minta átlagértékének feltüntetésekor egyidejűleg a mintahibát is jelezni kell. A standard hibát a mintavételi hiba mértékeként használják, amelyet az átlaggal azonos egységekben fejeznek ki. Ezért gyakran használják a következő jelöléseket: .

Ha az átlag becslését egy bizonyos valószínűséghez kell társítani, akkor az általános érdeklődésre számot tartó sokaság paraméterét nem egyetlen számmal, hanem intervallumgal kell becsülni. A konfidenciaintervallum egy olyan intervallum, amelyben bizonyos valószínűséggel P az általános sokaság becsült mutatójának értéke található. Bizalmi intervallum, amelyben valószínűséggel P = 1 - α egy valószínűségi változó, a következőképpen számítható ki:

,

α = 1 - P, amely szinte minden statisztikai témájú könyv mellékletében megtalálható.

A gyakorlatban a sokaság átlaga és variancia nem ismert, ezért a sokaság szórását a minta szórása, a sokaság átlagát pedig a minta átlaga helyettesíti. Így a legtöbb esetben a konfidenciaintervallumot a következőképpen számítják ki:

.

A konfidenciaintervallum képlete használható a sokaság átlagának becslésére, ha

  • ismert az általános sokaság szórása;
  • vagy a sokaság szórása nem ismert, de a minta mérete nagyobb, mint 30.

A minta átlaga a sokaság átlagának elfogulatlan becslése. Viszont a minta szórása nem a populáció varianciájának elfogulatlan becslése. A minta varianciaképletében a sokaság szórásának elfogulatlan becsléséhez a minta mérete a következő n-re kell cserélni n-1.

1. példa Egy adott város 100 véletlenszerűen kiválasztott kávézójából azt az információt gyűjtik össze, hogy ezekben az alkalmazottak átlagos létszáma 10,5 fő, 4,6 szórással. Határozza meg a kávézói alkalmazottak számának 95%-ának konfidencia intervallumát!

ahol a szignifikanciaszint standard normális eloszlásának kritikus értéke α = 0,05 .

Így a 95%-os konfidenciaintervallum a kávézói alkalmazottak átlagos létszámára vonatkozóan 9,6 és 11,4 között volt.

2. példa Egy 64 megfigyelésből álló általános sokaságból vett véletlenszerű minta esetén a következő összértékeket számítottuk ki:

értékek összege a megfigyelésekben,

az értékek átlagtól való eltérésének négyzetes összege .

Számítsa ki a várható érték 95%-os konfidencia intervallumát.

számítsuk ki a szórást:

,

számítsa ki az átlagértéket:

.

Cserélje be a kifejezésben szereplő értékeket a konfidencia intervallumra:

ahol a szignifikanciaszint standard normális eloszlásának kritikus értéke α = 0,05 .

Kapunk:

Így ennek a mintának a matematikai várakozásának 95%-os konfidencia intervalluma 7,484 és 11,266 között volt.

3. példa Egy 100 megfigyelésből álló általános sokaságból vett véletlenszerű minta esetén 15,2-es átlagértéket és 3,2-es szórást számítottunk. Számítsa ki a várható érték 95%-os, majd a 99%-os konfidencia intervallumát. Ha a minta teljesítménye és variációja változatlan marad, de a konfidenciafaktor növekszik, akkor a konfidenciaintervallum szűkül vagy szélesedik?

Ezeket az értékeket behelyettesítjük a konfidenciaintervallum kifejezésébe:

ahol a szignifikanciaszint standard normális eloszlásának kritikus értéke α = 0,05 .

Kapunk:

.

Így a minta átlagának 95%-os konfidencia intervalluma 14,57 és 15,82 között volt.

Ismét behelyettesítjük ezeket az értékeket a konfidenciaintervallum kifejezésébe:

ahol a szignifikanciaszint standard normális eloszlásának kritikus értéke α = 0,01 .

Kapunk:

.

Így a minta átlagának 99%-os konfidencia intervalluma 14,37 és 16,02 között volt.

Amint látható, a konfidenciafaktor növekedésével a standard normális eloszlás kritikus értéke is növekszik, így az intervallum kezdő- és végpontja távolabb helyezkedik el az átlagtól, így a matematikai elvárás konfidencia intervallumától. növeli.

A fajsúly ​​pont- és intervallumbecslése

A minta valamely jellemzőjének részesedése pontbecslésként értelmezhető fajsúly p ugyanaz a tulajdonság az általános populációban. Ha ezt az értéket valószínűséggel kell társítani, akkor a fajsúly ​​konfidencia intervallumát kell kiszámítani p valószínûséggel P = 1 - α :

.

4. példa Egy adott városban két jelölt van Aés B indul a polgármesteri tisztségért. A város 200 lakosát választották ki véletlenszerűen, akiknek 46%-a azt válaszolta, hogy a jelöltre szavazna. A, 26% - a jelöltnek B 28% pedig nem tudja, kire fog szavazni. Határozza meg a jelöltet támogató városlakók arányának 95%-os konfidencia intervallumát! A.

Az előző alfejezetekben megvizsgáltuk az ismeretlen paraméter becslésének kérdését a egy szám. Az ilyen értékelést "pontnak" nevezik. Számos feladatnál nem csak a paramétert kell megkeresni a megfelelő számértéket, hanem értékelje annak pontosságát és megbízhatóságát is. Szükséges tudni, hogy a paramétercsere milyen hibákhoz vezethet a pontbecslését aés milyen fokú biztonsággal számíthatunk arra, hogy ezek a hibák nem lépik túl az ismert határokat?

Az ilyen jellegű problémák különösen fontosak kis számú megfigyelésnél, amikor a pontbecslést és be nagyrészt véletlenszerű, és az a hozzávetőleges helyettesítése a-val súlyos hibákhoz vezethet.

Képet adni a becslés pontosságáról és megbízhatóságáról a,

a matematikai statisztikában úgynevezett konfidenciaintervallumokat és konfidenciavalószínűségeket használnak.

Legyen a paraméter a tapasztalatból származik elfogulatlan becslés a. Ebben az esetben szeretnénk megbecsülni a lehetséges hibát. Adjunk hozzá elég nagy p valószínűséget (például p = 0,9, 0,95 vagy 0,99) ahhoz, hogy egy p valószínűségű esemény gyakorlatilag biztosnak tekinthető, és keressünk egy s értéket, amelyre

Akkor a hatótáv majdnem lehetséges értékek csere hiba a a a, ± s lesz; nagy abszolút hibák csak kis valószínűséggel jelennek meg a = 1 - p. Írjuk át (14.3.1) így:

Az egyenlőség (14.3.2) azt jelenti, hogy p valószínűséggel a paraméter ismeretlen értéke a intervallumba esik

Ebben az esetben meg kell jegyezni egy körülményt. Korábban többször is figyelembe vettük annak a valószínűségét, hogy egy valószínűségi változó egy adott nem véletlenszerű intervallumba esik. Itt más a helyzet: a nem véletlenszerű, hanem véletlenszerű intervallum / r. Véletlenszerűen a helyzete az x tengelyen, a középpontja határozza meg a; általában a 2s intervallum hossza is véletlenszerű, mivel az s értékét általában kísérleti adatokból számítjuk. Ezért ebben az esetben jobb lenne a p értékét nem a pont "eltalálásának" valószínűségeként értelmezni. a a / p intervallumba, hanem annak valószínűségeként, hogy egy / p véletlenszerű intervallum lefedi a pontot a(14.3.1. ábra).

Rizs. 14.3.1

A p valószínűséget nevezzük bizalmi szint, és a / p - intervallum megbízhatósági intervallum. Intervallumhatárok ha. a x \u003d a- s és a 2 = a +és hívják bizalom határai.

Adjunk még egy értelmezést a konfidenciaintervallum fogalmának: tekinthető paraméterértékek intervallumának a, kompatibilis a kísérleti adatokkal, és nem mond ellent azoknak. Valóban, ha egyetértünk abban, hogy egy a = 1-p valószínűségű eseményt gyakorlatilag lehetetlennek tekintünk, akkor az a paraméter azon értékei, amelyekre a - a> s ellentmondónak kell lenni a kísérleti adatoknak, és azokat, amelyeknél |a - a a t na 2 .

Legyen a paraméter a van egy elfogulatlan becslés a. Ha ismernénk a mennyiség eloszlásának törvényét a, a konfidenciaintervallum megtalálásának problémája meglehetősen egyszerű lenne: elég lenne megtalálni egy s értéket, amelyre

A nehézség abban rejlik, hogy a becslés eloszlási törvénye a a mennyiség eloszlásának törvényétől függ xés következésképpen az ismeretlen paraméterein (különösen magán a paraméteren a)

Ennek a nehézségnek a megkerülésére alkalmazhatjuk a következő durván közelítő trükköt: cseréljük ki az s kifejezésben szereplő ismeretlen paramétereket a pontbecsléseikre. Viszonylag sok kísérlettel P(kb. 20 ... 30) ez a technika általában kielégítő eredményeket ad a pontosság tekintetében.

Példaként tekintsük a matematikai elvárás konfidenciaintervallumának problémáját.

Legyen előállított P x, amelynek jellemzői a matematikai elvárás tés variancia D- ismeretlen. Ezekre a paraméterekre a következő becsléseket kaptuk:

A matematikai elvárásokhoz meg kell építeni egy konfidenciaintervallumot / р, amely megfelel a р megbízhatósági valószínűségnek t mennyiségeket x.

A probléma megoldásában azt a tényt használjuk fel, hogy a mennyiség t az összeg P független, azonos eloszlású valószínűségi változók X hés a centrális határértéktétel szerint kellően nagy P eloszlási törvénye közel áll a normálishoz. A gyakorlatban még viszonylag kis számú tag esetén is (10 ... 20 nagyságrendű) az összeg eloszlási törvénye megközelítőleg normálisnak tekinthető. Feltételezzük, hogy az érték t a normál törvény szerint osztják el. Ennek a törvénynek a jellemzői - a matematikai elvárás és a variancia - egyenlőek, ill tés

(lásd a 13. fejezet 13.3. alpontját). Tegyük fel, hogy az érték D ismert számunkra, és találunk olyan Ep értéket, amelyre

A 6. fejezet (6.3.5) képletével a (14.3.5) bal oldalán lévő valószínűséget a normális eloszlás függvényében fejezzük ki.

ahol a becslés szórása t.

Az egyenletből

keresse meg az Sp értéket:

ahol arg Ф* (x) az Ф* inverz függvénye (X), azok. az argumentum olyan értéke, amelyre a normális eloszlásfüggvény egyenlő X.

Diszperzió D, amelyen keresztül az érték kifejeződik a 1P, nem tudjuk pontosan; hozzávetőleges értékeként használhatja a becslést D(14.3.4), és körülbelül:

Így a konfidenciaintervallum felépítésének problémája megközelítőleg megoldott, ami egyenlő:

ahol a gp-t a (14.3.7) képlet határozza meg.

Annak érdekében, hogy elkerüljük a fordított interpolációt az Ф * (l) függvény táblázataiban az s p kiszámításakor, célszerű egy speciális táblázatot összeállítani (14.3.1. táblázat), amely felsorolja a mennyiség értékeit.

attól függően, hogy r. A (p érték a normáltörvényhez határozza meg a szórások számát, amelyeket a diszperziós középponttól jobbra és balra félre kell tenni, hogy a kapott területre való esés valószínűsége egyenlő legyen p-vel.

A 7 p értékén keresztül a konfidencia intervallum a következőképpen fejeződik ki:

14.3.1. táblázat

1. példa Az értékkel 20 kísérletet végeztünk x; az eredmények a táblázatban láthatók. 14.3.2.

14.3.2. táblázat

Meg kell találni a becslést a mennyiség matematikai elvárására xés állítsunk össze egy p = 0,8 konfidenciaszintnek megfelelő konfidenciaintervallumot.

Döntés. Nekünk van:

Az n origót választva: = 10, a harmadik képlet (14.2.14) szerint megkapjuk a torzítatlan becslést D :

táblázat szerint 14.3.1 találjuk

Bizalom határai:

Megbízhatósági intervallum:

Paraméterértékek t, Az ebben az intervallumban lévő adatok kompatibilisek a táblázatban megadott kísérleti adatokkal. 14.3.2.

Hasonló módon a variancia konfidenciaintervallumát is meg lehet alkotni.

Legyen előállított P független kísérletek egy valószínűségi változón x ismeretlen paraméterekkel -ból és A-ból, valamint a szóráshoz D az elfogulatlan becslést kapjuk:

A variancia konfidenciaintervallumának közelítő felépítése szükséges.

A (14.3.11) képletből látható, hogy az érték D képviseli

összeg P alak valószínűségi változói . Ezek az értékek nem

független, hiszen bármelyik tartalmazza a mennyiséget t, mindenki mástól függ. Kimutatható azonban, hogy mint Pösszegük eloszlási törvénye is közel áll a normálishoz. Majdnem at P= 20...30 már normálisnak tekinthető.

Tegyük fel, hogy ez így van, és keressük meg ennek a törvénynek a jellemzőit: a matematikai elvárást és szórást. A pontszám óta D- akkor elfogulatlan M[D] = D.

Variancia számítás D D viszonylag bonyolult számításokhoz kapcsolódik, ezért a kifejezését levezetés nélkül adjuk meg:

ahol c 4 - a mennyiség negyedik központi momentuma x.

Ennek a kifejezésnek a használatához helyettesítenie kell benne a 4 és a D(legalábbis hozzávetőlegesen). Ahelyett D használhatja az értékelést D. Elvileg a negyedik központi momentum helyettesíthető a becslésével is, például a következő alakzat értékével:

de egy ilyen csere rendkívül alacsony pontosságot ad, mivel általában korlátozott számú kísérlettel a nagyfokú nyomatékokat nagy hibákkal határozzák meg. A gyakorlatban azonban gyakran előfordul, hogy a mennyiség eloszlási törvényének formája x előre ismert: csak a paraméterei ismeretlenek. Ezután megpróbálhatjuk az u4-et kifejezésekkel kifejezni D.

Vegyük a leggyakoribb esetet, amikor az érték x a normál törvény szerint osztják el. Ekkor a negyedik központi momentum a szórással fejeződik ki (lásd a 6. fejezet 6.2. alfejezetét);

és a (14.3.12) képlet megadja vagy

A (14.3.14)-ben az ismeretlen helyettesítése Dértékelését D, kapjuk: honnan

Az u 4 pillanata kifejezéssel fejezhető ki D más esetekben is, amikor a mennyiség elosztását x nem normális, de a megjelenése ismert. Például az egyenletes sűrűség törvényéhez (lásd az 5. fejezetet) a következőket találjuk:

ahol (a, P) az az intervallum, amelyen a törvény adott.

Ennélfogva,

A (14.3.12) képlet szerint a következőket kapjuk: ahonnan kb

Azokban az esetekben, amikor a 26 érték eloszlási törvényének formája ismeretlen, az a /) értékének becslésénél továbbra is a (14.3.16) képlet használata javasolt, ha nincs különösebb ok azt hinni, hogy ez a törvény nagyon eltér a normáltól (észrevehető pozitív vagy negatív görtózisa van).

Ha így vagy úgy megkapjuk a /) közelítő értékét, akkor ugyanúgy meg lehet alkotni a variancia konfidenciaintervallumát, mint ahogy azt a matematikai elváráshoz építettük:

táblázatban található az adott p valószínűségtől függő érték. 14.3.1.

2. példa Keressen egy körülbelül 80%-os megbízhatósági intervallumot egy véletlen változó varianciájához x az 1. példa feltételei szerint, ha ismert, hogy az érték x a normálishoz közeli törvény szerint elosztva.

Döntés. Az érték ugyanaz marad, mint a táblázatban. 14.3.1:

A (14.3.16) képlet szerint

A (14.3.18) képlet szerint megtaláljuk a konfidencia intervallumot:

A szórás megfelelő értéktartománya: (0,21; 0,29).

14.4. Pontos módszerek megbízhatósági intervallumok felépítésére a normális törvény szerint eloszló valószínűségi változó paramétereihez

Az előző alfejezetben nagyjából közelítő módszereket vettünk figyelembe az átlag és a variancia konfidencia-intervallumának felépítésére. Itt adunk egy ötletet ugyanazon probléma megoldásának pontos módszereiről. Hangsúlyozzuk, hogy a konfidenciaintervallumok pontos megtalálásához feltétlenül szükséges előre ismerni a mennyiség eloszlási törvényének alakját. x, míg ez közelítő módszerek alkalmazásához nem szükséges.

A megbízhatósági intervallumok felépítésének pontos módszereinek ötlete a következő. Bármely konfidenciaintervallum megtalálható néhány egyenlőtlenség teljesülésének valószínűségét kifejező feltételből, amely magában foglalja a számunkra érdekes becslést a. Osztályelosztási törvény aáltalános esetben a mennyiség ismeretlen paramétereitől függ x. Néha azonban lehetséges az egyenlőtlenségek átadása egy valószínűségi változóból a a megfigyelt értékek valamilyen más függvényéhez X p X 2, ..., X o. amelynek eloszlási törvénye nem ismeretlen paraméterektől, hanem csak a kísérletek számától és a mennyiség eloszlási törvényének alakjától függ x. Az ilyen véletlenszerű változók nagy szerepet játszanak a matematikai statisztikában; legrészletesebben a mennyiség normális eloszlásának esetére tanulmányozták őket x.

Például bebizonyosodott, hogy a mennyiség normál eloszlása ​​mellett x véletlenszerű érték

figyelemmel az ún Hallgatói elosztási törvény val vel P- 1 szabadságfok; ennek a törvénynek a sűrűsége a formája

ahol G(x) az ismert gammafüggvény:

Az is bebizonyosodott, hogy a valószínűségi változó

a következővel rendelkezik: "eloszlás % 2". P- 1 szabadságfok (lásd 7. fejezet), melynek sűrűségét a képlet fejezi ki

Anélkül, hogy a (14.4.2) és (14.4.4) eloszlások származtatásain foglalkoznánk, bemutatjuk, hogyan alkalmazhatók ezek a paraméterek konfidenciaintervallumának szerkesztése során. Ty D .

Legyen előállított P független kísérletek egy valószínűségi változón x, a normál törvény szerint elosztva, ismeretlen paraméterekkel TIO. Ezeknél a paramétereknél becslések

Konfidenciaintervallumot kell alkotni mindkét paraméterhez, amelyek megfelelnek a p konfidenciavalószínűségnek.

Először alkossunk meg egy konfidenciaintervallumot a matematikai elváráshoz. Természetes, hogy ezt az intervallumot szimmetrikusan vesszük a -hoz képest t; jelöljük s p-vel az intervallum hosszának felét. Az sp értékét úgy kell megválasztani, hogy a feltétel

Próbáljuk meg átadni a (14.4.5) egyenlőség bal oldalát egy valószínűségi változóból t valószínűségi változóhoz T, a Student törvénye szerint terjesztik. Ehhez megszorozzuk az |m-w?| egyenlőtlenség mindkét részét

pozitív értékre: vagy a (14.4.1) jelöléssel,

Keressünk egy olyan / p számot, hogy a / p értéke megtalálható legyen a feltételből

A (14.4.2) képletből látható, hogy (1) páros függvény, így (14.4.8) megadja

Az egyenlőség (14.4.9) határozza meg a / p értéket p függvényében. Ha rendelkezésére áll egy integrál értékek táblázata

akkor a / p értéke fordított interpolációval megtalálható a táblázatban. Kényelmesebb azonban előre összeállítani egy értéktáblázatot / p. Egy ilyen táblázatot a Függelék (5. táblázat) tartalmaz. Ez a táblázat a p konfidenciavalószínűségtől és a szabadságfokok számától függő értékeket mutatja P- 1. Miután meghatározta a / p-t a táblázat szerint. 5 és feltételezve

megtaláljuk a / p konfidenciaintervallum szélességének felét és magát az intervallumot

1. példa 5 független kísérletet végeztünk egy valószínűségi változón x, normál eloszlású, ismeretlen paraméterekkel tés róla. A kísérletek eredményeit a táblázat tartalmazza. 14.4.1.

14.4.1. táblázat

Keressen egy becslést t a matematikai várakozáshoz, és állítson össze egy 90%-os / p konfidenciaintervallumot (azaz a p \u003d 0,9 konfidenciavalószínűségnek megfelelő intervallumot).

Döntés. Nekünk van:

iránti kérelem 5. táblázata szerint P - 1 = 4 és p = 0,9 azt találjuk ahol

A konfidencia intervallum az lesz

2. példa: A 14.3 alszakasz 1. példájának feltételeire, az értéket feltételezve x normál eloszlású, keresse meg a pontos konfidenciaintervallumot.

Döntés. A kérelem 5. táblázata szerint a címen találjuk P - 1 = 19ir =

0,8/p=1,328; innen

A 14.3. alfejezet 1. példájának megoldásával (e p = 0,072) összehasonlítva azt látjuk, hogy az eltérés nagyon kicsi. Ha a pontosságot a második tizedesjegyig tartjuk, akkor a pontos és közelítő módszerrel kapott konfidencia intervallumok megegyeznek:

Folytassuk a variancia konfidenciaintervallumának felépítését. Tekintsük az elfogulatlan varianciabecslést

és fejezzük ki a valószínűségi változót D az értéken keresztül V(14.4.3), amelynek eloszlása ​​x 2 (14.4.4):

A mennyiség eloszlási törvényének ismerete V, meg lehet találni azt a / (1 ) intervallumot, amelybe adott p valószínűséggel esik.

elosztási törvény k n _ x (v) az I 7 értéke az ábrán látható formában van. 14.4.1.

Rizs. 14.4.1

Felmerül a kérdés: hogyan válasszuk ki a / p intervallumot? Ha a mennyiség eloszlási törvénye V szimmetrikus volt (mint egy normál törvény vagy Student-eloszlás), természetes lenne a /p intervallumot szimmetrikusnak venni a matematikai elvárásokhoz képest. Ebben az esetben a törvény k n _ x (v) aszimmetrikus. Állapodjunk meg, hogy a /p intervallumot úgy választjuk meg, hogy a mennyiség kimeneti valószínűsége legyen V az intervallumon kívül jobbra és balra (a 14.4.1. ábrán az árnyékolt területek) azonosak és egyenlőek voltak

Egy / p intervallum létrehozásához ezzel a tulajdonsággal a táblázatot használjuk. 4 alkalmazás: számokat tartalmaz y) oly módon, hogy

a mennyiséghez V, x 2 -eloszlású r szabadságfokkal. A mi esetünkben r = n- 1. Javítás r = n- 1, és keresse meg a táblázat megfelelő sorában. 4 két érték x 2 - az egyik valószínűségnek megfelelő a másik - valószínűségek Jelöljük ezeket

értékeket 2-korés xl? Az intervallum rendelkezik y 2 , a baljával, és y~ jobb vége.

Most megtaláljuk a szükséges /| konfidenciaintervallumot a D, és határvonalú variancia esetén D2, amely lefedi a lényeget D p valószínűséggel:

Szerkesszünk egy olyan / (, = (?> b A) intervallumot, amely lefedi a pontot D akkor és csak akkor, ha az érték V intervallumba esik / r. Mutassuk meg, hogy az intervallum

megfelel ennek a feltételnek. Valóban, az egyenlőtlenségek egyenértékűek az egyenlőtlenségekkel

és ezek az egyenlőtlenségek p valószínűséggel fennállnak. Így a diszperzió konfidencia intervallumát megtaláljuk, és a (14.4.13) képlettel fejezzük ki.

3. példa Keresse meg a variancia konfidenciaintervallumát a 14.3. alfejezet 2. példájának feltételei mellett, ha ismert, hogy az érték x normálisan elosztva.

Döntés. Nekünk van . A pályázat 4. táblázata szerint

címen találjuk r = n - 1 = 19

A (14.4.13) képlet alapján megtaláljuk a diszperzió konfidencia intervallumát

A szórásra vonatkozó megfelelő intervallum: (0,21; 0,32). Ez az intervallum csak kis mértékben haladja meg a 14.3. alfejezet 2. példájában közelítő módszerrel kapott intervallumot (0,21; 0,29).

  • A 14.3.1. ábra egy olyan konfidenciaintervallumot vesz figyelembe, amely szimmetrikus a-ra. Általában, mint később látni fogjuk, erre nincs szükség.

Azt a valószínűséget nevezzük, hogy a mért mennyiség valódi értéke egy bizonyos intervallumon belül van bizalmi szint , vagy megbízhatósági tényező, és az intervallum - megbízhatósági intervallum.

Minden megbízhatósági szintnek megvan a maga konfidencia intervalluma. Konkrétabban, a 0,67-es konfidenciaintervallum felel meg a közötti konfidenciaintervallumnak. Ez az állítás azonban csak kellően nagy számú mérésre igaz (több mint 10), és a 0,67-es valószínűség nem tűnik kellően megbízhatónak - hozzávetőlegesen a három méréssorozat mindegyikében y kívül eshet a konfidencia intervallumon. Annak érdekében, hogy nagyobb biztonságot kapjunk arról, hogy a mért mennyiség értéke a konfidencia-intervallumon belül van, általában 0,95 - 0,99 megbízhatósági valószínűséggel adják meg. Konfidencia intervallum adott konfidenciaszinthez, figyelembe véve a mérések számának befolyását n a számtani átlag szórásának szorzatával találhatjuk meg

.

az úgynevezett Student-féle együtthatóról. Tanulói együtthatók egy értéktartományhoz és n táblázatban vannak megadva.

táblázat - Student-együtthatók

Mérések száma n Bizalom valószínűsége y
0,67 0,90 0,95 0,99
2,0 6,3 12,7 63,7
1,3 2,4 3,2 5,8
1,2 2,1 2,8 4,6
1,2 2,0 2,6 4,0
1,1 1,8 2,3 3,3
1,0 1,7 2,0 2,6

Végül a mért értékre y adott megbízhatósági szinthez y és a mérések száma n Az állapot

Hívjuk a mennyiséget véletlenszerű hiba mennyiségeket y.

Példa: lásd az 5. számú előadást – egy számsor.

Határozzuk meg

A mérések számával - 45 és a konfidenciaszinttel - 0,95, azt kapjuk, hogy a Student-féle együttható megközelítőleg 2,15. Ekkor ennek a méréssorozatnak a konfidencia intervalluma 62,6.

Hiányok (nagy hiba) - a kezelői hibához kapcsolódó vagy el nem számolt durva hibák külső hatások. Általában kimaradnak a mérési eredményekből. A hibákat általában a figyelmetlenség okozza. Előfordulhatnak a készülék hibás működése miatt is.

Az egyszerű mérések túlnyomó többségénél a véletlenszerű hibák ún. normál törvénye elég jól teljesül ( Gauss törvény), amely a következő empirikus rendelkezésekből származik.

1) a mérési hibák folyamatos értéksorozatot vehetnek fel;

2) sok mérésnél azonos nagyságú, de eltérő előjelű hibák egyformán gyakran fordulnak elő,

3) minél nagyobb a véletlenszerű hiba, annál kisebb a valószínűsége annak előfordulásának.

A normál Gauss-eloszlás grafikonja az 1. ábrán látható. A görbe egyenletnek megvan a formája

ahol a véletlen hibák (hibák) eloszlásfüggvénye, amely a hiba valószínűségét jellemzi, σ a négyzetes hiba.

A σ érték nem véletlen változó, és a mérési folyamatot jellemzi. Ha a mérési feltételek nem változnak, akkor σ állandó marad. Ennek a mennyiségnek a négyzetét ún a mérések szórása. Minél kisebb a szórás, annál kisebb az egyedi értékek szórása és annál nagyobb a mérési pontosság.

A σ négyzetes közép hiba pontos értéke, valamint a mért mennyiség valódi értéke nem ismert. Ennek a paraméternek van egy úgynevezett statisztikai becslése, amely szerint az átlagos négyzetes hiba megegyezik a számtani átlag négyzetes átlaghibájával. Amelynek értékét a képlet határozza meg

hol az eredmény én-dik dimenzió; - a kapott értékek számtani átlaga; n a mérések száma.

Minél nagyobb a mérések száma, annál kisebb és annál jobban megközelíti a σ-t. Ha a mért érték valódi értéke μ, a mérések eredményeként kapott számtani középértéke és a véletlenszerű abszolút hiba , akkor a mérési eredményt a következőképpen írjuk fel.

-tól -ig terjedő értékek intervallumát, amelybe a mért μ mennyiség valódi értéke esik, ún. megbízhatósági intervallum. Mivel ez egy valószínűségi változó, a valódi érték α valószínűséggel esik a konfidencia intervallumba, amit ún. megbízhatósági valószínűség, vagy megbízhatóság mérések. Ez az érték számszerűen megegyezik az árnyékolt görbe vonalú trapéz területével. (lásd a képet.)

Mindez kellően nagy számú mérésre igaz, amikor közel van σ-hez. Kis számú mérés konfidenciaintervallumának és konfidenciaszintjének meghatározásához, amellyel a laboratóriumi munka során foglalkozunk, a Hallgatói valószínűségi eloszlás. Ez az úgynevezett valószínűségi változó valószínűségi eloszlása Hallgatói együttható, megadja a konfidencia intervallum értékét a számtani átlag négyzetes középhibájának törtrészében.


Ennek a mennyiségnek a valószínűségi eloszlása ​​nem függ σ 2 -től, hanem lényegében a kísérletek számától függ n. A kísérletek számának növekedésével n A Student-féle eloszlás Gauss-eloszlásra irányul.

Az eloszlásfüggvény táblázatos (1. táblázat). A Student-féle együttható értéke a mérések számának megfelelő egyenes metszéspontjában van n, és az α konfidenciaszintnek megfelelő oszlop

Konfidencia intervallumok ( angol Bizalmi intervallumok) a statisztikában használt intervallumbecslések egyik fajtája, amelyet adott szignifikanciaszintre számítanak ki. Lehetővé teszik azt az állítást, hogy az általános sokaság egy ismeretlen statisztikai paraméterének valódi értéke a kapott értéktartományban van, a választott statisztikai szignifikanciaszint által adott valószínűséggel.

Normális eloszlás

Ha az adatok sokaságának szórása (σ 2 ) ismert, a z-score segítségével kiszámítható a konfidenciahatárok (a konfidenciaintervallum határpontjai). A t-eloszlás használatához képest a z-pontszám használata nemcsak szűkebb konfidenciaintervallumot ad, hanem megbízhatóbb becsléseket is ad az átlagról és a szórásról (σ), mivel a Z-pontszám normál eloszláson alapul.

Képlet

A konfidencia intervallum határpontjainak meghatározásához, feltéve, hogy az adatok sokaságának szórása ismert, a következő képletet használjuk

L = X - Z α/2 σ
√n

Példa

Tegyük fel, hogy a minta mérete 25 megfigyelésből áll, a minta átlaga 15, a sokaság szórása pedig 8. α=5%-os szignifikanciaszint esetén a Z-pontszám Z α/2 =1,96. Ebben az esetben a konfidencia intervallum alsó és felső határa lesz

L = 15-1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Így kijelenthetjük, hogy 95%-os valószínűséggel a teljes sokaság matematikai elvárása a 11,864 és 18,136 közötti tartományba esik.

A konfidenciaintervallum szűkítésének módszerei

Tegyük fel, hogy a tartomány túl széles a vizsgálatunk céljaihoz. A konfidencia-intervallum tartományának csökkentése kétféleképpen lehetséges.

  1. Csökkentse az α statisztikai szignifikancia szintjét.
  2. Növelje a minta méretét.

A statisztikai szignifikancia szintjét α=10%-ra csökkentve Z α/2 =1,64 Z-pontszámot kapunk. Ebben az esetben az intervallum alsó és felső határa lesz

L = 15-1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

Maga a konfidenciaintervallum pedig így írható fel

Ebben az esetben feltételezhetjük, hogy 90%-os valószínűséggel a teljes sokaság matematikai elvárása a tartományba esik.

Ha meg akarjuk tartani az α statisztikai szignifikancia szintjét, akkor az egyetlen alternatíva a minta méretének növelése. 144 megfigyelésre növelve a következő megbízhatósági határértékeket kapjuk

L = 15-1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Maga a konfidenciaintervallum így fog kinézni:

Így a konfidencia intervallum szűkítése a statisztikai szignifikancia szintjének csökkentése nélkül csak a minta méretének növelésével lehetséges. Ha nem lehetséges a mintanagyság növelése, akkor a konfidenciaintervallum szűkítése kizárólag a statisztikai szignifikancia szintjének csökkentésével érhető el.

Konfidenciaintervallum felépítése nem normál eloszláshoz

Ha a sokaság szórása nem ismert, vagy az eloszlás nem normális, a t-eloszlást használjuk a konfidenciaintervallum felépítéséhez. Ez a technika konzervatívabb, ami szélesebb konfidencia intervallumokban fejeződik ki, mint a Z-pontszámon alapuló technika.

Képlet

A következő képleteket használjuk a konfidencia intervallum alsó és felső határának kiszámításához a t-eloszlás alapján

L = X - tα σ
√n

A Student-eloszlás vagy t-eloszlás csak egy paramétertől függ - a szabadsági fokok számától, amely megegyezik az egyedi jellemzőértékek számával (a megfigyelések száma a mintában). A Student-féle t-próba adott számú szabadsági fokra (n) és a statisztikai szignifikancia szintje α megtalálható a keresőtáblázatokban.

Példa

Tegyük fel, hogy a minta mérete 25 egyedi érték, a minta átlaga 50, a minta szórása pedig 28. Konfidenciaintervallumot kell alkotnia az α=5%-os statisztikai szignifikancia szintjéhez.

Esetünkben a szabadságfokok száma 24 (25-1), ezért a Student-féle t-próba megfelelő táblázatos értéke az α=5% statisztikai szignifikancia szintre 2,064. Ezért a konfidenciaintervallum alsó és felső határa lesz

L = 50-2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

Maga az intervallum pedig így írható fel

Így kijelenthetjük, hogy 95%-os valószínűséggel a teljes populáció matematikai elvárása a tartományba fog kerülni.

A t-eloszlás használata lehetővé teszi a konfidencia intervallum szűkítését, akár a statisztikai szignifikancia csökkentésével, akár a minta méretének növelésével.

Példánk körülményei között a statisztikai szignifikancia 95%-ról 90%-ra csökkentve a Student-féle t-próba 1,711 megfelelő táblázatos értékét kapjuk.

L = 50-1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

Ebben az esetben azt mondhatjuk, hogy 90%-os valószínűséggel a teljes sokaság matematikai elvárása a tartományba kerül.

Ha nem akarjuk csökkenteni a statisztikai szignifikanciát, akkor az egyetlen alternatíva a minta méretének növelése. Tegyük fel, hogy 64 egyedi megfigyelésről van szó, és nem 25-ről, mint a példa kezdeti feltételében. A Student-féle t-próba táblázatos értéke 63 szabadsági fokra (64-1) és az α=5% statisztikai szignifikancia szintre 1,998.

L = 50-1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Ez lehetőséget ad arra, hogy kijelentsük, hogy 95%-os valószínűséggel az általános populáció matematikai elvárása a tartományba esik.

Nagy minták

A nagy minták közé tartoznak az adatok általános sokaságából származó minták, a szám egyéni megfigyelések 100-nál nagyobb. Statisztikai vizsgálatok kimutatták, hogy a nagyobb minták általában normális eloszlásúak, még akkor is, ha a sokaság eloszlása ​​nem normális. Ezenkívül az ilyen minták esetében a z-pontszám és a t-eloszlás alkalmazása megközelítőleg azonos eredményt ad a konfidenciaintervallumok felépítésekor. Így nagy minták esetén elfogadható a z-pontszám használata normál eloszlásra a t-eloszlás helyett.

Összegezve