Güven aralıkları ve uygulaması. EXCEL'de ortalamayı tahmin etmek için güven aralığı (bilinen varyans) Ortalama için güven aralığı

Matematiksel beklenti için güven aralığı - bu, bilinen bir olasılıkla genel popülasyonun matematiksel beklentisini içeren verilerden hesaplanan böyle bir aralıktır. Matematiksel beklenti için doğal tahmin, gözlemlenen değerlerinin aritmetik ortalamasıdır. Bu nedenle ders boyunca "ortalama", "ortalama değer" terimlerini kullanacağız. Güven aralığını hesaplama problemlerinde en sık istenen cevap "Ortalama sayının [belirli bir problemdeki değerin] güven aralığı [düşük değer] ile [yüksek değer] arasındadır". Güven aralığının yardımıyla, yalnızca ortalama değerleri değil, aynı zamanda genel popülasyonun bir veya daha fazla özelliğinin payını da değerlendirmek mümkündür. Derste yeni tanımlara ve formüllere ulaşacağımız ortalama değerler, varyans, standart sapma ve hata analiz edilir. Örneklem ve Popülasyon Özellikleri .

Ortalamanın nokta ve aralık tahminleri

Genel popülasyonun ortalama değeri bir sayı (nokta) ile tahmin edilirse, bilinmeyenin tahmini için orta boy genel popülasyonun, bir gözlem örneğinden hesaplanan belirli bir ortalama alınır. Bu durumda, örnek ortalamanın değeri - rastgele bir değişken - genel popülasyonun ortalama değeri ile örtüşmez. Bu nedenle numunenin ortalama değerini belirtirken aynı zamanda numune hatasını da belirtmek gerekir. Standart hata, ortalama ile aynı birimlerde ifade edilen örnekleme hatasının bir ölçüsü olarak kullanılır. Bu nedenle, aşağıdaki gösterim sıklıkla kullanılır: .

Ortalamanın tahmininin belirli bir olasılıkla ilişkilendirilmesi gerekiyorsa, ilgili genel popülasyonun parametresi tek bir sayı ile değil, bir aralıkla tahmin edilmelidir. Güven aralığı, belirli bir olasılıkla, P genel popülasyonun tahmini göstergesinin değeri bulunur. Olasılıkla güven aralığı P = 1 - α rastgele bir değişkendir, aşağıdaki gibi hesaplanır:

,

α = 1 - P, istatistikle ilgili hemen hemen her kitabın ekinde bulunabilir.

Uygulamada, popülasyon ortalaması ve varyansı bilinmez, bu nedenle popülasyon varyansı, örnek varyansı ve popülasyon ortalaması, örnek ortalaması ile değiştirilir. Bu nedenle, çoğu durumda güven aralığı aşağıdaki gibi hesaplanır:

.

Güven aralığı formülü, aşağıdaki durumlarda popülasyon ortalamasını tahmin etmek için kullanılabilir:

  • genel popülasyonun standart sapması biliniyor;
  • veya popülasyonun standart sapması bilinmiyor, ancak örneklem büyüklüğü 30'dan büyük.

Örnek ortalama, popülasyon ortalamasının yansız bir tahminidir. Buna karşılık, örnek varyansı popülasyon varyansının tarafsız bir tahmini değildir. Örnek varyans formülündeki popülasyon varyansının yansız bir tahminini elde etmek için, örneklem büyüklüğü n ile değiştirilmelidir n-1.

örnek 1 Belirli bir şehirde rastgele seçilen 100 kafeden ortalama çalışan sayısının 10,5 ve standart sapması 4,6 olduğu bilgisi toplanmıştır. Kafe çalışanı sayısının %95'inin güven aralığını belirleyiniz.

önem düzeyi için standart normal dağılımın kritik değeri nerede α = 0,05 .

Böylece ortalama kafe çalışan sayısı için %95 güven aralığı 9,6 ile 11,4 arasında olmuştur.

Örnek 2 64 gözlemden oluşan genel bir popülasyondan rastgele bir örnek için aşağıdaki toplam değerler hesaplandı:

gözlemlerdeki değerlerin toplamı ,

ortalamadan değerlerin kare sapmalarının toplamı .

Beklenen değer için %95 güven aralığını hesaplayın.

standart sapmayı hesaplayın:

,

ortalama değeri hesaplayın:

.

Güven aralığı için ifadedeki değerleri değiştirin:

önem düzeyi için standart normal dağılımın kritik değeri nerede α = 0,05 .

Alırız:

Bu nedenle, bu örneğin matematiksel beklentisi için %95 güven aralığı 7.484 ile 11.266 arasında değişmiştir.

Örnek 3 100 gözlemlik bir genel popülasyondan rastgele bir örnek için, 15.2'lik bir ortalama değer ve 3.2'lik bir standart sapma hesaplanmıştır. Beklenen değer için %95 güven aralığını, ardından %99 güven aralığını hesaplayın. Örnek gücü ve varyasyonu aynı kalır, ancak güven faktörü artarsa, güven aralığı daralır mı yoksa genişler mi?

Bu değerleri, güven aralığı için ifadenin yerine koyarız:

önem düzeyi için standart normal dağılımın kritik değeri nerede α = 0,05 .

Alırız:

.

Bu nedenle, bu örneğin ortalaması için %95 güven aralığı 14.57'den 15.82'ye kadardı.

Yine, bu değerleri güven aralığı için ifadenin yerine koyarız:

önem düzeyi için standart normal dağılımın kritik değeri nerede α = 0,01 .

Alırız:

.

Böylece, bu örneğin ortalaması için %99 güven aralığı 14.37'den 16.02'ye kadardı.

Görüldüğü gibi güven faktörü arttıkça standart normal dağılımın kritik değeri de artar ve bu nedenle aralığın başlangıç ​​ve bitiş noktaları ortalamadan daha uzakta yer alır ve dolayısıyla matematiksel beklenti için güven aralığı artışlar.

Özgül ağırlığın nokta ve aralık tahminleri

Numunenin bazı özelliklerinin payı, nokta tahmini olarak yorumlanabilir. spesifik yer çekimi p genel popülasyonda aynı özellik. Bu değerin bir olasılık ile ilişkilendirilmesi gerekiyorsa, özgül ağırlığın güven aralığı hesaplanmalıdır. p genel popülasyonda bir olasılıkla özellik P = 1 - α :

.

Örnek 4 Belli bir şehirde iki aday var A ve B belediye başkanlığına aday. Şehrin 200 sakini rastgele ankete katıldı ve bunların %46'sı adaya oy vereceğini söyledi. A, %26 - aday için B ve %28'i kime oy vereceğini bilmiyor. Adayı destekleyen şehir sakinlerinin oranı için %95 güven aralığını belirleyin A.

Önceki alt bölümlerde, bilinmeyen parametreyi tahmin etme sorusunu düşündük. a bir numara. Böyle bir değerlendirmeye "nokta" denir. Bir dizi görevde, yalnızca parametreyi bulmak için gerekli değildir. a uygun sayısal değer değil, aynı zamanda doğruluğunu ve güvenilirliğini de değerlendirin. Parametre değiştirmenin hangi hatalara yol açabileceğini bilmek gerekir. a onun nokta tahmini a ve bu hataların bilinen sınırların ötesine geçmemesini ne kadar güvenle bekleyebiliriz?

Bu tür problemler, nokta tahmini yapıldığında, özellikle az sayıda gözlem için geçerlidir. ve büyük ölçüde rastgeledir ve a'nın a ile yaklaşık olarak değiştirilmesi ciddi hatalara yol açabilir.

Tahminin doğruluğu ve güvenilirliği hakkında fikir vermek a,

matematiksel istatistiklerde, sözde güven aralıkları ve güven olasılıkları kullanılır.

parametre için izin ver a deneyimden elde edilen tarafsız tahmin a. Bu durumda olası hatayı tahmin etmek istiyoruz. Yeterince büyük bir p olasılığı atayalım (örneğin, p = 0,9, 0,95 veya 0,99), öyle ki, p olasılığı olan bir olay pratik olarak kesin kabul edilebilir ve kendisi için bir s değeri bulalım.

O zaman menzil neredeyse olası değerler değiştirme hatası aüzerinde a, ± s olacaktır; büyük mutlak hatalar, yalnızca küçük bir olasılıkla a = 1 - p ile görünecektir. (14.3.1)'i şu şekilde yeniden yazalım:

Eşitlik (14.3.2), p olasılığı ile parametrenin bilinmeyen değeri anlamına gelir. a aralığına düşer

Bu durumda, bir duruma dikkat edilmelidir. Önceden, rastgele bir değişkenin belirli bir rastgele olmayan aralığa düşme olasılığını tekrar tekrar düşündük. Burada durum farklıdır: a rastgele değil, rastgele aralık / r. Merkezi tarafından belirlenen, rastgele x ekseni üzerindeki konumu a; genel olarak, 2s aralığının uzunluğu da rastgeledir, çünkü s değeri kural olarak deneysel verilerden hesaplanır. Bu nedenle, bu durumda, p'nin değerini, noktayı "vurma" olasılığı olarak değil, yorumlamak daha iyi olacaktır. a/ p aralığına, ancak rastgele bir aralığın / p noktasını kapsama olasılığı olarak a(Şekil 14.3.1).

Pirinç. 14.3.1

Olasılığa p denir güven seviyesi, ve aralık / p - güven aralığı. Aralık sınırları Eğer. bir x \u003d a- kum bir 2 = bir + ve denir sınırlara güvenin.

Güven aralığı kavramına bir yorum daha verelim: parametre değerleri aralığı olarak düşünülebilir. a, deneysel verilerle uyumludur ve bunlarla çelişmez. Gerçekten de, a = 1-p olasılığı olan bir olayı pratik olarak imkansız olarak düşünmeyi kabul edersek, o zaman a parametresinin bu değerleri için bir - bir> s'nin deneysel verilerle çeliştiği kabul edilmelidir ve bunlar için |a - a bir t na 2.

parametre için izin ver a tarafsız bir tahmin var a. Miktarın dağılım yasasını bilseydik a, güven aralığını bulma sorunu oldukça basit olacaktır: için bir s değeri bulmak yeterli olacaktır.

Zorluk, tahminin dağıtım yasasının a miktar dağılımı yasasına bağlıdır X ve sonuç olarak, bilinmeyen parametrelerinde (özellikle parametrenin kendisinde) a).

Bu zorluğun üstesinden gelmek için, aşağıdaki kabaca yaklaşık hile uygulanabilir: s ifadesindeki bilinmeyen parametreleri nokta tahminleriyle değiştirin. Nispeten çok sayıda deneyle P(yaklaşık 20 ... 30) bu teknik genellikle doğruluk açısından tatmin edici sonuçlar verir.

Örnek olarak, matematiksel beklenti için güven aralığı problemini ele alalım.

Üretelim P x,özellikleri matematiksel beklenti olan t ve varyans D- Bilinmeyen. Bu parametreler için aşağıdaki tahminler elde edilmiştir:

Matematiksel beklenti için р güven olasılığına karşılık gelen bir / р güven aralığı oluşturmak gerekir. t miktarları x.

Bu problemi çözerken, nicelik gerçeğini kullanırız. t toplamı P bağımsız aynı şekilde dağılmış rastgele değişkenler X saat ve yeterince büyük için merkezi limit teoremine göre P dağılım yasası normale yakındır. Uygulamada, nispeten az sayıda terimle (10 ... 20 mertebesinde) bile, toplamın dağılım yasası yaklaşık olarak normal kabul edilebilir. değer olduğunu varsayacağız t normal yasaya göre dağıtılır. Bu yasanın özellikleri - matematiksel beklenti ve varyans - sırasıyla eşittir t ve

(bkz. bölüm 13 alt bölüm 13.3). Diyelim ki değer D bizim tarafımızdan biliniyor ve bunun için böyle bir Ep değeri bulacağız.

Bölüm 6'daki (6.3.5) formülünü uygulayarak, (14.3.5)'in sol tarafındaki olasılığı normal dağılım fonksiyonu cinsinden ifade ediyoruz.

tahminin standart sapması nerede t.

denklemden

Sp değerini bulun:

burada arg Ф* (x), Ф*'nin ters fonksiyonudur (X), onlar. normal dağılım fonksiyonunun eşit olduğu argümanın böyle bir değeri X.

Dağılım D, değerin ifade edildiği a 1P, tam olarak bilmiyoruz; yaklaşık değeri olarak, tahmini kullanabilirsiniz D(14.3.4) ve yaklaşık olarak şunu koyun:

Böylece, bir güven aralığı oluşturma sorunu yaklaşık olarak çözülür, bu şuna eşittir:

burada gp formül (14.3.7) ile tanımlanır.

Ф * (l) fonksiyonunun tablolarında s p hesaplanırken ters enterpolasyondan kaçınmak için, miktarın değerlerini listeleyen özel bir tablo (Tablo 14.3.1) derlemek uygundur.

r'ye bağlı olarak. (p) değeri, normal yasa için, ortaya çıkan alana düşme olasılığının p'ye eşit olması için dağılım merkezinin sağına ve soluna ayrılması gereken standart sapmaların sayısını belirler.

7 p değeri ile güven aralığı şu şekilde ifade edilir:

Tablo 14.3.1

Örnek 1. Değer üzerinde 20 deney yapıldı x; sonuçlar tabloda gösterilmiştir. 14.3.2.

Tablo 14.3.2

Miktarın matematiksel beklentisi için bir tahminin bulunması gerekir. X ve p = 0.8 güven düzeyine karşılık gelen bir güven aralığı oluşturun.

Karar. Sahibiz:

Köken n: = 10'u seçerek, üçüncü formüle (14.2.14) göre tarafsız tahmini buluyoruz. D :

tabloya göre 14.3.1 buluruz

Güven limitleri:

Güven aralığı:

parametre değerleri t, Bu aralıkta yer alan değerler tabloda verilen deneysel verilerle uyumludur. 14.3.2.

Benzer şekilde, varyans için bir güven aralığı oluşturulabilir.

Üretelim P rastgele bir değişken üzerinde bağımsız deneyler X ve A'dan bilinmeyen parametrelerle ve varyans için D yansız tahmin elde edilir:

Varyans için yaklaşık olarak bir güven aralığı oluşturmak gerekir.

(14.3.11) formülünden, değerin D temsil etmek

miktar P formun rastgele değişkenleri. Bu değerler değil

bağımsızdır, çünkü bunlardan herhangi biri miktarı içerir t, diğer herkese bağımlı. Ancak şu şekilde gösterilebilir: P toplamlarının dağılım yasası da normale yakındır. neredeyse P= 20...30 zaten normal kabul edilebilir.

Bunun böyle olduğunu varsayalım ve bu yasanın özelliklerini bulalım: matematiksel beklenti ve varyans. Skordan beri D- o zaman tarafsız M[D] = D.

Varyans Hesaplaması DD nispeten karmaşık hesaplamalarla ilişkilidir, bu nedenle ifadesini türetmeden veriyoruz:

nerede c 4 - miktarın dördüncü merkezi anı x.

Bu ifadeyi kullanmak için, içinde 4 ve D(en azından yaklaşık). Yerine D değerlendirmeyi kullanabilirsin D. Prensip olarak, dördüncü merkezi moment, örneğin, formun bir değeri ile tahmini ile de değiştirilebilir:

ancak böyle bir değiştirme son derece düşük bir doğruluk verecektir, çünkü genel olarak sınırlı sayıda deneyle yüksek dereceli momentler büyük hatalarla belirlenir. Bununla birlikte, pratikte genellikle miktarın dağıtım yasasının biçimi olur. Xönceden biliniyor: sadece parametreleri bilinmiyor. O zaman u4'ü şu şekilde ifade etmeye çalışabiliriz: D.

En yaygın durumu ele alalım, değer X normal yasaya göre dağıtılır. Daha sonra dördüncü merkezi momenti varyans cinsinden ifade edilir (bkz. Bölüm 6 Alt Bölüm 6.2);

ve formül (14.3.12) verir veya

(14.3.14)'de bilinmeyenin değiştirilmesi D onun değerlendirmesi D, şunu elde ederiz: nereden

u 4 momenti cinsinden ifade edilebilir D ayrıca bazı diğer durumlarda, miktarın dağılımı X normal değil ama görünüşü biliniyor. Örneğin, düzgün yoğunluk yasası için (bkz. Bölüm 5):

burada (a, P) kanunun verildiği aralıktır.

Buradan,

(14.3.12) formülüne göre şunları elde ederiz: yaklaşık olarak bulduğumuz yerden

26 değerinin dağılım yasasının formunun bilinmediği durumlarda, a /) değeri tahmin edilirken, bu yasaya inanmak için özel bir neden yoksa, formül (14.3.16) kullanılması önerilir. normal olandan çok farklıdır (farkedilir bir pozitif veya negatif basıklığı vardır).

a /)'nin yaklaşık değeri şu veya bu şekilde elde edilirse, varyans için matematiksel beklenti için oluşturduğumuzla aynı şekilde bir güven aralığı oluşturmak mümkündür:

verilen olasılığa bağlı değer p burada Tabloda bulunur. 14.3.1.

Örnek 2. Rastgele Bir Değişkenin Varyansı için Yaklaşık %80 Güven Aralığı Bulun X değerin bilindiği durumlarda örnek 1'deki koşullar altında X normale yakın bir yasaya göre dağıtılır.

Karar. Değer Tablodaki ile aynı kalır. 14.3.1:

Formüle göre (14.3.16)

(14.3.18) formülüne göre güven aralığını buluruz:

Standart sapmanın karşılık gelen değer aralığı: (0.21; 0.29).

14.4. Normal yasaya göre dağıtılan bir rastgele değişkenin parametreleri için güven aralıkları oluşturmaya yönelik kesin yöntemler

Önceki alt bölümde, ortalama ve varyans için güven aralıkları oluşturmak için kabaca yaklaşık yöntemleri düşündük. Burada aynı sorunu çözmek için kesin yöntemler hakkında bir fikir veriyoruz. Güven aralıklarını doğru bir şekilde bulmak için, miktarın dağılım yasasının biçimini önceden bilmenin kesinlikle gerekli olduğunu vurguluyoruz. x, oysa bu yaklaşık yöntemlerin uygulanması için gerekli değildir.

Güven aralıkları oluşturmak için kesin yöntemler fikri aşağıdaki gibidir. Herhangi bir güven aralığı, bize ilgi tahminini içeren bazı eşitsizliklerin gerçekleşme olasılığını ifade eden koşuldan bulunur. a. Not dağıtım yasası a genel durumda miktarın bilinmeyen parametrelerine bağlıdır x. Ancak, bazen rastgele bir değişkenden eşitsizlikleri iletmek mümkündür. a gözlemlenen değerlerin başka bir işlevine XpX2, ..., X s. dağıtım yasası bilinmeyen parametrelere bağlı değildir, ancak yalnızca deney sayısına ve miktarın dağıtım yasasının biçimine bağlıdır. x. Bu türden rastgele değişkenler matematiksel istatistiklerde büyük rol oynar; miktarın normal dağılımı durumu için en ayrıntılı şekilde incelenmiştir. x.

Örneğin, miktarın normal dağılımı altında olduğu kanıtlanmıştır. X rastgele değer

sözde tabi Öğrenci dağıtım yasası ile P- 1 serbestlik derecesi; bu yasanın yoğunluğu şu şekildedir

burada G(x) bilinen gama fonksiyonudur:

Rastgele değişken olduğu da kanıtlanmıştır.

ile "dağılım % 2" var P- yoğunluğu formülle ifade edilen 1 serbestlik derecesi (bkz. bölüm 7),

(14.4.2) ve (14.4.4) dağılımlarının türevleri üzerinde durmadan, parametreler için güven aralıkları oluşturulurken bunların nasıl uygulanabileceğini göstereceğiz. Ty D.

Üretelim P rastgele bir değişken üzerinde bağımsız deneyler x, bilinmeyen parametrelerle normal yasaya göre dağıtılır TIO. Bu parametreler için tahminler

Güven olasılığı p'ye karşılık gelen her iki parametre için güven aralıkları oluşturmak gerekir.

Önce matematiksel beklenti için bir güven aralığı oluşturalım. Bu aralığı simetrik olarak almak doğaldır. t; aralığın uzunluğunun yarısını s p ile gösterir. sp değeri, koşulun sağlanabilmesi için seçilmelidir.

Rastgele bir değişkenden eşitliğin (14.4.5) sol tarafına geçmeye çalışalım. t rastgele bir değişkene T,Öğrenci yasasına göre dağıtılır. Bunu yapmak için |m-w?| eşitsizliğinin her iki parçasını da çarpıyoruz.

pozitif bir değere: veya (14.4.1) gösterimini kullanarak,

Koşuldan / p değeri bulunacak şekilde bir / p sayısı bulalım.

Formül (14.4.2)'den (1)'in çift bir fonksiyon olduğu görülebilir, dolayısıyla (14.4.8) şunu verir:

Eşitlik (14.4.9) p'ye bağlı olarak / p değerini belirler. Elinizde bir integral değerler tablosu varsa

daha sonra / p değeri tabloda ters enterpolasyon ile bulunabilir. Bununla birlikte, önceden bir / p değerleri tablosu derlemek daha uygundur. Böyle bir tablo Ek'te verilmiştir (Tablo 5). Bu tablo, p güven olasılığına ve serbestlik derecesi sayısına bağlı değerleri gösterir. P- 1. Tabloya göre / p belirleyerek. 5 ve varsayarak

güven aralığının / p genişliğinin yarısını ve aralığın kendisini buluruz

Örnek 1. Rastgele bir değişken üzerinde 5 bağımsız deney yapıldı x, bilinmeyen parametrelerle normal dağılım t ve hakkında. Deneylerin sonuçları tabloda verilmiştir. 14.4.1.

Tablo 14.4.1

Bir tahmin bulun t matematiksel beklenti için ve bunun için% 90'lık bir güven aralığı / p oluşturun (yani, güven olasılığına karşılık gelen aralık p \u003d 0.9).

Karar. Sahibiz:

Uygulamanın tablo 5'ine göre P - 1 = 4 ve p = 0.9 buluyoruz nerede

Güven aralığı

Örnek 2. Alt bölüm 14.3'teki örnek 1'deki koşullar için, değerin varsayıldığı X normal dağılıma göre tam güven aralığını bulun.

Karar. Uygulamanın tablo 5'ine göre, şu adreste buluyoruz: P - 1 = 19ir =

0.8 / p = 1.328; buradan

Alt bölüm 14.3'ün (e p = 0.072) 1. örneğinin çözümüyle karşılaştırıldığında, tutarsızlığın çok küçük olduğunu görüyoruz. Doğruluğu ikinci ondalık basamağa kadar tutarsak, tam ve yaklaşık yöntemlerle bulunan güven aralıkları aynıdır:

Varyans için bir güven aralığı oluşturmaya devam edelim. Tarafsız varyans tahminini düşünün

ve rastgele değişkeni ifade edin D değer aracılığıyla V(14.4.3) x 2 dağılımına sahip (14.4.4):

Miktarın dağıtım yasasını bilmek V, verilen bir olasılık p ile düştüğü / (1) aralığını bulmak mümkündür.

dağıtım yasası kn _ x (v) I 7'nin değeri, şekil l'de gösterilen forma sahiptir. 14.4.1.

Pirinç. 14.4.1

Soru ortaya çıkıyor: aralık / p nasıl seçilir? Miktarın dağıtım yasası ise V simetrik olsaydı (normal bir yasa veya Student dağılımı gibi), matematiksel beklentiye göre /p aralığını simetrik olarak almak doğal olurdu. Bu durumda kanun kn _ x (v) asimetrik. /p aralığını seçmeyi kabul edelim, böylece miktarın çıktı olasılıkları V aralığın dışında sağ ve sol (Şekil 14.4.1'deki gölgeli alanlar) aynı ve eşitti

Bu özellik ile bir aralık / p oluşturmak için Tablo kullanıyoruz. 4 uygulama: sayılar içerir y)öyle ki

miktar için V, r serbestlik dereceli x 2 dağılımına sahip. bizim durumumuzda r = n- 1. Düzeltme r = n- 1 ve tablonun ilgili satırında bulun. 4 iki değer x 2 - biri bir olasılığa karşılık gelir diğeri - olasılıklar Bunları belirleyelim

değerler 2'de ve xl? aralık vardır 2 , soluyla ve sen~ sağ uç.

Şimdi, D sınırlarına sahip varyans için gereken /| güven aralığını buluyoruz ve D2, hangi noktayı kapsar D olasılık p ile:

noktayı kapsayan böyle bir / (, = (?> b A) aralığı oluşturalım. D eğer ve sadece değer V/ r aralığına düşer. aralığı olduğunu gösterelim.

bu koşulu karşılar. Gerçekten de eşitsizlikler eşitsizliklere eşittir

ve bu eşitsizlikler p olasılığı ile geçerlidir. Böylece dağılım için güven aralığı bulunur ve formül (14.4.13) ile ifade edilir.

Örnek 3. Değerin bilindiği durumlarda, alt bölüm 14.3'teki örnek 2'deki koşullar altında varyans için güven aralığını bulun. X normal olarak dağılmıştır.

Karar. Sahibiz . Uygulamanın tablo 4'üne göre

bulduğumuz r = n - 1 = 19

(14.4.13) formülüne göre dağılım için güven aralığını buluyoruz.

Standart sapma için karşılık gelen aralık: (0.21; 0.32). Bu aralık, yaklaşık yöntemle Alt Bölüm 14.3, Örnek 2'de elde edilen aralığı (0.21; 0.29) sadece biraz aşmaktadır.

  • Şekil 14.3.1, a'ya göre simetrik olan bir güven aralığını ele alır. Genel olarak, daha sonra göreceğimiz gibi, bu gerekli değildir.

Ölçülen niceliğin gerçek değerinin belirli bir aralıkta olma olasılığına denir. güven seviyesi , veya güvenilirlik faktörü, ve aralık - güven aralığı.

Her güven seviyesinin kendi güven aralığı vardır. Özellikle, 0,67'lik bir güven aralığı, ile ile arasındaki bir güven aralığına karşılık gelir. Bununla birlikte, bu ifade yalnızca yeterince büyük sayıda ölçüm (10'dan fazla) için doğrudur ve 0,67 olasılığı yeterince güvenilir görünmemektedir - yaklaşık olarak üç ölçüm serisinin her birinde y güven aralığının dışında olabilir. Ölçülen büyüklük değerinin güven aralığı içinde olduğuna dair daha fazla güven elde etmek için, genellikle 0.95 - 0.99 güven olasılığı ile belirtilir. Ölçüm sayısının etkisi dikkate alınarak, belirli bir güven düzeyi için güven aralığı n aritmetik ortalamanın standart sapması çarpılarak bulunabilir

.

Sözde Student katsayısı üzerinde. Bir dizi değer için öğrenci katsayıları ve n tabloda verilmektedir.

Tablo - Öğrenci katsayıları

Ölçüm sayısı n güven olasılığı y
0,67 0,90 0,95 0,99
2,0 6,3 12,7 63,7
1,3 2,4 3,2 5,8
1,2 2,1 2,8 4,6
1,2 2,0 2,6 4,0
1,1 1,8 2,3 3,3
1,0 1,7 2,0 2,6

Son olarak, ölçülen miktar için y belirli bir güven düzeyi için y ve ölçüm sayısı n kondisyon

miktarı arayacağız rastgele hata miktarları y.

Misal: bkz. ders numarası 5 - bir dizi sayı.

tanımlayalım

Ölçüm sayısı - 45 ve güven seviyesi - 0,95 ile Öğrenci katsayısının yaklaşık olarak 2.15'e eşit olduğunu elde ederiz. O halde bu ölçüm dizisi için güven aralığı 62.6'dır.

Kaçırma (brüt hata) - operatör hatalarıyla ilişkili veya açıklanmayan brüt hatalar dış etkiler. Genellikle ölçüm sonuçlarının dışında tutulurlar. Hatalar genellikle dikkatsizlikten kaynaklanır. Cihazın arızalanması nedeniyle de oluşabilirler.

Basit ölçümlerin büyük çoğunluğu için, sözde normal rastgele hatalar yasası oldukça iyi karşılanmaktadır ( Gauss yasası), aşağıdaki ampirik hükümlerden türetilmiştir.

1) ölçüm hataları sürekli bir dizi değer alabilir;

2) çok sayıda ölçümde, aynı büyüklükte, ancak farklı bir işarete sahip hatalar eşit sıklıkta meydana gelir,

3) Rastgele hata ne kadar büyük olursa, oluşma olasılığı o kadar düşük olur.

Normal Gauss dağılımının grafiği Şekil 1'de gösterilmiştir. Eğri denklemi şu şekildedir:

bir hata olasılığını karakterize eden rastgele hataların (hataların) dağılım fonksiyonu nerede, σ, hatanın ortalama kareköküdür.

σ değeri rastgele bir değişken değildir ve ölçüm sürecini karakterize eder. Ölçüm koşulları değişmezse, σ sabit kalır. Bu miktarın karesine denir ölçümlerin dağılımı. Dağılım ne kadar küçük olursa, bireysel değerlerin yayılması o kadar küçük ve ölçüm doğruluğu o kadar yüksek olur.

Ortalama karekök hatasının σ tam değeri ve ayrıca ölçülen miktarın gerçek değeri bilinmemektedir. Bu parametrenin, ortalama kare hatasının aritmetik ortalamanın ortalama kare hatasına eşit olduğu bir sözde istatistiksel tahmini vardır. Değeri formülle belirlenir

sonuç nerede ben-inci boyut; - elde edilen değerlerin aritmetik ortalaması; nölçüm sayısıdır.

Ölçüm sayısı ne kadar büyük olursa, o kadar küçük olur ve σ'ya o kadar yaklaşır. Ölçülen değerin gerçek değeri μ, ölçümler sonucunda elde edilen aritmetik ortalama değeri ve rastgele mutlak hata ise, ölçüm sonucu olarak yazılacaktır.

Ölçülen miktarın μ gerçek değerinin düştüğü ile arasındaki değer aralığına denir güven aralığı. Rastgele bir değişken olduğu için gerçek değer, α olasılığı olarak adlandırılan güven aralığına düşer. güven olasılığı, veya güvenilirlikölçümler. Bu değer, gölgeli eğrisel yamuğun alanına sayısal olarak eşittir. (resme bakın.)

Bütün bunlar, σ'ya yakın olduğunda, yeterince büyük sayıda ölçüm için geçerlidir. Laboratuvar çalışmaları sırasında ele aldığımız az sayıda ölçüm için güven aralığını ve güven seviyesini bulmak için kullanırız. Öğrencinin olasılık dağılımı. Bu, adı verilen rastgele bir değişkenin olasılık dağılımıdır. Öğrenci katsayısı, güven aralığının değerini aritmetik ortalamanın ortalama kare hatasının kesirleri cinsinden verir .


Bu miktarın olasılık dağılımı σ 2'ye bağlı değildir, esas olarak deney sayısına bağlıdır. n. Deney sayısı arttıkça nÖğrenci dağılımı, Gauss dağılımına eğilimlidir.

Dağıtım işlevi tablolaştırılmıştır (Tablo 1). Öğrenci katsayısının değeri, ölçüm sayısına karşılık gelen çizginin kesişme noktasındadır. n ve α güven düzeyine karşılık gelen sütun

Güvenilirlik aralığı ( ingilizce Güvenilirlik aralığı) belirli bir önem düzeyi için hesaplanan istatistiklerde kullanılan aralık tahmin türlerinden biri. Genel popülasyonun bilinmeyen bir istatistiksel parametresinin gerçek değerinin, seçilen istatistiksel anlamlılık düzeyi tarafından verilen bir olasılıkla elde edilen değerler aralığında olduğuna dair bir açıklama yapmamıza izin veriyorlar.

Normal dağılım

Veri popülasyonunun varyansı (σ 2 ) bilindiğinde, güven sınırlarını (güven aralığının sınır noktaları) hesaplamak için bir z-skoru kullanılabilir. Bir t-dağılımı kullanmakla karşılaştırıldığında, bir z-skoru kullanmak sadece daha dar bir güven aralığı sağlamakla kalmayacak, aynı zamanda Z-skoru normal bir dağılıma dayandığından, ortalama ve standart sapma (σ) hakkında daha güvenilir tahminler de sağlayacaktır.

formül

Veri popülasyonunun standart sapması biliniyorsa, güven aralığının sınır noktalarını belirlemek için aşağıdaki formül kullanılır.

L = X - Z α/2 σ
√n

Misal

Örnek boyutunun 25 gözlem olduğunu, örneklem ortalamasının 15 olduğunu ve popülasyon standart sapmasının 8 olduğunu varsayın. α=%5'lik bir anlamlılık düzeyi için Z-skoru Z α/2 =1.96'dır. Bu durumda güven aralığının alt ve üst sınırları aşağıdaki gibi olacaktır.

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1.96 8 = 18,136
√25

Böylece genel popülasyonun matematiksel beklentisinin %95 olasılıkla 11.864 ile 18.136 aralığına düşeceğini söyleyebiliriz.

Güven aralığını daraltma yöntemleri

Aralığın çalışmamızın amaçları için çok geniş olduğunu varsayalım. Güven aralığı aralığını azaltmanın iki yolu vardır.

  1. İstatistiksel anlamlılık düzeyini azaltın α.
  2. Örnek boyutunu artırın.

İstatistiksel anlamlılık düzeyini α=%10'a indirgeyerek, Z α/2 =1.64'e eşit bir Z-puanı elde ederiz. Bu durumda, aralığın alt ve üst sınırları olacaktır.

L = 15 - 1.64 8 = 12,376
√25
L = 15 + 1.64 8 = 17,624
√25

Ve güven aralığının kendisi şu şekilde yazılabilir:

Bu durumda, genel popülasyonun matematiksel beklentisinin %90 olasılıkla aralığa düşeceği varsayımını yapabiliriz.

α istatistiksel anlamlılık seviyesini korumak istiyorsak, o zaman tek alternatif örneklem büyüklüğünü artırmaktır. 144 gözleme çıkararak, aşağıdaki güven sınırlarının değerlerini elde ederiz.

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1.96 8 = 16,307
√144

Güven aralığının kendisi şöyle görünecektir:

Bu nedenle istatistiksel anlamlılık düzeyini düşürmeden güven aralığını daraltmak ancak örneklem büyüklüğünü artırmakla mümkündür. Örnek boyutunu artırmak mümkün değilse, güven aralığının daraltılması yalnızca istatistiksel anlamlılık düzeyinin azaltılmasıyla sağlanabilir.

Normal olmayan bir dağılım için bir güven aralığı oluşturma

Popülasyonun standart sapması bilinmiyorsa veya dağılım normal değilse, bir güven aralığı oluşturmak için t-dağılımı kullanılır. Bu teknik, Z-skoruna dayalı tekniğe kıyasla daha geniş güven aralıklarında ifade edilen daha tutucudur.

formül

Aşağıdaki formüller, t-dağılımına dayalı güven aralığının alt ve üst sınırlarını hesaplamak için kullanılır.

L = X - ta σ
√n

Öğrenci dağılımı veya t-dağılımı yalnızca bir parametreye bağlıdır - bireysel özellik değerlerinin sayısına eşit olan serbestlik derecesi sayısı (örnekteki gözlem sayısı). Belirli bir serbestlik derecesi (n) için Student t-testinin değeri ve istatistiksel anlamlılık düzeyi α, arama tablolarında bulunabilir.

Misal

Örnek boyutunun 25 ayrı değer olduğunu, örneğin ortalamasının 50 olduğunu ve örneğin standart sapmasının 28 olduğunu varsayın. İstatistiksel anlamlılık düzeyi α=%5 için bir güven aralığı oluşturmanız gerekir.

Bizim durumumuzda, serbestlik derecesi sayısı 24'tür (25-1), bu nedenle, istatistiksel anlamlılık düzeyi α=%5 için Student t-testinin karşılık gelen tablo değeri 2.064'tür. Bu nedenle, güven aralığının alt ve üst sınırları

L = 50 - 2.064 28 = 38,442
√25
L = 50 + 2.064 28 = 61,558
√25

Ve aralığın kendisi şu şekilde yazılabilir:

Böylece genel popülasyonun matematiksel beklentisinin %95 olasılıkla aralığında olacağını söyleyebiliriz.

Bir t-dağılımı kullanmak, istatistiksel anlamlılığı azaltarak veya örnek boyutunu artırarak güven aralığını daraltmanıza olanak tanır.

Örneğimizin koşullarında istatistiksel anlamlılığı %95'ten %90'a düşürerek, Student's t-test 1.711'in ilgili tablo değerini elde ederiz.

L = 50 - 1.711 28 = 40,418
√25
L = 50 + 1.711 28 = 59,582
√25

Bu durumda genel popülasyonun matematiksel beklentisinin %90 olasılıkla aralığında olacağını söyleyebiliriz.

İstatistiksel anlamlılığı azaltmak istemiyorsak, tek alternatif örneklem büyüklüğünü arttırmaktır. Diyelim ki, örneğin ilk koşulundaki gibi 25 değil, 64 bireysel gözlem. Student's t-testinin 63 serbestlik derecesi (64-1) ve istatistiksel anlamlılık düzeyi α=5 için tablo değeri 1.998'dir.

L = 50 - 1.998 28 = 43,007
√64
L = 50 + 1.998 28 = 56,993
√64

Bu bize, genel popülasyonun matematiksel beklentisinin %95 olasılıkla aralıkta olacağını iddia etme fırsatı verir.

Büyük Örnekler

Büyük örnekler, genel veri popülasyonundan örnekleri içerir, sayı bireysel gözlemler 100'den büyük. İstatistiksel çalışmalar, popülasyonun dağılımı normal olmasa bile daha büyük örneklerin normal dağılma eğiliminde olduğunu göstermiştir. Ek olarak, bu tür örnekler için, z-skorlarının ve t-dağılımlarının kullanılması, güven aralıkları oluşturulurken yaklaşık olarak aynı sonuçları verir. Bu nedenle, büyük örnekler için, normal dağılım için t-dağılımı yerine z-skorunun kullanılması kabul edilebilir.

Özetliyor