Zadanie 37

Wytrzymałość pewnego materiału budowlanego (w kg/cm2) jest zmienną losową o rozkładzie . W celu oszacowania nieznanej średniej wytrzymałości tego materiału dokonano pomiaru wytrzymałości 5 wylosowanych niezależnie sztuk tego materiału. Wyniki pomiarów były następujące: 20,4; 19,6; 22,1; 20,8; 21,1.

1. Przyjmując współczynnik ufności 0,90, zbudować przedział ufności dla średniej wytrzymałości badanego materiału budowlanego.

2. O ile zmieni się długość oszacowanego przedziału, jeśli liczebność próby zwiększymy do 45 elementów?

3. Jak zmieni się precyzja oszacowania, jeśli wielkość współczynnika ufności zwiększymy do 0,95?

W celu zachowania przejrzystości każdy z podpunktów będzie wykonany oddzielnie.

Ad. 1

1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?

Po przeczytaniu całego zadania zwracamy uwagę na zdanie:

„Przyjmując współczynnik ufności 0,90, zbudować przedział ufności dla średniej wytrzymałości badanego materiału budowlanego.”

Mamy tu zwroty: zbudować przedział ufności i współczynnik ufności- w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej.

2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.

Analizujemy zdanie po zdaniu.

„Wytrzymałość pewnego materiału budowlanego (w kg/cm2) jest zmienną losową o rozkładzie .”

Dowiadujemy się, że wytrzymałość pewnego materiału budowlanego jest cechą o rozkładzie normalnym i to już odnosi się do populacji (wcześniej wspominałam w części teoretycznej, że próba jest z reguły za mała aby stwierdzić rozkład normalny). Ponadto możemy odczytać jeden z parametrów rozkładu tzn. odchylenie standardowe dla populacji i ostatecznie zapisać jako rozkład normalny o nieznanej średniej i znanym odchyleniu standardowym .

„W celu oszacowania nieznanej średniej wytrzymałości tego materiału dokonano pomiaru wytrzymałości 5 wylosowanych niezależnie sztuk tego materiału.”

W tym momencie wiemy, że wybrano próbę, a jej liczebność to i w związku z tym będziemy stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji. Podano również informacje o konkretnych wynikach z próby. Jeżeli dysponujemy wartościami wypisanymi po przecinku tzw. danymi indywidualnymi, to zawsze możemy policzyć średnią , wariancję i odchylenie standardowe (lub , ). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach.

„Przyjmując współczynnik ufności 0,90, zbudować przedział ufności dla średniej wytrzymałości badanego materiału budowlanego.”

Na końcu podano współczynnik ufności . Od razu wyznaczamy .

Podsumowując tworzymy przejrzystą tabelę z danymi:

POPULACJA

materiał budowlany

PRÓBA

5 wybranych sztuk materiału budowlanego

- rozkład normalny o nieznanej średniej i odchyleniu standardowym

- dane indywidualne (można obliczyć średnią , wariancję , odchylenie standardowe )

- współczynnik ufności,

3. WYBÓR ODPOWIEDNIEGO WZORU.

Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:

„Przyjmując współczynnik ufności 0,90, zbudować przedział ufności dla średniej wytrzymałości badanego materiału budowlanego.”

Wyrażenie średniej oznacza, że będziemy budować przedział ufności dla wartości średniej z populacji.

Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby. jest znana i tylko model I jest odpowiedni. Liczebność próby nie jest w ogóle istotna.

4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.

Wracamy do danych w tabeli i uzupełniamy wzór konkretnymi liczbami. Jak widać potrzebujemy średniej z próby . W związku z tym, zanim zajmiemy się uzupełnianiem właściwego wzoru należy obliczyć (na razie) nieznany parametr. Liczenie średniej jest zagadnieniem ze statystyki opisowej. Dysponujemy danymi indywidualnymi (wypisanymi po przecinku), jest ich niewiele i nie powtarzają się - zatem średnią liczymy ze wzoru . Oczywiście na chłopski rozum średnią można policzyć sumując wszystkie dane, a potem dzieląc przez ilość – i jest to jak najbardziej prawidłowe rozwiązanie, a ten wzór oznacza to samo. Jednak zdaję sobie sprawę, że widząc „hieroglify” tego typu wiele osób nie wie co robić, a tym bardziej jak je rozpisywać :). Mając to na uwadze postaram się przybliżyć kwestię wzorów rozpisując je na czynniki pierwsze.

Znak oznacza sumę. Pod tym symbolem znajduje się zapis , a nad nim , to wartości kolejnych obserwacji. Wszytko razem oznacza, że będziemy sumować kolejne obserwacje oznaczone symbolem , gdzie będzie rosło od aż do wartości , a więc .

Tak więc średnia będzie miała uproszczony wzór:

Teraz przełożymy wszystko na dane z zadania. Liczebność próby wynosi , a więc wzór na średnią możemy zapisać następująco:

Czym jest ? To są konkretne wyniki z próby, a więc . Jeśli ktoś chciałby uporządkować dane indywidualne od najmniejszej do największej, może to spokojnie zrobić. Porządkowanie liczb nie wpływa na wynik, także może zostać tak jak jest. A więc .

Obliczamy średnią:

Wracamy do istoty zadania i wreszcie uzupełniamy wzór :

Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka u, zatem skorzystamy z tablic rozkładu normalnego. Zapis oznacza konieczność odnalezienia statystyki dla .

Czytanie z tablic rozkładu normalnego nie jest trudne. Sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. W przypadku sumujemy i czyli .

Wracamy do obliczeń i podstawiamy (zaokrąglanie to indywidualna sprawa wynikająca najczęściej z preferencji prowadzącego)

5. WYNIK I INTERPRETACJA.

Ostatecznie otrzymujemy: .

Interpretacja brzmi następująco:

Z ufnością 0,90 średnia wytrzymałość badanego materiału budowlanego mieści się w przedziale od 20,07 kg/cm2 do 21,53 kg/cm2.

Ad. 2

Na początku ustalimy przedział ufności dla liczebności próby elementów. Zakładamy, że reszta danych nie ulega zmianie i nadal budujemy przedział ufności dla średniej . Sprawdźmy zatem, czy wzór na estymację pozostanie bez zmian. Nadal znamy , ponieważ , więc pozostajemy przy formule z modelu I: , liczebność próby nie wpływa na wybór.

Uzupełniamy wybrany wzór:

również wartość statystyki odczytana w poprzednim podpunkcie nie ulega zmianie.

Znamy już przedział po zmianie liczebności próby, ale pytanie w zadaniu dotyczy zmiany długości przedziału.

Na początek przypomnienie na zwykłych liczbach. Weźmy przykładowo przedział i naszkicujmy go na osi.

Aby obliczyć długość przedziału należy od końcówki odjąć jego początek, a więc .

Teraz policzmy długość przedziału z podpunktu pierwszego dla , czyli :

Długość przed zmianą:

Analogicznie długość przedziału po zmianie liczebności próby do , czyli :

Długość po zmianie:

Ja widać długość przedziału uległa skróceniu z 1,46 do 0,48, a to oznacza , że 3-krotnie.

Ad. 3

Na początku ustalimy precyzję oszacowania dla poziomu ufności . Aby porównać precyzję oszacowania po zmianie poziomu ufności do poziomu próby najlepiej posłużyć się względną precyzją szacunku, ponieważ porównywanie wielkości wyrażonych w procentach jest najbezpieczniejsze.

Względną precyzję oszacowania wartości oczekiwanej określamy wzorem: , gdzie (bezwzględny błąd szacunku) jest wielkością odejmowaną i dodawaną do średniej , a w związku z tym, że wybraliśmy w pierwszym podpunkcie dla formułę na estymację średniej: , to wygląda tak:

czyli . Powtarzam jeszcze raz, że formuła na obliczenie zależy od wzoru wybranego na przedział ufności, ale zawsze jest to wielkość odejmowana i dodawana do średniej .

Uzupełniamy wzór:

Uzupełniamy odczytane wcześniej

I względny błąd szacunku , czyli: .

Teraz policzmy względną precyzję szacunku dla - . Musimy się jednak upewnić, czy wzór na bezwzględny błąd szacunku nie ulegnie zmianie. Na wybór formuły dotyczącej estymacji ma wpływ jedynie znajomość i ewentualnie liczebność próby – a to pozostało bez zmian. Wybór innego współczynnika ufności nie wpływa na wybór wzoru, a więc pozostajemy przy i .

Obliczamy :

Symbol u oznacza konieczność odczytania odpowiedniej statystyki z tablic rozkładu normalnego.

Wracamy do obliczeń i podstawiamy (zaokrąglanie to indywidualna sprawa wynikająca najczęściej z preferencji prowadzącego):

I względny błąd szacunku , czyli: .

Precyzja oszacowania zmalała o punktu procentowego lub jeśli ktoś się uprze może policzyć o ile procent wzrósł bezwzględny błąd szacunku (od 19,5% do 20,5% w zależności od zaokrąglania). Coś tu jednak się nie zgadza, prawda? Przecież po zwiększeniu współczynnika ufności z 0,90 do 0,95 otrzymaliśmy większą liczbę i na chłopski rozum względna precyzja uległa zwiększeniu. Z względną precyzją szacunku jest tak, że im większa wartość liczbowa otrzymana w wyniku tym gorsza precyzja oszacowania. Jeśli interpretuje się względną precyzję szacunku to wartość poniżej 5% mówi nam, że wnioskowanie o parametrze (w tym przypadku ) jest uprawnione i całkowicie bezpieczne, jeżeli mieści się od 5% do 10% wnioskowanie jest możliwe, ale z zalecaną ostrożnością, a jeśli przekracza 10% wnioskowanie jest niewiarygodne i należy je przerwać. Uzyskiwanie niezadowalającej (powyżej 5%, a tym bardziej powyżej 10%) względnej precyzji szacunku może być spowodowane zbyt wysokim współczynnikiem ufności, zbyt małą liczebnością próby oraz wysokim zróżnicowaniem wyników w próbie (np. duży rozstrzał danych).

Zadanie pochodzi z: Statystyka zbiór zadań / Helena Kassyk-Rokicka. - Polskie Wydawnictwo Ekonomiczne - ISBN 83-208-1107-4