ISBN 83-208-1107-4 str. 75

Audiometryczne badanie ubytku słuchu wybranych losowo pracowników dwóch wydziałów zakładu hutniczego (stalowni i walcowni) dostarczyło następujących informacji (dane w decybelach):

- dla 15-osobowej grupy pracowników walcowni otrzymano następujące wyniki: 53, 38, 47, 27, 34, 17, 69, 54, 35, 29, 62, 60, 30, 29, 59,

- w 10-osobowej grupie pracowników stalowni średni ubytek słuchu wynosi 38, a odchylenie standardowe 14,2.

Zakładając, że rozkłady ubytku słuchu w obu populacjach są zgodne z rozkładem normalnym, przy współczynniku ufności równym 0,90, zbudować przedział ufności dla wariancji ubytku słuchu wszystkich pracowników obu wydziałów.

1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?

Po przeczytaniu całego zadania zwracamy uwagę na zdanie:

Występują tu charakterystyczne dla tej grupy zadań zwroty: zbudować przedział ufności i współczynnik ufności - w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej.

2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.

Analizujemy zdanie po zdaniu.

Audiometryczne badanie ubytku słuchu wybranych losowo pracowników dwóch wydziałów zakładu hutniczego (stalowni i walcowni) dostarczyło następujących informacji (dane w decybelach):

- dla 15-osobowej grupy pracowników walcowni otrzymano następujące wyniki: 53, 38, 47, 27, 34, 17, 69, 54, 35, 29, 62, 60, 30, 29, 59,

- w 10-osobowej grupie pracowników stalowni średni ubytek słuchu wynosi 38, a odchylenie standardowe 14,2.

Od razu zaczyna się opis próby, ponieważ pojawia się informacja na temat wylosowania konkretnej ilości pracowników zakładu hutniczego, ale uwaga - mamy do czynienia z dwiema oddzielnymi próbami. Jedną z nich stanowią pracownicy walcowni, a drugą - pracownicy stalowni. Pierwsza próba, czyli pracownicy walcowni liczy Estymacja wariancji - obraz numer 2091 osób. Podano również informacje o konkretnych wynikach z próby. Jeżeli dysponujemy wartościami wypisanymi po przecinku tzw. danymi indywidualnymi, to zawsze możemy policzyć średnią , wariancję i odchylenie standardowe Estymacja wariancji - obraz numer 2094 (lub , ). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach. Druga próba, czyli gospodarstwa rolnicze liczy Estymacja wariancji - obraz numer 2097 osób, a jej średnia wynosi oraz odchylenie standardowe (oczywiście użyto oznaczeń parametrów dla próby).

W tym zdaniu występuje założenie normalności rozkładów ubytku słuchu i to zawsze odnosi się do populacji (wcześniej wspominałam w części teoretycznej, że próba jest z reguły za mała aby stwierdzić rozkład normalny, poza tym pojawia wyraźnie się słowo populacja). Nie mamy informacji na temat tych rozkładów, zatem możemy tylko zapisać Estymacja wariancji - obraz numer 2100 oraz - rozkłady normalne o nieznanej średnich oraz i nieznanych odchyleniach standardowych oraz . Podano również współczynnik ufności, tak więc . Od razu wyznaczamy .

Podsumowując tworzymy przejrzystą tabelę z danymi:

POPULACJA ogół pracowników dwóch wydziałów zakładu hutniczego		PRÓBA wybrani pracownicy
pracownicy walcowni - rozkład normalny o nieznanej średniej i nieznanym odchyleniu standardowym	pracownicy stalowni - rozkład normalny o nieznanej średniej i nieznanym odchyleniu standardowym	pracownicy walcowni , - dane indywidualne (można obliczyć średnią , wariancję , odchylenie standardowe )	pracownicy stalowni
		łączna liczebność próby:

Estymacja wariancji - obraz numer 2123 - współczynnik ufności,

3. WYBÓR ODPOWIEDNIEGO WZORU.

Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:

Zakładając, że rozkłady ubytku słuchu w obu populacjach są zgodne z rozkładem normalnym, przy współczynniku ufności równym 0,90, zbudować przedział ufności dla wariancji ubytku słuchu wszystkich pracowników obu wydziałów.

Słowo wariancja oznacza, że będziemy budować przedział ufności oczywiście dla wariancji z populacji.

Spójrzmy w kartę wzorów. Dla wariancji mamy do wyboru dwa modele. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby. z żadnej populacji nie jest znana , a łączna liczebność próby Estymacja wariancji - obraz numer 2128 jest mniejsza od 30 , zatem wybieramy model I . W danych z drugiej próby występuje , a możemy obliczyć, ponieważ dysponujemy danymi indywidualnymi z drugiej próby, także interesuje nas pierwsza wersja wzoru z wybranego modelu.

Estymacja wariancji - obraz numer 2132

4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.

Wracamy do danych z tabeli i uzupełniamy wzór Estymacja wariancji - obraz numer 2133 konkretnymi danymi.

Niestety na tym etapie pojawia się problem, ponieważ w danych znajdują się dwa oddzielne odchylenia standardowe Estymacja wariancji - obraz numer 2134 (które można obliczyć) i (lub wariancje i ), a do formuły należy wstawić , czyli łączną wariancję dla obu prób (w końcu trzeba zbudować przedział ufności dla wariacji dla całości pracowników dwóch wydziałów zakładu hutniczego). Poszczególnych wariancji nie wolno po prostu zsumować, jak to zrobiono z próbami Estymacja wariancji - obraz numer 2139 .

Aby obliczyć wariancję dla zbiorowości składającej się z kilku prób należy zastosować tzw. wariancję ogólną inaczej zwaną równością wariancyjną .

Wzór na równość wariancyjną wygląda następująco: Estymacja wariancji - obraz numer 2140 , gdzie:

Estymacja wariancji - obraz numer 2141 - wariacja wewnątrzgrupowa wyrażona wzorem , rozumiana jako średnia arytmetyczna wariacji wewnątrzgrupowych

Estymacja wariancji - obraz numer 2143 - wariancja zewnątrzgrupowa wyrażona wzorem , rozumiana jako wariacja średnich z prób

Na początek zajmiemy się wariancją wewnątrzgrupową Estymacja wariancji - obraz numer 2145 i wyjaśnimy symbole zawarte w tym wzorze.

Znak Estymacja wariancji - obraz numer 2146 oznacza sumę. Pod tym symbolem znajduje się zapis , a nad nim r , to wariancje kolejnych prób, a to liczebności tych prób. Wszytko razem oznacza, że będziemy sumować kolejne iloczyny , gdzie będzie rosło od Estymacja wariancji - obraz numer 2152 aż do wartości , czyli , a więc ogólnie:

Estymacja wariancji - obraz numer 2155

Wariacja wewnątrzgrupowa po rozpisaniu wygląda następująco:

Estymacja wariancji - obraz numer 2156

W naszym przypadku mamy dwie próby (pracownicy walcowni i stalowni), a więc Estymacja wariancji - obraz numer 2157 , zatem wzór wygląda tak:

Estymacja wariancji - obraz numer 2158

Jak widać brakuje tylko Estymacja wariancji - obraz numer 2159 , więc dopóki nie znajdziemy wartości tego parametru nie możemy obliczyć wartości wariancji wewnątrzgrupowej. Wyliczanie wariacji z próby jest zagadnieniem ze statystki opisowej.

Dysponujemy danymi indywidualnymi (wynikami wypisanymi po przecinku), jest ich niewiele i praktycznie nie powtarzają się, zatem wariację liczymy ze wzoru związanego z danymi indywidualnymi: Estymacja wariancji - obraz numer 2160 lub (obie wersje są równoważne, w praktyce pierwsza wersja jest częściej używana). Teraz okazuje się, że w formule pozwalającej wyznaczyć wariancję potrzebna jest wartość średnia , więc to od niej należy zacząć obliczenia.

Wzór na średnią z danych indywidualnych wygląda następująco: Estymacja wariancji - obraz numer 2164 . Oczywiście na chłopski rozum średnią można policzyć sumując wszystkie dane, a potem dzieląc przez ilość – jest to jak najbardziej prawidłowe rozwiązanie, a podany wzór oznacza to samo. Jednak zdaję sobie sprawę, że widząc „hieroglify” tego typu wiele osób nie wie co robić, a tym bardziej jak je rozpisywać :). Mając to na uwadze postaram się przybliżyć kwestię podobnych oznaczeń rozpisując je na czynniki pierwsze.

Znak Estymacja wariancji - obraz numer 2166 to symbol sumy. Pod nim znajduje się zapis , a nad nim , to wartości kolejnych obserwacji. Wszytko razem oznacza, że będziemy dodawać kolejne obserwacje oznaczone symbolem , gdzie będzie rosło od Estymacja wariancji - obraz numer 2172 aż do wartości , a więc :

Estymacja wariancji - obraz numer 2175

Tak więc średnia po rozpisaniu wygląda następująco:

Estymacja wariancji - obraz numer 2176

Teraz przełożymy wszystko na dane z zadania. Liczebność próby wynosi Estymacja wariancji - obraz numer 2178 , a więc wzór na średnią możemy zapisać następująco:

Estymacja wariancji - obraz numer 2179

Czym jest Estymacja wariancji - obraz numer 2181 ? Są to konkretne wyniki z próby, a więc . Jeśli ktoś chciałby uporządkować dane indywidualne od najmniejszej do największej, może to spokojnie wykonać. Porządkowanie liczb nie wpływa na wartość średniej, także może zostać tak jak jest. A więc np. Estymacja wariancji - obraz numer 2183 .

Obliczamy średnią:

Estymacja wariancji - obraz numer 2184

Dysponując wartością liczbową średniej możemy obliczyć wariancję Estymacja wariancji - obraz numer 2186 . Rozpisanie wzoru wykonujemy analogicznie jak w przypadku średniej. Na początek ogólnie:

Estymacja wariancji - obraz numer 2187

i dla Estymacja wariancji - obraz numer 2188 :

Estymacja wariancji - obraz numer 2189

Estymacja wariancji - obraz numer 2190

Możemy już podstawiać liczby za Estymacja wariancji - obraz numer 2191 , ale proponuję utworzyć tabelkę i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru jest tasiemcem i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na wariancję z danych indywidualnych, a jej nagłówki zawsze wyglądają tak samo. Na początku od każdej wartości Estymacja wariancji - obraz numer 2192 odejmujemy średnią, a następnie wynik podnosimy do kwadratu. Sumujemy ostatnią kolumnę (przecięcie wiersza z symbolem i daje kompletny licznik wzoru na wariancję )

















(suma)

A więc Estymacja wariancji - obraz numer 2245

Wracamy do wzoru na wariancję wewnątrzgrupową Estymacja wariancji - obraz numer 2246 i podstawiamy dane:

Oczywiście obliczenia można przeprowadzać w tabeli, ale stworzenie tabeli dla dwóch prób zajmie nam więcej czasu niż zwyczajne podstawienie do wzoru. Wracamy do danych i otrzymujemy:

Estymacja wariancji - obraz numer 2247

Teraz kolej na wariancję zewnątrzgrupową Estymacja wariancji - obraz numer 2248 . Jak widać we wzorze znajduje się symbol - jest to łączna średnia prób tzw. średnia średnich. W związku z tym musimy najpierw wyliczyć , a później zabierzemy się za wariancję zewnątrzgrupową. Wzór na średnią średnich wygląda następująco: Estymacja wariancji - obraz numer 2251 .

Rozpisanie analogiczne jak w przypadku poprzedniej formuły. Znak Estymacja wariancji - obraz numer 2252 oznacza sumę. Pod tym symbolem znajduje się zapis , a nad nim , to średnie kolejnych próbek, a to liczebności poszczególnych prób. Wszytko razem oznacza, że będziemy sumować kolejne iloczyny , gdzie Estymacja wariancji - obraz numer 2258 będzie rosło od aż do wartości , czyli , a więc ogólnie:

Estymacja wariancji - obraz numer 2262

Średnia średnich prezentuje się zatem następująco:

Estymacja wariancji - obraz numer 2263

W naszym przypadku mamy dwie próby (pracownicy walcowni i stalowni), a więc Estymacja wariancji - obraz numer 2264 , zatem wzór wygląda tak:

Estymacja wariancji - obraz numer 2265

Podstawiając dane z tabeli i wyliczoną po drodze Estymacja wariancji - obraz numer 2266 otrzymujemy:

Estymacja wariancji - obraz numer 2267

Uprzedzam, że liczenie średniej średnich poprzez dodanie obu średnich i podzielenie na dwa jest NIEPRAWIDŁOWE! Jest to możliwe wyłącznie w przypadku, gdzie liczebności poszczególnych grup są jednakowe. Dla różnych liczebności próbek stosuje się powyższy wzór. To zasada dotyczy również wariacji wewnątrzgrupowej.

Wracamy do wariancji zewnątrzgrupowej Estymacja wariancji - obraz numer 2268 . I znów rozpisanie wzoru jak wcześniej. Znak oznacza sumę. Pod tym symbolem znajduje się zapis , a nad nim , to średnie kolejnych próbek, a to liczebności poszczególnych prób. Wszytko razem oznacza, że będziemy od każdej średniej z próby odejmować średnią średnich, otrzymaną różnicę podnosimy następnie do kwadratu i wymnażamy przez liczebność danej próby. Na koniec sumujemy powstałe wyniki Estymacja wariancji - obraz numer 2274 , gdzie będzie rosło od aż do wartości , czyli , a więc ogólnie:

Estymacja wariancji - obraz numer 2279

Wariancja zewnątrzgrupowa:

Estymacja wariancji - obraz numer 2280

W naszym przypadku mamy dwie próby (pracownicy walcowni i stalowni), a więc Estymacja wariancji - obraz numer 2281 , zatem wzór wygląda tak:

Estymacja wariancji - obraz numer 2282

Podstawiając dane z tabeli otrzymujemy:

Estymacja wariancji - obraz numer 2283

Możemy wreszcie wyliczyć wariację ogólną Estymacja wariancji - obraz numer 2284 .

Wracamy do istoty zadania i uzupełniamy wzór Estymacja wariancji - obraz numer 2285 :

Estymacja wariancji - obraz numer 2286

Estymacja wariancji - obraz numer 2287

Estymacja wariancji - obraz numer 2288

Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka Estymacja wariancji - obraz numer 2289 (grecka litera czyt. chi ), zatem skorzystamy z tablic rozkładu chi-kwadrat (link). W tym przypadku będziemy odczytywać statystykę dwukrotnie, ponieważ w uzupełnionym wzorze występują dwa nieco różniące się symbole: oraz Estymacja wariancji - obraz numer 2291 . Zapis oznacza konieczność odnalezienia w tablicach statystyki dla i 24 stopni swobody:

Estymacja wariancji - obraz numer 2294

Z kolei zapis Estymacja wariancji - obraz numer 2295 oznacza konieczność odnalezienia w tablicach statystyki dla i 24 stopni swobody:

Estymacja wariancji - obraz numer 2297

Wracamy do obliczeń i podstawiamy Estymacja wariancji - obraz numer 2298 oraz :

Estymacja wariancji - obraz numer 2300

5. WYNIK I INTERPRETACJA.

Ostatecznie otrzymujemy: Estymacja wariancji - obraz numer 2301

Interpretacja brzmi następująco: Z ufnością 0,90 nieznana wariancja ubytku słuchu wszystkich pracowników obu wydziałów mieści się w przedziale od 154,8964 do 407,3189 (decybeli) ² .

Powstała dziwna jednostka - (decybele) ² , ale w przypadku wariancji (jednostka podniesiona do kwadratu) nie jest to nic nadzwyczajnego i nie należy na to zwracać większej uwagi. Przyjęło się zresztą, że samej wariancji się nie interpretuje, ale już odchylenie standardowe, które jest pierwiastkiem z wariancji - jak najbardziej.