NEW | ||||||||||
ISBN 83-208-1107-4 str. 76 W wyniku analizy miesięcznych wydatków na żywność w przeliczeniu na jedną osobę w losowo wybranych gospodarstwach domowych pracowników i rolników w 2002 r. ustalono, co następuje (dane w zł): gospodarstwa pracowników: , , , gospodarstwa rolników: , , . Przyjmując współczynnik ufności 0,98 oszacować przedziałowo wariancję wydatków na żywność ogółu gospodarstw pracowniczych i rolniczych. 1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?Po przeczytaniu całego zadania zwracamy uwagę na zdanie: Przyjmując współczynnik ufności 0,98 oszacować przedziałowo wariancję wydatków na żywność ogółu gospodarstw pracowniczych i rolniczych. Występują tu charakterystyczne dla tej grupy zadań zwroty: oszacować przedziałowo i współczynnik ufności - w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej. 2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.Analizujemy zdanie po zdaniu. W wyniku analizy miesięcznych wydatków na żywność w przeliczeniu na jedną osobę w losowo wybranych gospodarstwach domowych pracowników i rolników w 2002 r. ustalono, co następuje (dane w zł): gospodarstwa pracowników: , , , gospodarstwa rolników: , , . Od razu zaczyna się opis próby, ponieważ pojawia się informacja na temat wylosowania konkretnej ilości gospodarstw pracowniczych i rolników, ale uwaga - mamy do czynienia z dwiema oddzielnymi próbami. Jedną z nich stanowią gospodarstwa pracownicze, a drugą rolnicze. W tym przypadku nie ma żadnych wątpliwości co do oznaczeń parametrów, ponieważ są już podane. Pierwsza próba, czyli gospodarstwa pracowników liczy osób. Średnia dla próby gospodarstw pracowników wynosi , a odchylenie standardowe . Analogicznie druga próba, czyli gospodarstwa rolnicze liczy osób, a jej średnia wynosi oraz odchylenie standardowe . Przyjmując współczynnik ufności 0,98 oszacować przedziałowo wariancję wydatków na żywność ogółu gospodarstw pracowniczych i rolniczych. Podano współczynnik ufności, tak więc . Od razu wyznaczamy . Podsumowując tworzymy przejrzystą tabelę z danymi:
- współczynnik ufności, 3. WYBÓR ODPOWIEDNIEGO WZORU.Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo: Przyjmując współczynnik ufności 0,98 oszacować przedziałowo wariancję wydatków na żywność ogółu gospodarstw pracowniczych i rolniczych. Słowo wariancja oznacza, że będziemy budować przedział ufności oczywiście dla wariancji z populacji. Spójrzmy w kartę wzorów. Dla wariancji mamy do wyboru dwa modele. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby. z żadnej populacji nie jest znana , a łączna liczebność próby jest mniejsza od 30 , zatem wybieramy model I . W danych występuje i , także interesuje nas pierwsza wersja wzoru z wybranego modelu.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.Wracamy do danych z tabeli i uzupełniamy wzór konkretnymi danymi. Niestety na tym etapie pojawia się problem, ponieważ w danych znajdują się dwa oddzielne odchylenia standardowe i (lub wariancje i ), a do formuły należy wstawić , czyli łączną wariancję dla obu prób (w końcu trzeba zbudować przedział ufności dla wariacji dla całości gospodarstw pracowniczych i rolników). Poszczególnych wariancji nie wolno po prostu zsumować, jak to zrobiono z próbami . Aby obliczyć wariancję dla zbiorowości składającej się z kilku prób należy zastosować tzw. wariancję ogólną inaczej zwaną równością wariancyjną . Wzór na równość wariancyjną wygląda następująco: , gdzie: - wariacja wewnątrzgrupowa wyrażona wzorem , rozumiana jako średnia arytmetyczna wariacji wewnątrzgrupowych - wariancja zewnątrzgrupowa wyrażona wzorem , rozumiana jako wariacja średnich z prób Na początek zajmiemy się wariancją wewnątrzgrupową i wyjaśnimy symbole zawarte w tym wzorze. Znak oznacza sumę. Pod tym symbolem znajduje się zapis , a nad nim r , to wariancje kolejnych prób, a to liczebności tych prób. Wszytko razem oznacza, że będziemy sumować kolejne iloczyny , gdzie będzie rosło od aż do wartości , czyli , a więc ogólnie:
Wariacja wewnątrzgrupowa po rozpisaniu wygląda następująco:
W naszym przypadku mamy dwie próby (gospodarstwa pracowników i rolników), a więc , zatem wzór wygląda tak:
Oczywiście obliczenia można przeprowadzać w tabeli, ale stworzenie tabeli dla dwóch prób zajmie nam więcej czasu niż zwyczajne podstawienie do wzoru. Wracamy do danych i otrzymujemy:
Teraz kolej na wariancję zewnątrzgrupową . Jak widać we wzorze znajduje się symbol - jest to łączna średnia prób tzw. średnia średnich. W związku z tym musimy najpierw wyliczyć , a później zabierzemy się za wariancję zewnątrzgrupową. Wzór na średnią średnich wygląda następująco: . Rozpisanie analogiczne jak w przypadku poprzedniej formuły. Znak oznacza sumę. Pod tym symbolem znajduje się zapis , a nad nim , to średnie kolejnych próbek, a to liczebności poszczególnych prób. Wszytko razem oznacza, że będziemy sumować kolejne iloczyny , gdzie będzie rosło od aż do wartości , czyli , a więc ogólnie:
Średnia średnich prezentuje się zatem następująco:
W naszym przypadku mamy dwie próby (gospodarstwa pracowników i rolników), a więc , zatem wzór wygląda tak:
Podstawiając dane z tabeli otrzymujemy:
Uprzedzam, że liczenie średniej średnich poprzez dodanie obu średnich i podzielenie na dwa jest NIEPRAWIDŁOWE! Jest to możliwe wyłącznie w przypadku, gdzie liczebności poszczególnych grup są jednakowe. Dla różnych liczebności próbek stosuje się powyższy wzór. To zasada dotyczy również wariacji wewnątrzgrupowej. Wracamy do wariancji zewnątrzgrupowej . I znów rozpisanie wzoru jak wcześniej. Znak oznacza sumę. Pod tym symbolem znajduje się zapis , a nad nim , to średnie kolejnych próbek, a to liczebności poszczególnych prób. Wszytko razem oznacza, że będziemy od każdej średniej z próby odejmować średnią średnich, otrzymaną różnicę podnosimy następnie do kwadratu i wymnażamy przez liczebność danej próby. Na koniec sumujemy powstałe wyniki , gdzie będzie rosło od aż do wartości , czyli , a więc ogólnie:
Wariancja zewnątrzgrupowa:
W naszym przypadku mamy dwie próby (gospodarstwa pracowników i rolników), a więc , zatem wzór wygląda tak:
Podstawiając dane z tabeli otrzymujemy:
Możemy wreszcie wyliczyć wariację ogólną . Wracamy do istoty zadania i uzupełniamy wzór :
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka (grecka litera czyt. chi ), zatem skorzystamy z tablic rozkładu chi-kwadrat (link). W tym przypadku będziemy odczytywać statystykę dwukrotnie, ponieważ w uzupełnionym wzorze występują dwa nieco różniące się symbole: oraz . Zapis oznacza konieczność odnalezienia w tablicach statystyki dla i 27 stopni swobody:
Z kolei zapis oznacza konieczność odnalezienia w tablicach statystyki dla i 27 stopni swobody:
Wracamy do obliczeń i podstawiamy oraz :
5. WYNIK I INTERPRETACJA.Ostatecznie otrzymujemy: Interpretacja brzmi następująco: Z ufnością 0,98 nieznana wariancja wydatków na żywność ogółu gospodarstw pracowniczych i rolniczych mieści się w przedziale od 6937,4629 do 25297,3110 (zł) 2 . Powstała dziwna jednostka - (zł) 2 , ale w przypadku wariancji (jednostka podniesiona do kwadratu) nie jest to nic nadzwyczajnego i nie należy na to zwracać większej uwagi. Przyjęło się zresztą, że samej wariancji się nie interpretuje, ale już odchylenie standardowe, które jest pierwiastkiem z wariancji - jak najbardziej. |
||||||||||