NEW | |||||||||||||||||||||||||||||||||
ISBN 978-83-7252-474-4 str.172 Spośród czteroosobowych rodzin mieszkających w pewnym regionie wylosowano 7 rodzin i zapytano o miesięczne zużycie energii elektrycznej (w kWh). Odpowiedzi utworzyły następujący szereg: 282, 300, 295, 297, 299, 305, 308. Przyjmując, że miesięczne zużycie energii elektrycznej jest zmienną losową podlegającą rozkładowi normalnemu, oszacować metodą przedziałową wariancję miesięcznego zużycia w populacji rodzin czteroosobowych, przyjmując współczynnik ufności równy 0,95. 1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?Po przeczytaniu całego zadania zwracamy uwagę na zdanie: Przyjmując, że miesięczne zużycie energii elektrycznej jest zmienną losową podlegającą rozkładowi normalnemu, oszacować metodą przedziałową wariancję miesięcznego zużycia w populacji rodzin czteroosobowych, przyjmując współczynnik ufności równy 0,95. Występują tu charakterystyczne dla tej grupy zadań zwroty: oszacować metodą przedziałową i współczynnik ufności - w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej. 2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.Analizujemy zdanie po zdaniu. Spośród czteroosobowych rodzin mieszkających w pewnym regionie wylosowano 7 rodzin i zapytano o miesięczne zużycie energii elektrycznej (w kWh). Od razu uzyskujemy informację, że wylosowaliśmy próbę, a jej liczebność to rodzin i od tego momentu będziemy stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji. Odpowiedzi utworzyły następujący szereg: 282, 300, 295, 297, 299, 305, 308. Podano również informacje o konkretnych wynikach z próby. Jeżeli dysponujemy wartościami wypisanymi po przecinku tzw. danymi indywidualnymi, to zawsze możemy policzyć średnią , wariancję i odchylenie standardowe (lub , ). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach. Przyjmując, że miesięczne zużycie energii elektrycznej jest zmienną losową podlegającą rozkładowi normalnemu, oszacować metodą przedziałową wariancję miesięcznego zużycia w populacji rodzin czteroosobowych, przyjmując współczynnik ufności równy 0,95. W tym zdaniu występuje założenie normalności rozkładu miesięcznego zużycia energii i to już odnosi się do populacji (wcześniej wspominałam w części teoretycznej, że próba jest z reguły za mała aby stwierdzić rozkład normalny). Nie mamy informacji na temat tego rozkładu, zatem możemy tylko przepisać - rozkład normalny o nieznanej średniej i nieznanym odchyleniu standardowym . Podano też współczynnik ufności . Od razu wyznaczamy . Podsumowując tworzymy przejrzystą tabelę z danymi:
- współczynnik ufności, 3. WYBÓR ODPOWIEDNIEGO WZORU.Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo: Przyjmując, że miesięczne zużycie energii elektrycznej jest zmienną losową podlegającą rozkładowi normalnemu, oszacować metodą przedziałową wariancję miesięcznego zużycia w populacji rodzin czteroosobowych, przyjmując współczynnik ufności równy 0,95. Słowo wariancja oznacza, że będziemy budować przedział ufności oczywiście dla wariancji z populacji. Spójrzmy w kartę wzorów. Dla wariancji mamy do wyboru dwa modele. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby. nie jest znana , a liczebność próby jest mniejsza od 30 , zatem wybieramy model I . W danych nie ma ani , więc nie ma znaczenia, którą wersję wzoru wybierzemy. Z reguły interesuje nas pierwsza wersja wzoru z wybranego modelu.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.Wracamy do danych z tabeli i uzupełniamy wzór konkretnymi danymi. Jak widać brakuje tylko , więc dopóki nie znajdziemy wartości tego parametru nie możemy obliczyć końcówek przedziału ufności dla wariancji. Wyliczanie wariacji z próby jest zagadnieniem ze statystki opisowej. Dysponujemy danymi indywidualnymi (wynikami wypisanymi po przecinku), jest ich niewiele i nie powtarzają się, zatem wariację liczymy ze wzoru związanego z danymi indywidualnymi: lub (obie wersje są równoważne, w praktyce pierwsza wersja jest częściej używana). Teraz okazuje się, że w formule pozwalającej wyznaczyć wariancję potrzebna jest wartość średnia , więc to od niej należy zacząć obliczenia. Wzór na średnią z danych indywidualnych wygląda następująco: . Oczywiście na chłopski rozum średnią można policzyć sumując wszystkie dane, a potem dzieląc przez ilość – jest to jak najbardziej prawidłowe rozwiązanie, a podany wzór oznacza to samo. Jednak zdaję sobie sprawę, że widząc „hieroglify” tego typu wiele osób nie wie co robić, a tym bardziej jak je rozpisywać :). Mając to na uwadze postaram się przybliżyć kwestię podobnych oznaczeń rozpisując je na czynniki pierwsze. Znak to symbol sumy. Pod nim znajduje się zapis , a nad nim , to wartości kolejnych obserwacji. Wszytko razem oznacza, że będziemy dodawać kolejne obserwacje oznaczone symbolem , gdzie będzie rosło od aż do wartości , a więc :
Tak więc średnia po rozpisaniu wygląda następująco:
Teraz przełożymy wszystko na dane z zadania. Liczebność próby wynosi , a więc wzór na średnią możemy zapisać następująco:
Czym jest ? Są to konkretne wyniki z próby, a więc . Jeśli ktoś chciałby uporządkować dane indywidualne od najmniejszej do największej, może to spokojnie wykonać. Porządkowanie liczb nie wpływa na wartość średniej, także może zostać tak jak jest. A więc np. . Obliczamy średnią:
Dysponując wartością liczbową średniej możemy obliczyć wariancję . Rozpisanie wzoru wykonujemy analogicznie jak w przypadku średniej. Na początek ogólnie:
i dla :
Możemy już podstawiać liczby za , ale proponuję utworzyć tabelkę i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższym tasiemcem niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na wariancję z danych indywidualnych, a jej nagłówki zawsze wyglądają tak samo. Na początku od każdej wartości odejmujemy średnią, a następnie wynik podnosimy do kwadratu. Sumujemy ostatnią kolumnę (przecięcie wiersza z symbolem i daje kompletny licznik wzoru na wariancję )
A więc Wracamy do istoty zadania i wreszcie uzupełniamy wzór :
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka (grecka litera czyt. chi ), zatem skorzystamy z tablic rozkładu chi-kwadrat (link). W tym przypadku będziemy odczytywać statystykę dwukrotnie, ponieważ w uzupełnionym wzorze występują dwa nieco różniące się symbole: oraz . Zapis oznacza konieczność odnalezienia w tablicach statystyki dla i 6 stopni swobody:
Z kolei zapis oznacza konieczność odnalezienia w tablicach statystyki dla i 6 stopni swobody:
Wracamy do obliczeń i podstawiamy oraz :
5. WYNIK I INTERPRETACJA.Ostatecznie otrzymujemy: Interpretacja brzmi następująco: Z ufnością 0,95 nieznana wariancja miesięcznego zużycia energii w populacji czteroosobowych rodzin mieszkających w pewnym regionie mieści się w przedziale od 29,07 do 339,53 (kWh) 2 . Powstała dziwna jednostka - (kWh) 2 , ale w przypadku wariancji (jednostka podniesiona do kwadratu) nie jest to nic nadzwyczajnego i nie należy na to zwracać większej uwagi. Przyjęło się zresztą, że samej wariancji się nie interpretuje, ale już odchylenie standardowe, które jest pierwiastkiem z wariacji - jak najbardziej. |
|||||||||||||||||||||||||||||||||