NEW | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
ISBN 978-83-01-13819-6 str.147 Celem oszacowania stopnia zróżnicowania masy jaj produkowanych przez farmera J dokonano pomiaru masy 15 jaj, otrzymując następujące wyniki (dokładność do 1 g): 62, 56, 71, 58, 60, 66, 67, 70, 70, 72, 60, 57, 56, 65, 70. Przyjmując współczynnik ufności 0,90; oszacować metodą przedziałową wariancję masy jaj wyprodukowanych przez farmera J . 1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?Po przeczytaniu całego zadania zwracamy uwagę na zdanie: Przyjmując współczynnik ufności 0,90; oszacować metodą przedziałową wariancję masy jaj wyprodukowanych przez farmera J. Występują tu charakterystyczne dla tej grupy zadań zwroty: oszacować metodą przedziałową i współczynnik ufności - w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej. 2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.Analizujemy zdanie po zdaniu. Celem oszacowania stopnia zróżnicowania masy jaj produkowanych przez farmera J dokonano pomiaru masy 15 jaj, otrzymując następujące wyniki (dokładność do 1 g): 62, 56, 71, 58, 60, 66, 67, 70, 70, 72, 60, 57, 56, 65, 70. Od razu uzyskujemy informację, że wylosowaliśmy próbę, a jej liczebność to jaj i od tego momentu będziemy stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji. Podano również informacje o konkretnych wynikach z próby. Jeżeli dysponujemy wartościami wypisanymi po przecinku tzw. danymi indywidualnymi, to zawsze możemy policzyć średnią , wariancję i odchylenie standardowe (lub , ). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach. Przyjmując współczynnik ufności 0,90; oszacować metodą przedziałową wariancję masy jaj wyprodukowanych przez farmera J. Podano też współczynnik ufności . Od razu wyznaczamy . Podsumowując tworzymy przejrzystą tabelę z danymi:
- współczynnik ufności, 3. WYBÓR ODPOWIEDNIEGO WZORU.Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo: Przyjmując współczynnik ufności 0,90; oszacować metodą przedziałową wariancję masy jaj wyprodukowanych przez farmera J. Słowo wariancja oznacza, że będziemy budować przedział ufności oczywiście dla wariancji z populacji. Spójrzmy w kartę wzorów. Dla wariancji mamy do wyboru dwa modele. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby. nie jest znana , a liczebność próby jest mniejsza od 30 , zatem wybieramy model I . W danych nie ma ani , więc nie ma znaczenia, którą wersję wzoru wybierzemy. Z reguły interesuje nas pierwsza wersja wzoru z wybranego modelu.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.Wracamy do danych z tabeli i uzupełniamy wzór konkretnymi danymi. Jak widać brakuje tylko , więc dopóki nie znajdziemy wartości tego parametru nie możemy obliczyć końcówek przedziału ufności dla wariancji. Wyliczanie wariacji z próby jest zagadnieniem ze statystki opisowej. Dysponujemy danymi indywidualnymi (wypisanymi po przecinku) i możemy korzystać ze wzorów dotyczących danych indywidualnych (podobnie jak w kilku poprzednich zadaniach). Zastanówmy się jednak, czy w tym zadaniu będzie to wygodne. Danych jest dość dużo, bo aż i widać, że kilka liczb powtarza się. Wobec tego wygodniej będzie je posegregować w szereg punktowy tzn. wykonać tabelę, w której podliczymy ilości poszczególnych obserwacji.
Wzór na wariancję z danych szeregu punktowego wygląda następująco: . Jest też alternatywa , ale będziemy używać pierwszej wersji. Jak widać do policzenia wariancji i tak niezbędna jest średnia . W szeregu punktowym średnią liczymy ze wzoru . Objaśnijmy go. Znak oznacza sumę. Pod tym symbolem znajduje się zapis , a nad nim , to wartości kolejnych obserwacji, a liczebności dla tych obserwacji. Wszytko razem oznacza, że będziemy sumować kolejne iloczyny, gdzie będzie rosło od aż do wartości , a więc , czyli ogólnie:
W naszym przypadku znad znaku sumy oznacza liczbę klas (ilość wierszy w tabeli z danymi, ilość wariantów obserwacji). Tak więc średnia będzie miała uproszczony wzór:
Czym jest , oraz ? Wszystko to pokażmy dokładnie w tabeli:
Uzupełniając wzór dla i otrzymujemy:
Oczywiście możemy uzupełnić go danymi z tabeli, ale proponuję nadal korzystać z tabeli i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru jest długi i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na średnią z szeregu punktowego, a jej nagłówki zawsze wyglądają tak samo. Każdą wartość mnożymy przez odpowiadającą mu wartość , a następnie sumujemy powstałe iloczyny. Przecięcie wiersza z symbolem i kolumny daje kompletny licznik wzoru na średnią.
Dysponując wartością liczbową średniej możemy obliczyć wariancję . Rozpisanie wzoru wykonujemy analogicznie jak w przypadku średniej. Na początek ogólnie:
i dla oraz :
Wzór został podzielony na dwie części z przyczyn technicznych, tak długi ułamek nie zmieści się na stronie :). Tu też można podstawiać dane z tabeli, ale ponownie proponuję trzymać się obliczeń tabelarycznych. Można kontynuować poprzednią tabelę dopisując kolejne kolumny. Znowu krok po kroku będziemy tworzyć licznik ze wzoru. Dopisana pierwsza kolumna - od każdej wariantu cechy odejmujemy wcześniej wyliczoną średnią , druga kolumna to podniesienie wyników z poprzedniej do kwadratu. Ostatnia to wymnożenie wyników z drugiej przez odpowiadające im wartości i dopiero ona jest sumowana (przecięcie wiersza z symbolem i daje kompletny licznik wzoru na wariancję).
A więc Wracamy do istoty zadania i wreszcie uzupełniamy wzór :
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka (grecka litera czyt. chi ), zatem skorzystamy z tablic rozkładu chi-kwadrat (link). W tym przypadku będziemy odczytywać statystykę dwukrotnie, ponieważ w uzupełnionym wzorze występują dwa nieco różniące się symbole: oraz . Zapis oznacza konieczność odnalezienia w tablicach statystyki dla i 14 stopni swobody.
Z kolei zapis oznacza konieczność odnalezienia w tablicach statystyki dla i 14 stopni swobody:
Wracamy do obliczeń i podstawiamy oraz :
5. WYNIK I INTERPRETACJA.Ostatecznie otrzymujemy: Interpretacja brzmi następująco: Z ufnością 0,90 nieznana wariancja masy jaj wyprodukowanych przez farmera J mieści się w przedziale od 20,43 do 73,66 (gram) 2 . Powstała dziwna jednostka - (gramy) 2 , ale w przypadku wariancji (jednostka podniesiona do kwadratu) nie jest to nic nadzwyczajnego i nie należy na to zwracać większej uwagi. Przyjęło się zresztą, że samej wariancji się nie interpretuje, ale już odchylenie standardowe, które jest pierwiastkiem z wariacji - jak najbardziej. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||