NEW | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
ISBN 83-7011-783-X str.276 Dokonano badań drogowych 30 samochodów FSO 1500 pod względem osiąganej prędkości maksymalnej. Wyniki były następujące:
Oszacować metodą przedziałową wariancję prędkości maksymalnej na poziomie ufności 0,9 (zakładamy, że rozkład prędkości maksymalnej jest normalny). 1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?Po przeczytaniu całego zadania zwracamy uwagę na zdanie: Oszacować metodą przedziałową wariancję prędkości maksymalnej na poziomie ufności 0,9 (zakładamy, że rozkład prędkości maksymalnej jest normalny). Występują tu charakterystyczne dla tej grupy zadań zwroty: oszacować metodą przedziałową i poziom ufności - w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej. 2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.Analizujemy zdanie po zdaniu. Dokonano badań drogowych 30 samochodów FSO 1500 pod względem osiąganej prędkości maksymalnej. Od razu uzyskujemy informację, że wylosowaliśmy próbę, ponieważ badamy określoną ilość samochodów. Liczebność próby to i od tego momentu będziemy stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji. Wyniki były następujące:
Podano również wyniki z próby w tabeli. Jeżeli dysponujemy danymi dotyczącymi próby ujętymi w tabeli, to zawsze możemy policzyć średnią , wariancję i odchylenie standardowe (lub , ). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach. Oszacować metodą przedziałową wariancję prędkości maksymalnej na poziomie ufności 0,9 (zakładamy, że rozkład prędkości maksymalnej jest normalny). Podano też współczynnik ufności . Od razu wyznaczamy . W tym zdaniu występuje również założenie normalności rozkładu prędkości maksymalnej i to już odnosi się do populacji (wcześniej wspominałam w części teoretycznej, że próba jest z reguły za mała aby stwierdzić rozkład normalny). Nie mamy informacji na temat tego rozkładu, zatem możemy tylko zapisać - rozkład normalny o nieznanej średniej i nieznanym odchyleniu standardowym . Podsumowując tworzymy przejrzystą tabelę z danymi:
- współczynnik ufności, 3. WYBÓR ODPOWIEDNIEGO WZORU.Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo: Oszacować metodą przedziałową wariancję prędkości maksymalnej na poziomie ufności 0,9 (zakładamy, że rozkład prędkości maksymalnej jest normalny). Słowo wariancja oznacza, że będziemy budować przedział ufności oczywiście dla wariancji z populacji. Spójrzmy w kartę wzorów. Dla wariancji mamy do wyboru dwa modele. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby. nie jest znana , a liczebność próby może nie jest mniejsza od 30, ale dokładnie równa 30 , zatem wybieramy model I . W danych nie ma ani , więc nie ma znaczenia, którą wersję wzoru wybierzemy. Z reguły interesuje nas pierwsza wersja wzoru z wybranego modelu.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.Wracamy do danych z tabeli i uzupełniamy wzór konkretnymi danymi. Jak widać brakuje tylko , więc dopóki nie znajdziemy wartości tego parametru nie możemy obliczyć końcówek przedziału ufności dla wariancji. Wyliczanie wariacji z próby jest zagadnieniem ze statystki opisowej. Dysponujemy danymi tabelarycznymi, gdzie warianty cechy (prędkość maksymalna) są w formie przedziałów tzn. od jednej wartości do drugiej wartości. Taki szereg określa się szeregiem rozdzielczym przedziałowym. Przeredagujmy zatem tabelę z zadania właśnie na tą postać szeregu.
W przypadku szeregu rozdzielczego przedziałowego nie ma możliwości pomyłki do tego, co jest wariantem cechy, a co liczebnością , ponieważ nie zdarza się, aby było zapisane w formie przedziałów. Symbol to po prostu ogólny zapis przedziału lewostronnie domkniętego i prawostronnie otwartego (chyba najczęściej używany – chociaż zależy od preferencji prowadzącego). Należy pilnować, aby końcówka każdego przedziału była początkiem następnego. W tabeli z zadania mamy właśnie przedstawioną sytuację , (kończymy przedział na 140, następny również zaczynamy od 140), itd. w związku z tym nie musimy nic zmieniać, zachowana jest ciągłość. Wzór na wariancję z danych szeregu przedziałowego wygląda następująco: . Jest też alternatywa , ale będziemy używać pierwszej wersji. Okazuje się, że do policzenia wariancji i tak niezbędna jest średnia. W szeregu przedziałowym średnią liczymy ze wzoru . Na początku wyjaśnijmy symbol . Oznacza on środek każdego z podanych przedziałów, a obliczany jest na podstawie formuły . Upraszczając, należy zsumować początek i koniec każdego przedziału i wynik podzielić na dwa. Wracamy do wzoru na średnią. Znak oznacza sumę. Pod tym symbolem znajduje się zapis , a nad nim , to środki kolejnych przedziałów , a liczebności dla kolejnych przedziałów. Wszystko razem oznacza, że będziemy sumować kolejne iloczyny , gdzie będzie rosło od aż do wartości , czyli , a więc ogólnie:
W naszym przypadku znad znaku sumy oznacza liczbę przedziałów klasowych (ilość wierszy w tabeli z danymi). Tak więc średnia będzie miała uproszczony wzór: = Czym jest , oraz ? Wszystko to zostanie pokazane dokładnie w tabeli. Obliczmy w niej również środki poszczególnych przedziałów.
Uzupełniając wzór średniej dla otrzymujemy: = i oczywiście możemy uzupełnić go danymi z tabeli, ale proponuję nadal korzystać z tabeli i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższy niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na średnią z szeregu przedziałowego, a jej nagłówki zawsze wyglądają tak samo. Każdą wartość mnożymy przez odpowiadającą jej wartość , a następnie sumujemy powstałe iloczyny. Przecięcie wiersza z symbolem i kolumny daje kompletny licznik wzoru na średnią.
Dysponujemy wartością średniej, zatem możemy wrócić do obliczania wariancji. Rozpiszemy wzór analogicznie jak w przypadku średniej. Najpierw ogólnie:
i dla :
Tu też można podstawiać dane z tabeli, ale ponownie proponuję trzymać się obliczeń tabelarycznych. Można kontynuować poprzednią tabelę dopisując kolejne kolumny. Znowu krok po kroku będziemy tworzyć licznik ze wzoru. Dopisana pierwsza kolumna - od każdego środka przedziału odejmujemy wcześniej wyliczoną średnią , druga kolumna to podniesienie wyników z poprzedniej do kwadratu. Ostatnia to wymnożenie wyników z drugiej przez odpowiadające im wartości i dopiero ona jest sumowana (przecięcie wiersza z symbolem i daje kompletny licznik wzoru na wariancję).
Wracamy do istoty zadania i wreszcie uzupełniamy wzór :
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka (grecka litera czyt. chi ), zatem skorzystamy z tablic rozkładu chi-kwadrat (link). W tym przypadku będziemy odczytywać statystykę dwukrotnie, ponieważ w uzupełnionym wzorze występują dwa nieco różniące się symbole: oraz . Zapis oznacza konieczność odnalezienia w tablicach statystyki dla i 29 stopni swobody:
Z kolei zapis oznacza konieczność odnalezienia w tablicach statystyki dla i 29 stopni swobody:
Wracamy do obliczeń i podstawiamy oraz :
5. WYNIK I INTERPRETACJA.Ostatecznie otrzymujemy: Interpretacja brzmi następująco: Z ufnością 0,9 nieznana wariancja prędkości maksymalnej samochodów FSO 1500 mieści się w przedziale od 52,40 do 125,93 (km/godz.) 2 . Powstała dziwna jednostka - (km/godz.) 2 , ale w przypadku wariancji (jednostka podniesiona do kwadratu) nie jest to nic nadzwyczajnego i nie należy na to zwracać większej uwagi. Przyjęło się zresztą, że samej wariancji się nie interpretuje, ale już odchylenie standardowe, które jest pierwiastkiem z wariacji - jak najbardziej. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||