NEW | |||||||||||||||||||||||||||
ISBN 83-208-1107-4 str. 85 Czas produkcji 5 losowo wybranych sztuk wyrobu (w sek.) kształtował się następująco: 5,1; 4,9; 4,8; 5,3; 4,9. 1. Przyjmując współczynnik ufności na poziomie 0,98, oszacować wariancję czasu produkcji ogółu wytwarzanych wyrobów.2. Jak zmieni się długość oszacowanego przedziału, gdy współczynnik ufności zmniejszymy do poziomu 0,90?1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?Po przeczytaniu całego zadania zwracamy uwagę na zdania: 1. Przyjmując współczynnik ufności na poziomie 0,98, oszacować wariancję czasu produkcji ogółu wytwarzanych wyrobów. 2. Jak zmieni się długość oszacowanego przedziału, gdy współczynnik ufności zmniejszymy do poziomu 0,90? Występują tu charakterystyczne dla tej grupy zadań zwroty: oszacować, oszacowanego przedziału i współczynnik ufności - w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej. W podpunkcie pierwszym podamy przedział ufności dla współczynnika ufności 0,98, a podpunkcie drugim dla 0,90 i na koniec porównamy długość obydwu przedziałów. 2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.Analizujemy zdanie po zdaniu. Czas produkcji 5 losowo wybranych sztuk wyrobu (w sek.) kształtował się następująco: 5,1; 4,9; 4,8; 5,3; 4,9. Od razu uzyskujemy informację, że wylosowaliśmy próbę, a jej liczebność to sztuk i od tego momentu będziemy stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji. Podano również informacje o konkretnych wynikach z próby. Jeżeli dysponujemy wartościami wypisanymi po przecinku tzw. danymi indywidualnymi, to zawsze możemy policzyć średnią , wariancję i odchylenie standardowe (lub , ). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach. 1. Przyjmując współczynnik ufności na poziomie 0,98, oszacować wariancję czasu produkcji ogółu wytwarzanych wyrobów. Podano też współczynnik ufności . Od razu wyznaczamy . 2. Jak zmieni się długość oszacowanego przedziału, gdy współczynnik ufności zmniejszymy do poziomu 0,90? W drugiej części zadania wartość współczynnika ufności zmniejszymy do , a więc . Podsumowując tworzymy przejrzystą tabelę z danymi:
- współczynnik ufności, - współczynnik ufności po zmianie, 3. WYBÓR ODPOWIEDNIEGO WZORU.Szukamy parametru, który należy oszacować przedziałem ufności i wyłapujemy słowo: 1. Przyjmując współczynnik ufności na poziomie 0,98, oszacować wariancję czasu produkcji ogółu wytwarzanych wyrobów. Słowo wariancja oznacza, że będziemy budować przedział ufności oczywiście dla wariancji z populacji. Spójrzmy w kartę wzorów. Dla wariancji mamy do wyboru dwa modele. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby. nie jest znana , a liczebność próby jest mniejsza od 30 , zatem wybieramy model I . W danych nie ma ani , więc nie ma znaczenia, którą wersję wzoru wybierzemy. Z reguły interesuje nas pierwsza wersja wzoru z wybranego modelu.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.Wracamy do danych z tabeli i uzupełniamy wzór konkretnymi danymi. Jak widać brakuje tylko , więc dopóki nie znajdziemy wartości tego parametru nie możemy obliczyć końcówek przedziału ufności dla wariancji. Wyliczanie wariacji z próby jest zagadnieniem ze statystki opisowej. Dysponujemy danymi indywidualnymi (wynikami wypisanymi po przecinku), jest ich niewiele i powtarzają się w niewielkim stopniu (tylko dwa razy 4,9), zatem wariację liczymy ze wzoru związanego z danymi indywidualnymi: lub (obie wersje są równoważne, w praktyce pierwsza wersja jest częściej używana). Teraz okazuje się, że w formule pozwalającej wyznaczyć wariancję potrzebna jest wartość średnia , więc to od niej należy zacząć obliczenia. Wzór na średnią z danych indywidualnych wygląda następująco: . Oczywiście na chłopski rozum średnią można policzyć sumując wszystkie dane, a potem dzieląc przez ilość – jest to jak najbardziej prawidłowe rozwiązanie, a podany wzór oznacza to samo. Jednak zdaję sobie sprawę, że widząc „hieroglify” tego typu wiele osób nie wie co robić, a tym bardziej jak je rozpisywać :). Mając to na uwadze postaram się przybliżyć kwestię podobnych oznaczeń rozpisując je na czynniki pierwsze. Znak to symbol sumy. Pod nim znajduje się zapis , a nad nim , to wartości kolejnych obserwacji. Wszytko razem oznacza, że będziemy dodawać kolejne obserwacje oznaczone symbolem , gdzie będzie rosło od aż do wartości , a więc :
Tak więc średnia po rozpisaniu wygląda następująco:
Teraz przełożymy wszystko na dane z zadania. Liczebność próby wynosi , a więc wzór na średnią możemy zapisać następująco:
Czym jest ? Są to konkretne wyniki z próby, a więc . Jeśli ktoś chciałby uporządkować dane indywidualne od najmniejszej do największej, może to spokojnie wykonać. Porządkowanie liczb nie wpływa na wartość średniej, także może zostać tak jak jest. A więc np. . Obliczamy średnią:
Dysponując wartością liczbową średniej możemy obliczyć wariancję . Rozpisanie wzoru wykonujemy analogicznie jak w przypadku średniej. Na początek ogólnie:
i dla :
Możemy już podstawiać liczby za , ale proponuję utworzyć tabelkę i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru jest długim tasiemcem i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na wariancję z danych indywidualnych, a jej nagłówki zawsze wyglądają tak samo. Na początku od każdej wartości odejmujemy średnią, a następnie wynik podnosimy do kwadratu. Sumujemy ostatnią kolumnę (przecięcie wiersza z symbolem i daje kompletny licznik wzoru na wariancję ).
A więc Wracamy do istoty zadania i wreszcie uzupełniamy wzór . Ad. 1) Najpierw szacujemy przedział ufności dla wariancji przy współczynniku ufności równym , :
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka (grecka litera czyt. chi ), zatem skorzystamy z tablic rozkładu chi-kwadrat (link). W tym przypadku będziemy odczytywać statystykę dwukrotnie, ponieważ w uzupełnionym wzorze występują dwa nieco różniące się symbole: oraz . Zapis oznacza konieczność odnalezienia w tablicach statystyki dla i 4 stopni swobody:
Z kolei zapis oznacza konieczność odnalezienia w tablicach statystyki dla i 4 stopni swobody:
Wracamy do obliczeń i podstawiamy oraz :
Ad. 2) Następnie szacujemy przedział ufności dla wariancji przy współczynniku ufności równym , (inne dane pozostają oczywiście bez zmian):
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka (grecka litera czyt. chi ), zatem skorzystamy z tablic rozkładu chi-kwadrat (link). W tym przypadku będziemy odczytywać statystykę dwukrotnie, ponieważ w uzupełnionym wzorze występują dwa nieco różniące się symbole: oraz . Zapis oznacza konieczność odnalezienia w tablicach statystyki dla i 4 stopni swobody:
Z kolei zapis oznacza konieczność odnalezienia w tablicach statystyki dla i 4 stopni swobody:
Wracamy do obliczeń i podstawiamy oraz :
5. WYNIK I INTERPRETACJA.Ad. 1) Ostatecznie otrzymujemy: Interpretacja brzmi następująco: Z ufnością 0,98 nieznana wariancja czasu produkcji ogółu wytwarzanych wyrobów mieści się w przedziale od 0,012 do 0,539 (sek.) 2 . Ad. 2) Ostatecznie otrzymujemy: Interpretacja brzmi następująco: Z ufnością 0,90 nieznana wariancja czasu produkcji ogółu wytwarzanych wyrobów mieści się w przedziale od 0,017 do 0,225 (sek.) 2 . W obu przypadkach powstała dziwna jednostka - (sekundy) 2 , ale w przypadku wariancji (jednostka podniesiona do kwadratu) nie jest to nic nadzwyczajnego i nie należy na to zwracać większej uwagi. Przyjęło się zresztą, że samej wariancji się nie interpretuje, ale już odchylenie standardowe, które jest pierwiastkiem z wariacji - jak najbardziej. Porównując otrzymane wyniki można stwierdzić, że po zmniejszeniu współczynnika ufności z 0,98 do 0,90 długość przedziału ufności uległa zmniejszeniu, co można przedstawić graficznie:
|
|||||||||||||||||||||||||||