NEW | ||||||||||||||||||||||||||
Waga opakowań kawy (w dag) ma rozkład normalny. Kontrola wybranych losowo 5 opakowań dała następujące wyniki: 10,2; 10,1; 9,8; 9,9; 10,0. Ile co najmniej torebek kawy należy pobrać do próby, aby przy współczynniku ufności równym 0,99 oszacować średnią wagę ogółu opakowań kawy, otrzymując przedział o długości nieprzekraczającej 0,2 dag? 1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE MINIMALNEJ LICZEBNOŚCI PRÓBY?Po przeczytaniu całego zadania zwracamy uwagę zdanie: “ Ile co najmniej torebek kawy należy pobrać do próby, aby przy współczynniku ufności równym 0,99 oszacować średnią wagę ogółu opakowań kawy, otrzymując przedział o długości nieprzekraczającej 0,2 dag? ” Na początku może się wydawać, że zadanie dotyczy estymacji przedziałowej, ponieważ pojawia się zwrot: przedział o długości ... . Niemniej jednak przewagę nad tym wyrażeniem zawsze ma: ile co najmniej torebek kawy należy pobrać do próby ... , czyli szukamy minimalnej liczebności próby. Odnajdujemy również wyrażenie: współczynnik ufności . Co prawda nie ma ani słowa o maksymalnym błędzie szacunku, ale jest on ukryty w zadaniu pod innym szyldem. Biorąc pod uwagę wszystkie słowa-klucze mamy na pewno do czynienia z zadaniem dotyczącym minimalnej liczebności próby. 2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.Czytamy zdanie po zdaniu. Waga opakowań kawy (w dag) ma rozkład normalny . W tym zdaniu występuje założenie normalności rozkładu wagi opakowań kawy i to już odnosi się do populacji (wcześniej wspominałam w części teoretycznej, że próba jest z reguły za mała aby stwierdzić rozkład normalny). Nie mamy informacji na temat tego rozkładu, zatem możemy tylko zapisać - rozkład normalny o nieznanej średniej i nieznanym odchyleniu standardowym . Kontrola wybranych losowo 5 opakowań dała następujące wyniki: 10,2; 10,1; 9,8; 9,9; 10,0. Wydaje się dziwne, że w zadaniu, którego istotą jest znalezienie liczebności próby podaje się właśnie to, czego szukamy - a więc liczebność próby. Nie ma powodu do niepokoju - jest to liczebność próby wstępnej tzw. pilotażowej, którą oznaczamy . Podano również informacje o konkretnych wynikach z próby. Jeżeli dysponujemy wartościami wypisanymi po przecinku tzw. danymi indywidualnymi, to zawsze możemy policzyć średnią , wariancję i odchylenie standardowe (lub , ). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach. “ Ile co najmniej torebek kawy należy pobrać do próby, aby przy współczynniku ufności równym 0,99 oszacować średnią wagę ogółu opakowań kawy, otrzymując przedział o długości nieprzekraczającej 0,2 dag? ” Szukamy liczebności próby (liczba torebek kawy), którą oznaczamy literą . Podano również współczynnik ufności, a więc . Od razu wyznaczamy . Jak pamiętamy, w zadaniach dotyczących minimalnej liczebności próby ważnym elementem jest wartość maksymalnego błędu szacunku . Zamiast tego dowiadujemy się, że przedział ufności powinien mieć długość nieprzekraczającą 0,2 dag. Warto zapamiętać, że maksymalny błąd szacunku to połowa przedziału ufności. Jeśli informacja ta wydaje się być zbyt lakoniczna, odsyłam do szerszego wytłumaczenia http://matma-po-ludzku.pl/statystyka/wnioskowanie/estymacja/estymacja_sredniej/zadanie29.php . Otrzymujemy zatem . Podsumowując tworzymy przejrzystą tabelę z danymi:
- współczynnik ufności, 3. WYBÓR ODPOWIEDNIEGO WZORU.Spójrzmy w kartę wzorów. Dla minimalnej liczebności próby mamy do wyboru pięć modeli. Teraz wracamy do danych i na początku sprawdzamy, czy jest znana. Stwierdzamy, że nie jest znana , zatem wykluczamy model I. Ponadto wiemy, że mamy do czynienia z próbą pilotażową, której liczebność jest mniejsza niż 30 ( ). Dysponując danymi indywidualnymi jesteśmy w stanie wyliczyć lub - wobec tego wybieramy model II . Którą wersję wzoru wybierzemy, zależy od nas. Znacznie częściej używana jest wersja z (z daszkiem), więc i ja wybiorę tą wersję.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.Wracamy do danych z tabeli i uzupełniamy wzór konkretnymi liczbami. Jak widać brakuje tylko , więc dopóki nie znajdziemy wartości tego parametru nie możemy obliczyć liczebności próby właściwej. Wyliczanie wariancji z próby jest zagadnieniem ze statystki opisowej. Dysponujemy danymi indywidualnymi (wynikami wypisanymi po przecinku), jest ich niewiele i nie powtarzają się, zatem wariancję nieobciążoną liczymy ze wzoru związanego z danymi indywidualnymi: lub (obie wersje są równoważne, w praktyce pierwsza wersja jest częściej używana). Po określeniu wzoru na okazuje się, że w formule pozwalającej wyznaczyć wariancję potrzebna jest wartość średnia , więc to od niej należy zacząć obliczenia. Wzór na średnią z danych indywidualnych wygląda następująco: . Oczywiście na chłopski rozum średnią można policzyć sumując wszystkie dane, a potem dzieląc przez ilość – jest to jak najbardziej prawidłowe rozwiązanie, a podany wzór oznacza to samo. Jednak zdaję sobie sprawę, że widząc „hieroglify” tego typu wiele osób nie wie co robić, a tym bardziej jak je rozpisywać :). Mając to na uwadze postaram się przybliżyć kwestię podobnych oznaczeń rozpisując je na czynniki pierwsze. Znak to symbol sumy. Pod nim znajduje się zapis , a nad nim , to wartości kolejnych obserwacji. Wszytko razem oznacza, że będziemy dodawać kolejne obserwacje oznaczone symbolem , gdzie będzie rosło od aż do wartości , a więc :
Tak więc średnia po rozpisaniu wygląda następująco:
Teraz przełożymy wszystko na dane z zadania. Liczebność próby wynosi , a więc wzór na średnią możemy zapisać następująco:
Czym jest ? Są to konkretne wyniki z próby, a więc . Jeśli ktoś chciałby uporządkować dane indywidualne od najmniejszej do największej, może to spokojnie wykonać. Porządkowanie liczb nie wpływa na wartość średniej, także może zostać tak jak jest. A więc np. . Obliczamy średnią:
Dysponując wartością liczbową średniej możemy obliczyć wariancję . Rozpisanie wzoru wykonujemy analogicznie jak w przypadku średniej. Na początek ogólnie:
i dla :
Możemy już podstawiać liczby za , ale proponuję utworzyć tabelkę i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższym tasiemcem niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na wariancję z danych indywidualnych, a jej nagłówki zawsze wyglądają tak samo. Na początku od każdej wartości odejmujemy średnią, a następnie wynik podnosimy do kwadratu. Sumujemy ostatnią kolumnę (przecięcie wiersza z symbolem i daje kompletny licznik wzoru na wariancję).
A więc Skoro obliczyliśmy to możemy uzupełnić wzór .
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka t , zatem skorzystamy z tablic rozkładu t - Studenta: http://matma-po-ludzku.pl/materialy/statystyka/wzory/tstudent.pdf . Zapis oznacza konieczność odnalezienia statystyki dla i 4 stopni swobody.
Wracamy do obliczeń i podstawiamy do formuły :
5. WYNIK I INTERPRETACJA.Ostatecznie otrzymujemy: , czyli ZAWSZE zaokrąglając w górę otrzymujemy . Interpretacja brzmi następująco: Aby oszacować średnią wagę ogółu opakowań kawy z ufnością 0,99 do próby należy wylosować 53 torebek kawy (albo dolosować do próby pilotażowej opakowań). |
||||||||||||||||||||||||||