Waga opakowań kawy (w dag) ma rozkład normalny. Kontrola wybranych losowo 5 opakowań dała następujące wyniki: 10,2; 10,1; 9,8; 9,9; 10,0. Ile co najmniej torebek kawy należy pobrać do próby, aby przy współczynniku ufności równym 0,99 oszacować średnią wagę ogółu opakowań kawy, otrzymując przedział o długości nieprzekraczającej 0,2 dag?

1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE MINIMALNEJ LICZEBNOŚCI PRÓBY?

Po przeczytaniu całego zadania zwracamy uwagę zdanie:

“ Ile co najmniej torebek kawy należy pobrać do próby, aby przy współczynniku ufności równym 0,99 oszacować średnią wagę ogółu opakowań kawy, otrzymując przedział o długości nieprzekraczającej 0,2 dag? ”

Na początku może się wydawać, że zadanie dotyczy estymacji przedziałowej, ponieważ pojawia się zwrot: przedział o długości ... . Niemniej jednak przewagę nad tym wyrażeniem zawsze ma: ile co najmniej torebek kawy należy pobrać do próby ... , czyli szukamy minimalnej liczebności próby. Odnajdujemy również wyrażenie: współczynnik ufności . Co prawda nie ma ani słowa o maksymalnym błędzie szacunku, ale jest on ukryty w zadaniu pod innym szyldem. Biorąc pod uwagę wszystkie słowa-klucze mamy na pewno do czynienia z zadaniem dotyczącym minimalnej liczebności próby.

2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.

Czytamy zdanie po zdaniu.

Waga opakowań kawy (w dag) ma rozkład normalny .

W tym zdaniu występuje założenie normalności rozkładu wagi opakowań kawy i to już odnosi się do populacji (wcześniej wspominałam w części teoretycznej, że próba jest z reguły za mała aby stwierdzić rozkład normalny). Nie mamy informacji na temat tego rozkładu, zatem możemy tylko zapisać minimalna-model2-442 - rozkład normalny o nieznanej średniej minimalna-model2-443 i nieznanym odchyleniu standardowym minimalna-model2-444 .

Kontrola wybranych losowo 5 opakowań dała następujące wyniki: 10,2; 10,1; 9,8; 9,9; 10,0.

Wydaje się dziwne, że w zadaniu, którego istotą jest znalezienie liczebności próby podaje się właśnie to, czego szukamy - a więc liczebność próby. Nie ma powodu do niepokoju - jest to liczebność próby wstępnej tzw. pilotażowej, którą oznaczamy minimalna-model2-445 . Podano również informacje o konkretnych wynikach z próby. Jeżeli dysponujemy wartościami wypisanymi po przecinku tzw. danymi indywidualnymi, to zawsze możemy policzyć średnią minimalna-model2-446 , wariancję minimalna-model2-447 i odchylenie standardowe minimalna-model2-448 (lub minimalna-model2-449 , minimalna-model2-450 ). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach.

Szukamy liczebności próby (liczba torebek kawy), którą oznaczamy literą minimalna-model2-451 . Podano również współczynnik ufności, a więc minimalna-model2-452 . Od razu wyznaczamy minimalna-model2-453 . Jak pamiętamy, w zadaniach dotyczących minimalnej liczebności próby ważnym elementem jest wartość maksymalnego błędu szacunku minimalna-model2-454 . Zamiast tego dowiadujemy się, że przedział ufności powinien mieć długość nieprzekraczającą 0,2 dag. Warto zapamiętać, że maksymalny błąd szacunku to połowa przedziału ufności. Jeśli informacja ta wydaje się być zbyt lakoniczna, odsyłam do szerszego wytłumaczenia http://matma-po-ludzku.pl/statystyka/wnioskowanie/estymacja/estymacja_sredniej/zadanie29.php . Otrzymujemy zatem minimalna-model2-455 .

Podsumowując tworzymy przejrzystą tabelę z danymi:

POPULACJA 4-opakowania kawy	PRÓBA wybranych opakowań
- rozkład normalny o nieznanej średniej i nieznanym odchyleniu standardowym	-dane indywidualne (można obliczyć średnią , wariancję , odchylenie standardowe )

minimalna-model2-467

minimalna-model2-468 - współczynnik ufności, minimalna-model2-469

3. WYBÓR ODPOWIEDNIEGO WZORU.

Spójrzmy w kartę wzorów. Dla minimalnej liczebności próby mamy do wyboru pięć modeli. Teraz wracamy do danych i na początku sprawdzamy, czy jest znana. Stwierdzamy, że nie jest znana , zatem wykluczamy model I. Ponadto wiemy, że mamy do czynienia z próbą pilotażową, której liczebność jest mniejsza niż 30 ( minimalna-model2-472 ). Dysponując danymi indywidualnymi jesteśmy w stanie wyliczyć minimalna-model2-473 lub minimalna-model2-474 - wobec tego wybieramy model II . Którą wersję wzoru wybierzemy, zależy od nas. Znacznie częściej używana jest wersja z minimalna-model2-475 (z daszkiem), więc i ja wybiorę tą wersję.

minimalna-model2-476

4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.

Wracamy do danych z tabeli i uzupełniamy wzór minimalna-model2-477 konkretnymi liczbami.

Jak widać brakuje tylko minimalna-model2-478 , więc dopóki nie znajdziemy wartości tego parametru nie możemy obliczyć liczebności próby właściwej. Wyliczanie wariancji z próby jest zagadnieniem ze statystki opisowej.

Dysponujemy danymi indywidualnymi (wynikami wypisanymi po przecinku), jest ich niewiele i nie powtarzają się, zatem wariancję nieobciążoną liczymy ze wzoru związanego z danymi indywidualnymi: minimalna-model2-479 lub minimalna-model2-480 minimalna-model2-481 (obie wersje są równoważne, w praktyce pierwsza wersja jest częściej używana). Po określeniu wzoru na minimalna-model2-482 okazuje się, że w formule pozwalającej wyznaczyć wariancję potrzebna jest wartość średnia minimalna-model2-483 , więc to od niej należy zacząć obliczenia.

Wzór na średnią z danych indywidualnych wygląda następująco: minimalna-model2-484 minimalna-model2-485 . Oczywiście na chłopski rozum średnią można policzyć sumując wszystkie dane, a potem dzieląc przez ilość – jest to jak najbardziej prawidłowe rozwiązanie, a podany wzór oznacza to samo. Jednak zdaję sobie sprawę, że widząc „hieroglify” tego typu wiele osób nie wie co robić, a tym bardziej jak je rozpisywać :). Mając to na uwadze postaram się przybliżyć kwestię podobnych oznaczeń rozpisując je na czynniki pierwsze.

Znak minimalna-model2-486 to symbol sumy. Pod nim znajduje się zapis minimalna-model2-487 , a nad nim minimalna-model2-488 , minimalna-model2-489 to wartości kolejnych obserwacji. Wszytko razem oznacza, że będziemy dodawać kolejne obserwacje oznaczone symbolem minimalna-model2-490 , gdzie minimalna-model2-491 będzie rosło od minimalna-model2-492 aż do wartości minimalna-model2-493 , a więc minimalna-model2-494 :

minimalna-model2-495

Tak więc średnia po rozpisaniu wygląda następująco:

minimalna-model2-496 minimalna-model2-497

Teraz przełożymy wszystko na dane z zadania. Liczebność próby wynosi minimalna-model2-498 , a więc wzór na średnią możemy zapisać następująco:

minimalna-model2-499 minimalna-model2-500

Czym jest minimalna-model2-501 ? Są to konkretne wyniki z próby, a więc minimalna-model2-502 . Jeśli ktoś chciałby uporządkować dane indywidualne od najmniejszej do największej, może to spokojnie wykonać. Porządkowanie liczb nie wpływa na wartość średniej, także może zostać tak jak jest. A więc np. minimalna-model2-503 .

Obliczamy średnią:

minimalna-model2-504 minimalna-model2-505

Dysponując wartością liczbową średniej możemy obliczyć wariancję minimalna-model2-506 . Rozpisanie wzoru wykonujemy analogicznie jak w przypadku średniej. Na początek ogólnie:

minimalna-model2-507

i dla minimalna-model2-508 :

minimalna-model2-509

Możemy już podstawiać liczby za minimalna-model2-510 , ale proponuję utworzyć tabelkę i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższym tasiemcem niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na wariancję z danych indywidualnych, a jej nagłówki zawsze wyglądają tak samo. Na początku od każdej wartości minimalna-model2-511 odejmujemy średnią, a następnie wynik podnosimy do kwadratu. Sumujemy ostatnią kolumnę (przecięcie wiersza z symbolem minimalna-model2-512 i minimalna-model2-513 daje kompletny licznik wzoru na wariancję).







(suma)

A więc minimalna-model2-534

Skoro obliczyliśmy minimalna-model2-535 to możemy uzupełnić wzór minimalna-model2-536 .

minimalna-model2-537

minimalna-model2-538

Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka t , zatem skorzystamy z tablic rozkładu t - Studenta: http://matma-po-ludzku.pl/materialy/statystyka/wzory/tstudent.pdf . Zapis minimalna-model2-539 oznacza konieczność odnalezienia statystyki dla minimalna-model2-540 i 4 stopni swobody.

minimalna-model2-541

Wracamy do obliczeń i podstawiamy do formuły minimalna-model2-542 :

minimalna-model2-543

minimalna-model2-544

minimalna-model2-545

5. WYNIK I INTERPRETACJA.

Ostatecznie otrzymujemy: minimalna-model2-546 , czyli ZAWSZE zaokrąglając w górę otrzymujemy minimalna-model2-547 .

Interpretacja brzmi następująco: Aby oszacować średnią wagę ogółu opakowań kawy z ufnością 0,99 do próby należy wylosować 53 torebek kawy (albo dolosować do próby pilotażowej minimalna-model2-548 opakowań).