Miesięczne wydatki na odbitki kserograficzne (dane w zł) ogółu studentów SGH mają rozkład . Badanie 5 losowo wybranych studentów ze względu na wydatki na odbitki dostarczyło następujących danych: 10; 12; 8; 15; 10. Ilu co najmniej studentów należy wylosować do próby, aby przy poziomie ufności 0,95 oszacować średnie wydatki ogółu studentów, otrzymując przedział o długości nieprzekraczającej 4 zł?

1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE MINIMALNEJ LICZEBNOŚCI PRÓBY?

Po przeczytaniu całego zadania zwracamy uwagę na zdanie:

“ Ilu co najmniej studentów należy wylosować do próby, aby przy poziomie ufności 0,95 oszacować średnie wydatki ogółu studentów, otrzymując przedział o długości nieprzekraczającej 4 zł? ”

Na początku może się wydawać, że zadanie dotyczy estymacji przedziałowej, ponieważ pojawia się zwrot: otrzymując przedział o długości ... . Niemniej jednak przewagę nad tym wyrażeniem zawsze ma: ilu co najmniej studentów należy wylosować do próby .... , czyli szukamy minimalnej liczebności próby. Nie ma również ani słowa o maksymalnym błędzie szacunku, ale jest on ukryty w zadaniu pod innym szyldem. Nie jest to nic nadzwyczajnego, ponieważ zagadnienie minimalnej liczebności próby ściśle wiąże się z estymacją przedziałową. Pojawia się również wyrażenie poziom ufności .. Biorąc to pod uwagę mamy na pewno do czynienia z zadaniem dotyczącym minimalnej liczebności próby.

2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.

Czytamy zdanie po zdaniu.

“ Miesięczne wydatki na odbitki kserograficzne (dane w zł) ogółu studentów SGH mają rozkład . ”

Symbol minimalna-model1-152 oznacza, że miesięczne wydatki na odbitki charakteryzują się rozkładem normalnym o nieznanej średniej minimalna-model1-153 i znanym odchyleniu standardowym minimalna-model1-154 . Zapis ten zawsze odnosi się do populacji (wcześniej wspominałam w części teoretycznej, że próba jest z reguły za mała aby stwierdzić rozkład normalny).

Badanie 5 losowo wybranych studentów ze względu na wydatki na odbitki dostarczyło następujących danych: 10; 12; 8; 15; 10.

Dowiadujemy się , że wylosowano 5 osób - jest to liczebność próby, którą zapiszemy minimalna-model1-155 . Podano również wyniki z próby - liczby wypisane po przecinku tzw. dane indywidualne. Jeżeli takowe posiadamy, to zawsze w razie potrzeby można z nich obliczyć średnią minimalna-model1-156 , wariancję minimalna-model1-157 lub odchylenie standardowe minimalna-model1-158 . Nie liczmy jednak tych parametrów od razu, ponieważ może się okazać, że wcale nie będą nam potrzebne.

Szukamy liczebności próby (liczba studentów), którą oznaczamy literą minimalna-model1-159 . I tu pojawia się wątpliwość - przecież przed chwilą wypisaliśmy liczebność próby minimalna-model1-160 , więc po co szukać czegoś co już jest znane? Prawdopodobnie jest to próba wstępna (pilotażowa) lub też autor zadania chce nas sprowadzić na manowce :). Na razie oznaczmy tymczasowo liczebność naszej próby symbolem minimalna-model1-161 (próba pilotażowa). Wszystko się okaże na etapie wyboru wzoru.

Podano również poziom ufności, a więc minimalna-model1-162 . Od razu wyznaczamy minimalna-model1-163 .

Jak pamiętamy, w zadaniach dotyczących minimalnej liczebności próby ważnym elementem jest wartość maksymalnego błędu szacunku minimalna-model1-164 . Zamiast tego dowiadujemy się, że przedział ufności powinien mieć długość nieprzekraczającą 4 zł. Warto zapamiętać, że maksymalny błąd szacunku to połowa przedziału ufności. Jeśli informacja ta wydaje się być zbyt lakoniczna, odsyłam do szerszego wytłumaczenia http://matma-po-ludzku.pl/statystyka/wnioskowanie/estymacja/estymacja_sredniej/zadanie29.php . Otrzymujemy zatem minimalna-model1-165 .

Podsumowując tworzymy przejrzystą tabelę z danymi:

POPULACJA studenci	PRÓBA wybranych studentów
- rozkład normalny o nieznanej średniej i znanym odchyleniu standardowym	- próba pilotażowa - dane indywidualne (można obliczyć średnią , wariancję , odchylenie standardowe )

minimalna-model1-176

minimalna-model1-177 - współczynnik ufności, minimalna-model1-178

3. WYBÓR ODPOWIEDNIEGO WZORU.

Spójrzmy w kartę wzorów. Dla minimalnej liczebności próby mamy do wyboru pięć modeli. Teraz wracamy do danych i na początku sprawdzamy, czy jest znana. Stwierdzamy, że jest znana minimalna-model1-181 , zatem wybieramy model I . Jednak może się tu pojawić wątpliwość co do wybranej formuły, ponieważ dysponujemy liczebnością próby pilotażowej minimalna-model1-182 i wynikami z tejże próbki, które pozwalają na obliczenie minimalna-model1-183 . Próba pilotażowa wskazuje na model II, ale jeżeli minimalna-model1-184 jest znana, to wybiera się zawsze model I. Wynika to z faktu, że minimalna-model1-185 dotyczy populacji, a minimalna-model1-186 próby, która może istotnie różnić się od całej populacji. Podsumowując - dane dotyczące populacji mają większą wagę niż dane z prób, które wcale nie muszą być reprezentatywne. Tak więc to była podpucha ze strony autora.

minimalna-model1-187

4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.

Wracamy do danych z tabeli i uzupełniamy wzór minimalna-model1-188 konkretnymi liczbami.

minimalna-model1-189

minimalna-model1-190

Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka u , zatem skorzystamy z tablic rozkładu normalnego: http://matma-po-ludzku.pl/materialy/statystyka/wzory/rnormalny.pdf . Zapis minimalna-model1-191 oznacza konieczność odnalezienia statystyki dla minimalna-model1-192 . Czytanie z tablic rozkładu normalnego nie jest trudne. Sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. W przypadku minimalna-model1-193 sumujemy minimalna-model1-194 i minimalna-model1-195 czyli minimalna-model1-196 .