NEW | |||||||||||||||||||||||||||||||||||
W zakładzie P należy ustalić średni staż pracowników bezpośrednio produkcyjnych. Wylosowano próbę pilotażową otrzymując następujące dane (staż w latach): 0,3; 1,9; 5,0; 2,4; 7,1; 3,0; 3,9; 4,6. Jak liczną należy pobrać próbę, jeżeli zakłada się dopuszczalny błąd szacunku średniej 1,2 lat, a poziom ufności . Zakłada się, że staż pracy pracowników jest normalny. 1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE MINIMALNEJ LICZEBNOŚCI PRÓBY?Po przeczytaniu całego zadania zwracamy uwagę na zdanie: “ Jak liczną należy pobrać próbę, jeżeli zakłada się dopuszczalny błąd szacunku średniej 1,2 lat, a poziom ufności . ” Występują tu zwroty: jak liczną należy pobrać próbę ... , dopuszczalny błąd szacunku.... Odnajdujemy również wyrażenie: poziom ufności . Biorąc pod uwagę wszystkie słowa-klucze mamy na pewno do czynienia z zadaniem dotyczącym minimalnej liczebności próby. 2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.Czytamy zdanie po zdaniu. W zakładzie P należy ustalić średni staż pracowników bezpośrednio produkcyjnych. W tym zdaniu nie ma danych liczbowych, więc je pomijamy. Wylosowano próbę pilotażową otrzymując następujące dane (staż w latach): 0,3; 1,9; 5,0; 2,4; 7,1; 3,0; 3,9; 4,6. Wydaje się dziwne, że w zadaniu, którego istotą jest znalezienie liczebności próby podaje się właśnie to, czego szukamy - a więc liczebność próby. Nie ma powodu do niepokoju - jest to liczebność próby wstępnej pracowników tzw. pilotażowej, którą oznaczamy . Podano również informacje o konkretnych wynikach z próby. Jeżeli dysponujemy wartościami wypisanymi po przecinku tzw. danymi indywidualnymi, to zawsze możemy policzyć średnią , wariancję i odchylenie standardowe (lub , ). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach. “ Jak liczną należy pobrać próbę, jeżeli zakłada się dopuszczalny błąd szacunku średniej 1,2 lat, a poziom ufności . ” Szukamy liczebności próby właściwej, którą oznaczamy literą . Maksymalny błąd szacunku wynosi lat. Podano również współczynnik ufności, a więc . Od razu wyznaczamy . Zakłada się, że staż pracy pracowników jest normalny. W tym zdaniu występuje założenie normalności rozkładu stażu pracowników i to już odnosi się do populacji (wcześniej wspominałam w części teoretycznej, że próba jest z reguły za mała aby stwierdzić rozkład normalny). Nie mamy informacji na temat tego rozkładu, zatem możemy tylko zapisać - rozkład normalny o nieznanej średniej i nieznanym odchyleniu standardowym . Podsumowując tworzymy przejrzystą tabelę z danymi:
- współczynnik ufności, 3. WYBÓR ODPOWIEDNIEGO WZORU.Spójrzmy w kartę wzorów. Dla minimalnej liczebności próby mamy do wyboru pięć modeli. Teraz wracamy do danych i na początku sprawdzamy, czy jest znana. Stwierdzamy, że nie jest znana , zatem wykluczamy model I. Ponadto wiemy, że mamy do czynienia z próbą pilotażową, której liczebność jest mniejsza niż 30 ( ). Dysponując danymi indywidualnymi jesteśmy w stanie wyliczyć lub - wobec tego wybieramy model II . Którą wersję wzoru wybierzemy, zależy od nas. Znacznie częściej używana jest wersja z (z daszkiem), więc i ja wybiorę tą wersję.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.Wracamy do danych z tabeli i uzupełniamy wzór konkretnymi liczbami. Jak widać brakuje tylko , więc dopóki nie znajdziemy wartości tego parametru nie możemy obliczyć liczebności próby właściwej. Wyliczanie wariancji z próby jest zagadnieniem ze statystki opisowej. Dysponujemy danymi indywidualnymi (wynikami wypisanymi po przecinku), jest ich niewiele i nie powtarzają się, zatem wariancję liczymy ze wzoru związanego z danymi indywidualnymi: lub (obie wersje są równoważne, w praktyce pierwsza wersja jest częściej używana). Po określeniu wzoru na okazuje się, że w formule pozwalającej wyznaczyć wariancję potrzebna jest wartość średnia , więc to od niej należy zacząć obliczenia. Wzór na średnią z danych indywidualnych wygląda następująco: . Oczywiście na chłopski rozum średnią można policzyć sumując wszystkie dane, a potem dzieląc przez ilość – jest to jak najbardziej prawidłowe rozwiązanie, a podany wzór oznacza to samo. Jednak zdaję sobie sprawę, że widząc „hieroglify” tego typu wiele osób nie wie co robić, a tym bardziej jak je rozpisywać :). Mając to na uwadze postaram się przybliżyć kwestię podobnych oznaczeń rozpisując je na czynniki pierwsze. Znak to symbol sumy. Pod nim znajduje się zapis , a nad nim , to wartości kolejnych obserwacji. Wszytko razem oznacza, że będziemy dodawać kolejne obserwacje oznaczone symbolem , gdzie będzie rosło od aż do wartości , a więc :
Tak więc średnia po rozpisaniu wygląda następująco:
Teraz przełożymy wszystko na dane z zadania. Liczebność próby wynosi , a więc wzór na średnią możemy zapisać następująco:
Czym jest ? Są to konkretne wyniki z próby, a więc . Jeśli ktoś chciałby uporządkować dane indywidualne od najmniejszej do największej, może to spokojnie wykonać. Porządkowanie liczb nie wpływa na wartość średniej, także może zostać tak jak jest. A więc np. . Obliczamy średnią:
Dysponując wartością liczbową średniej możemy obliczyć wariancję . Rozpisanie wzoru wykonujemy analogicznie jak w przypadku średniej. Na początek ogólnie:
i dla :
Możemy już podstawiać liczby za , ale proponuję utworzyć tabelkę i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższym tasiemcem niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na wariancję z danych indywidualnych, a jej nagłówki zawsze wyglądają tak samo. Na początku od każdej wartości odejmujemy średnią, a następnie wynik podnosimy do kwadratu. Sumujemy ostatnią kolumnę (przecięcie wiersza z symbolem i daje kompletny licznik wzoru na wariancję).
A więc Skoro obliczyliśmy to możemy uzupełnić wzór .
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka t , zatem skorzystamy z tablic rozkładu t - Studenta: http://matma-po-ludzku.pl/materialy/statystyka/wzory/tstudent.pdf . Zapis oznacza konieczność odnalezienia statystyki dla i 7 stopni swobody.
Wracamy do obliczeń i podstawiamy do formuły :
5. WYNIK I INTERPRETACJA.Ostatecznie otrzymujemy: , czyli ZAWSZE zaokrąglając w górę otrzymujemy . Interpretacja brzmi następująco: Aby ustalić średni staż pracowników bezpośrednio produkcyjnych z ufnością 0,99 do próby należy wylosować 38 pracowników (albo dolosować do próby pilotażowej pracowników). |
|||||||||||||||||||||||||||||||||||