NEW | ||||||||||||||||||||||||||||||||||||||
Dzienna liczba klientów obsługiwanych przez jedną kasjerkę w wylosowanych okienkach kasowych placówek pewnego banku kształtowała się następująco: 45; 54; 64; 73; 76; 82; 89; 97; 98. Ile okienek należy wylosować, aby przy współczynniku ufności 0,90 maksymalny błąd szacunku średniej dziennej liczby klientów wynosił 10%? 1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE MINIMALNEJ LICZEBNOŚCI PRÓBY?Po przeczytaniu całego zadania zwracamy uwagę na zdanie: “ Ile okienek należy wylosować, aby przy współczynniku ufności 0,90 maksymalny błąd szacunku średniej dziennej liczby klientów wynosił 10%? ” Występują tu zwroty: ile okienek należy wylosować ... , maksymalny błąd szacunku .... Odnajdujemy również wyrażenie: współczynnik ufności . Biorąc pod uwagę wszystkie słowa-klucze mamy na pewno do czynienia z zadaniem dotyczącym minimalnej liczebności próby. 2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.Czytamy zdanie po zdaniu i wyłapujemy dane liczbowe. “ Dzienna liczba klientów obsługiwanych przez jedną kasjerkę w wylosowanych okienkach kasowych placówek pewnego banku kształtowała się następująco: 45; 54; 64; 73; 76; 82; 89; 97; 98. ” Na wstępie dowiadujemy się, że wylosowano próbę kasowych okienek liczącą 9 sztuk (ilość wyników na to wskazuje). Oczywiście wydaje się dziwne, że w zadaniu, którego istotą jest znalezienie liczebności próby podaje się właśnie to, czego szukamy - a więc liczebność próby. Nie ma powodu do niepokoju - jest to liczebność próby wstępnej tzw. pilotażowej, którą oznaczamy . Podano również informacje o konkretnych wynikach z próby. Jeżeli dysponujemy wartościami wypisanymi po przecinku tzw. danymi indywidualnymi, to zawsze możemy policzyć średnią , wariancję i odchylenie standardowe (lub , ). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach. “ Ile okienek należy wylosować, aby przy współczynniku ufności 0,90 maksymalny błąd szacunku średniej dziennej liczby klientów wynosił 10%? ” Szukamy liczebności próby tynkarzy, którą oznaczamy literą . Podano również współczynnik ufności, a więc . Od razu wyznaczamy . Znamy również maksymalny błąd szacunku, który wynosi . Dane liczbowe zostały już przeanalizowane, ale wrócimy na chwilę do maksymalnego błędu szacunku . Trzeba pamiętać, że musi on być podany w tych samych jednostkach co inne parametry z próby - w naszym przypadku jednostką jest ilość klientów w danym okienku kasowym. Nie może być tak, że na przykład średnia czy odchylenie z próby jest podane w ilości osób (bo tylko w takich jednostkach mamy szansę wyliczyć parametry), a błąd szacunku w procentach lub ułamku. Co zatem zrobić w takim przypadku? Przyjrzyjmy się jeszcze raz treści zadania i znajdźmy jaki parametr ma być szacowany przy szukanej przez nas minimalnej liczebności próby: “ Ile okienek należy wylosować, aby przy współczynniku ufności 0,90 maksymalny błąd szacunku średniej dziennej liczby klientów wynosił 10%? ” Szacujemy średnią dla populacji wszystkich tynkarzy i to dla niej szukamy błędu szacunku. Problem w tym, że średniej dla wszystkich okienek kasowych nie znamy. Wobec tego przyjmuje się, że ten 10% błąd obliczymy ze średniej z próby pilotażowej, a więc klientów w okienku. Jak widać, potrzebna będzie średnia z próby. Podsumowując tworzymy przejrzystą tabelę z danymi:
- współczynnik ufności, 3. WYBÓR ODPOWIEDNIEGO WZORU.Spójrzmy w kartę wzorów. Dla minimalnej liczebności próby mamy do wyboru pięć modeli. Teraz wracamy do danych i na początku sprawdzamy, czy jest znana. Stwierdzamy, że nie jest znana , zatem wykluczamy model I. Ponadto wiemy, że mamy do czynienia z próbą pilotażową, której liczebność jest mniejsza niż 30 ( ). Dysponując danymi indywidualnymi jesteśmy w stanie wyliczyć lub - wobec tego wybieramy model II . Którą wersję wzoru wybierzemy, zależy od nas. Znacznie częściej używana jest wersja z (z daszkiem), więc i ja wybiorę tą wersję.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.Wracamy do danych z tabeli i uzupełniamy wzór konkretnymi liczbami. Jak widać brakuje średniej (do maksymalnego błędu szacunku ) i , więc dopóki nie znajdziemy wartości tych parametrów nie możemy obliczyć liczebności próby właściwej. Wyliczanie średniej i wariancji z próby jest zagadnieniem ze statystki opisowej. Dysponujemy danymi indywidualnymi (wynikami wypisanymi po przecinku), jest ich niewiele i nie powtarzają się. Wzór na średnią z danych indywidualnych wygląda następująco: . Oczywiście na chłopski rozum średnią można policzyć sumując wszystkie dane, a potem dzieląc przez ilość – jest to jak najbardziej prawidłowe rozwiązanie, a podany wzór oznacza to samo. Jednak zdaję sobie sprawę, że widząc „hieroglify” tego typu wiele osób nie wie co robić, a tym bardziej jak je rozpisywać :). Mając to na uwadze postaram się przybliżyć kwestię podobnych oznaczeń rozpisując je na czynniki pierwsze. Znak to symbol sumy. Pod nim znajduje się zapis , a nad nim , to wartości kolejnych obserwacji. Wszytko razem oznacza, że będziemy dodawać kolejne obserwacje oznaczone symbolem , gdzie będzie rosło od aż do wartości , a więc :
Tak więc średnia po rozpisaniu wygląda następująco:
Teraz przełożymy wszystko na dane z zadania. Liczebność próby wynosi , a więc wzór na średnią możemy zapisać następująco:
Czym jest ? Są to konkretne wyniki z próby, a więc . Dane są nawet uporządkowane od najmniejszej wartości do największej. Uporządkowanie liczb lub jego brak nie wpływa na wartość średniej. A więc np. . Obliczamy średnią:
Tym samym możemy podstawić wartość średniej do maksymalnego błędu szacunku :
Wariancję liczymy ze wzoru związanego z danymi indywidualnymi: lub (obie wersje są równoważne, w praktyce pierwsza wersja jest częściej używana). Po określeniu wzoru na okazuje się, że w formule pozwalającej wyznaczyć wariancję potrzebna jest wartość średnia , która przed chwilą została policzona. Dysponując wartością liczbową średniej możemy obliczyć wariancję . Rozpisanie wzoru wykonujemy analogicznie jak w przypadku średniej. Na początek ogólnie:
i dla :
Możemy już podstawiać liczby za , ale proponuję utworzyć tabelkę i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższym tasiemcem niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na wariancję z danych indywidualnych, a jej nagłówki zawsze wyglądają tak samo. Na początku od każdej wartości odejmujemy średnią, a następnie wynik podnosimy do kwadratu. Sumujemy ostatnią kolumnę (przecięcie wiersza z symbolem i daje kompletny licznik wzoru na wariancję).
A więc Skoro obliczyliśmy to możemy uzupełnić wzór .
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka t , zatem skorzystamy z tablic rozkładu t - Studenta: http://matma-po-ludzku.pl/materialy/statystyka/wzory/tstudent.pdf . Zapis oznacza konieczność odnalezienia statystyki dla i 8 stopni swobody.
Wracamy do obliczeń i podstawiamy do formuły :
5. WYNIK I INTERPRETACJA.Ostatecznie otrzymujemy: , czyli ZAWSZE zaokrąglając w górę otrzymujemy . Interpretacja brzmi następująco: Aby oszacować średnią dzienną liczbę klientów banku z ufnością 0,9 do próby należy wylosować 21 okienek (dolosować do próby pilotażowej okienek) |
||||||||||||||||||||||||||||||||||||||