NEW | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Zadanie 38Dwudziestu tynkarzy wykonuje roboty tynkarskie w wielkiej hali sportowej. Ich średnie wydajności w m2/h zaobserwowane w tym samym dniu są następujące: 5, 4, 4, 6, 4, 5, 7, 5, 6, 7, 4, 3, 5, 6, 5, 4, 5, 6, 5, 4. Zbudować przedział ufności dla wartości oczekiwanej liczby metrów kwadratowych tynku wykonanego w ciągu godziny przez jednego tynkarza na poziomie ufności .
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu zadania zwracamy uwagę na ostatnie zdanie:
„Zbudować przedział ufności dla wartości oczekiwanej liczby metrów kwadratowych tynku wykonanego w ciągu godziny przez jednego tynkarza na poziomie ufności . ”
Odnajdujemy w nim zwroty: zbudować przedział ufności i poziom ufności. Teraz mamy pewność, że zadanie dotyczy estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH. Analizujemy zdanie po zdaniu.
„Dwudziestu tynkarzy wykonuje roboty tynkarskie w wielkiej hali sportowej.”
Co prawda nie określono precyzyjnie, czy mamy do czynienia z próbą, ale z późniejszej treści zadania wynika, że trzeba oszacować liczbę metrów kwadratowych tynku dla przeciętnego tynkarza. Badanych tynkarzy potraktujemy jako próbę, a jej liczebność to i w związku z tym będziemy prawdopodobnie stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji.
„Ich średnie wydajności w m2/h zaobserwowane w tym samym dniu są następujące: 5, 4, 4, 6, 4, 5, 7, 5, 6, 7, 4, 3, 5, 6, 5, 4, 5, 6, 5, 4.”
Podano informacje o konkretnych wynikach z próby. Jeżeli dysponujemy wartościami wypisanymi po przecinku tzw. danymi indywidualnymi, to zawsze możemy policzyć średnią , wariancję i odchylenie standardowe (lub , ). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach.
„Zbudować przedział ufności dla wartości oczekiwanej liczby metrów kwadratowych tynku wykonanego w ciągu godziny przez jednego tynkarza na poziomie ufności . „
Podano też współczynnik ufności . Od razu wyznaczamy .
Podsumowując tworzymy przejrzystą tabelę z danymi:
- współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:
„Zbudować przedział ufności dla wartości oczekiwanej liczby metrów kwadratowych tynku wykonanego w ciągu godziny przez jednego tynkarza na poziomie ufności . ”
Wyrażenie wartości oczekiwanej oznacza, że będziemy budować przedział ufności dla wartości średniej z populacji. Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby. nie jest znana, a liczebność próby jest mniejsza od 30 ( ), zatem wybieramy model II. Dysponujemy danymi indywidualnymi, więc możemy wyznaczyć z nich lub . Decyzja, którą opcję wybrać należy do nas, jest to właściwie obojętne, ale najczęściej wybiera się (o ile nie zostanie narzucone inaczej), także interesuje nas pierwsza wersja wzoru z wybranego modelu.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA. Wracamy do danych w tabeli i uzupełniamy wzór konkretnymi liczbami. Jak widać potrzebujemy średniej z próby i odchylenia standardowego . W związku z tym zanim zajmiemy się uzupełnianiem właściwego wzoru należy obliczyć dwa (na razie) nieznane parametry. Liczenie średniej, wariacji i odchylenia standardowego jest zagadnieniem ze statystyki opisowej. Dysponujemy danymi indywidualnymi (wypisanymi po przecinku) i możemy korzystać ze wzorów dotyczących danych indywidualnych (podobnie jak w zadaniach 32-37). Zastanówmy się jednak, czy w tym zadaniu będzie to wygodne. Danych jest dość dużo, bo aż i w dużej mierze powtarzają się. W związku z tym łatwiej będzie je posegregować w szereg punktowy tzn. wykonać tabelę, w której podliczymy ilości poszczególnych obserwacji.
W szeregu punktowym średnią liczymy ze wzoru . Objaśnijmy go. Znak oznacza sumę. Pod tym symbolem znajduje się zapis , a nad nim , to wartości kolejnych obserwacji, a liczebności dla tych obserwacji. Wszytko razem oznacza, że będziemy sumować kolejne iloczyny , gdzie będzie rosło od aż do wartości , a więc , a więc ogólnie:
W naszym przypadku znad znaku sumy oznacza liczbę klas (ilość wierszy w tabeli z danymi, ilość wariantów obserwacji). Tak więc średnia będzie miała uproszczony wzór:
Czym jest , oraz ? Wszystko to pokażmy dokładnie w tabeli:
Uzupełniając otrzymujemy wzór: i oczywiście możemy uzupełnić go danymi z tabeli, ale proponuję nadal korzystać z tabeli i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższym tasiemcem niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na średnią z szeregu punktowego, a jej nagłówki zawsze wyglądają tak samo. Każdą wartość mnożymy przez odpowiadającą mu wartość , a następnie sumujemy powstałe iloczyny. Przecięcie wiersza z symbolem i kolumny daje kompletny licznik wzoru na średnią.
Zostało nam jeszcze odchylenie standardowe . Na początek i tak musimy obliczyć wariancję , bo . Wzór na wariancję z danych szeregu punktowego wygląda następująco: . Jest też alternatywa , ale będziemy używać pierwszej wersji. Rozpisanie wzoru analogiczne jak w przypadku średniej. Jak widać do policzenia wariancji i tak niezbędna jest średnia. Na początek ogólnie:
i dla ilości klas z zadania :
Tu też można podstawiać dane z tabeli, ale ponownie proponuję trzymać się obliczeń tabelarycznych. Można kontynuować poprzednią tabelę dopisując kolejne kolumny. Znowu krok po kroku będziemy tworzyć licznik ze wzoru. Dopisana pierwsza kolumna - od każdej wariantu cechy odejmujemy wcześniej wyliczoną średnią , druga kolumna to podniesienie wyników z poprzedniej do kwadratu. Ostatnia to wymnożenie wyników z drugiej przez odpowiadające im wartości i dopiero ona jest sumowana (przecięcie wiersza z symbolem i daje kompletny licznik wzoru na wariancję ).
Odchylenie standardowe to pierwiastek z wariancji .
Wracamy do istoty zadania i wreszcie uzupełniamy wzór .
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka t, zatem skorzystamy z tablic t-Studenta. Zapis oznacza statystykę dla i 19 stopni swobody. Wracamy do obliczeń i podstawiamy:
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy: . Interpretacja brzmi następująco: Z ufnością 0,90 wartość oczekiwana liczby metrów kwadratowych tynku wykonanego w ciągu godziny przez jednego tynkarza mieści się w przedziale od 4,58 m2/h do 5,42 m2/h.
Zadanie pochodzi z: Elementy statystyki w zadaniach / Karol Kukuła. Wyd.2 popr. i rozsz., Warszawa : Wydawnictwo Naukowe PWN, 2007. 262 s. : il. ; 24 cm. ISBN 978-83-01-13819-6 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||