NEW | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Zadanie 39W ciągu wybranych w sposób losowy 100 dni, liczba wypadków przy pracy w kopalniach kształtowała się następująco:
Przyjmując współczynnik ufności 0,95, oszacować średnią dzienną liczbę wypadków przy pracy w kopalniach.
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu całego zadania zwracamy uwagę na ostatnie zdanie:
„Przyjmując współczynnik ufności 0,95, oszacować średnią dzienną liczbę wypadków przy pracy w kopalniach.”
Co prawda nie użyto bezpośrednio zwrotu przedział ufności, ale musimy oszacować liczbę wypadków, więc wypadałoby podać przedział ufności, bo tzw. estymacja punktowa (tzn. konkretna liczba, a nie przedział) daje wynik o prawdopodobieństwie praktycznie równym zero. Dodatkowo występuje tu wyrażenie: współczynnik ufności i w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH. Analizujemy zdanie po zdaniu.
„W ciągu wybranych w sposób losowy 100 dni, liczba wypadków przy pracy w kopalniach kształtowała się następująco:”
Od razu zaczyna się opis próby, ponieważ pojawia się informacja o wybraniu konkretnej ilości dni, tak więc liczebność próby to . Podano również wyniki z próby w tabeli. Jeżeli dysponujemy danymi dotyczącymi próby ujętymi w tabeli zawsze możemy policzyć średnią , wariancję i odchylenie standardowe (lub , ). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach.
„Przyjmując współczynnik ufności 0,95, oszacować średnią dzienną liczbę wypadków przy pracy w kopalniach.”
Podano współczynnik ufności . Od razu wyznaczamy .
Podsumowując tworzymy przejrzystą tabelę z danymi:
- współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo: „Przyjmując współczynnik ufności 0,95, oszacować średnią dzienną liczbę wypadków przy pracy w kopalniach.”
Wyraz średnią oznacza, że będziemy budować przedział ufności dla wartości średniej z populacji. Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby. nie jest znana, a liczebność próby jest większa od 30 ( ), zatem wybieramy model III.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych w tabeli i uzupełniamy wzór konkretnymi liczbami. Jak widać potrzebujemy średniej z próby i odchylenia standardowego . W związku z tym zanim zajmiemy się uzupełnianiem właściwego wzoru należy obliczyć dwa (na razie) nieznane parametry. Liczenie średniej, wariacji i odchylenia standardowego jest zagadnieniem ze statystyki opisowej. Dysponujemy danymi tabelarycznymi, gdzie warianty cechy nie są w formie przedziałów tzn. od … do... , tylko konkretnymi liczbami tzw. danymi punktowymi. Tak więc mamy do czynienia z szeregiem punktowym. Przeredagujmy zatem tabelę z zadania właśnie na ten szereg.
Częstym problemem jest określenie, które dane należy określić oznaczeniem , a które . Najłatwiej rozpoznać po tym, że liczby są w kolejności albo są uporządkowane. Wartości praktycznie nigdy nie są ustawione kolejno. Podobną sytuację mamy w powyższej tabeli.
W szeregu punktowym średnią liczymy ze wzoru . Objaśnijmy go. Znak oznacza sumę. Pod tym symbolem znajduje się zapis , a nad nim , to wartości kolejnych obserwacji, a liczebności dla tych obserwacji. Wszytko razem oznacza, że będziemy sumować kolejne iloczyny , gdzie będzie rosło od aż do wartości , a więc , a więc ogólnie:
W naszym przypadku znad znaku sumy oznacza liczbę klas (ilość wierszy w tabeli z danymi, ilość wariantów obserwacji). Tak więc średnia będzie miała uproszczony wzór:
Czym jest , oraz ? Wszystko to pokażmy dokładnie w tabeli:
Uzupełniając otrzymujemy wzór: i oczywiście możemy uzupełnić go danymi z tabeli, ale proponuję nadal korzystać z tabeli i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższym tasiemcem niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na średnią z szeregu punktowego, a jej nagłówki zawsze wyglądają tak samo. Każdą wartość mnożymy przez odpowiadającą mu wartość , a następnie sumujemy powstałe iloczyny. Przecięcie wiersza z symbolem i kolumny daje kompletny licznik wzoru na średnią.
Zostało nam jeszcze odchylenie standardowe . Na początek i tak musimy obliczyć wariancję , bo . Wzór na wariancję z danych szeregu punktowego wygląda następująco: . Jest też alternatywa , ale będziemy używać pierwszej wersji. Rozpisanie wzoru analogiczne jak w przypadku średniej. Jak widać do policzenia wariancji i tak niezbędna jest średnia. Na początek ogólnie:
i dla ilości klas z zadania :
Tu też można podstawiać dane z tabeli, ale ponownie proponuję trzymać się obliczeń tabelarycznych. Można kontynuować poprzednią tabelę dopisując kolejne kolumny. Znowu krok po kroku będziemy tworzyć licznik ze wzoru. Dopisana pierwsza kolumna - od każdej wariantu cechy odejmujemy wcześniej wyliczoną średnią , druga kolumna to podniesienie wyników z poprzedniej do kwadratu. Ostatnia to wymnożenie wyników z drugiej przez odpowiadające im wartości i dopiero ona jest sumowana (przecięcie wiersza z symbolem i daje kompletny licznik wzoru na wariancję ).
Odchylenie standardowe to pierwiastek z wariancji .
Wracamy do istoty zadania i wreszcie uzupełniamy wzór :
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka u, zatem skorzystamy z tablic rozkładu normalnego. Zapis oznacza konieczność odnalezienia statystyki dla . Czytanie z tablic rozkładu normalnego nie jest trudne. Sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. W przypadku sumujemy i czyli .
Wracamy do obliczeń i podstawiamy (zaokrąglanie to indywidualna sprawa wynikająca najczęściej z preferencji prowadzącego)
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy: Interpretacja brzmi następująco: Z ufnością 0,95 średnia liczba wypadków pracowniczych mieści się w przedziale od 0,83 do 1,29.
Statystyka: podstawy teoretyczne, przykłady, zadania / Mieczysław Sobczyk. - Wyd.1 - Lublin : Wydaw.Uniw.M.Curie-Skłodowskiej, 2000 - 425 s. ; 25 cm. - ISBN 83-227-1608-7 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||