NEW
Kategoria-Matematyka Kategoria-Statystyka Kategoria-Korepetycje
Kategoria-Matematyka.Podkategoria-PrzydatneWzory Kategoria-Matematyka.Podkategoria-Gimnazjum Kategoria-Matematyka.Podkategoria-Liceum Kategoria-Matematyka.Podkategoria-Studia Kategoria-Statystyka.Podkategoria-Wzory Kategoria-Statystyka.Podkategoria-StatystykaOpisowa Kategoria-Statystyka.Podkategoria-Wnioskowanie Kategoria-Statystyka.Podkategoria-Testy Kategoria-Korepetycje.Podkategoria-Matematyka Kategoria-Korepetycje.Podkategoria-Statystyka
 

Zadanie 36

W Instytucie Chemii przeprowadzono badania czasu trwania określonej reakcji chemicznej. W tym celu wykonano 10 niezależnych prób tego eksperymentu otrzymując następujące wyniki (w sekundach): 9, 14, 10, 12, 7, 13, 11, 12, 10, 8. Zakładając, że rozkład czasu jest normalny:

a) oszacować średni czas trwania badanej reakcji ( ).

b) ustalić, jak zmieni się precyzja oszacowania średniej, jeśli wielkość próby zwiększymy czterokrotnie.

Dla przejrzystości obydwa podpunkty zostaną zrobione oddzielnie.

Ad. a)

 

1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?

 

Po przeczytaniu całego zadania zwracamy uwagę na zdanie:

 

Zakładając, że rozkład czasu jest normalny oszacuj średni czas trwania badanej reakcji ( ).

 

Co prawda nie użyto bezpośrednio zwrotu przedział ufności, ale musimy oszacować czas trwania reakcji, więc wypadałoby podać przedział ufności, bo tzw. estymacja punktowa (tzn. konkretna liczba, a nie przedział) daje wynik o prawdopodobieństwie praktycznie równym zero. Dodatkowo występuje tu symbol współczynnika ufności i w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej.

 

2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.

Analizujemy zdanie po zdaniu.

 

W Instytucie Chemii przeprowadzono badania czasu trwania określonej reakcji chemicznej.

 

W tym zdaniu nie ma żadnych konkretnych danych poza tym, że badaną cechą jest czas trwania reakcji chemicznej.

 

W tym celu wykonano 10 niezależnych prób tego eksperymentu otrzymując następujące wyniki (w sekundach): 9, 14, 10, 12, 7, 13, 11, 12, 10, 8.

 

Kolejne zdanie informuje nas, że wylosowaliśmy próbę, a jej liczebność to i w związku z tym będziemy prawdopodobnie stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla  populacji. Podano również informacje o konkretnych wynikach z próby. Jeżeli dysponujemy wartościami wypisanymi po przecinku tzw. danymi indywidualnymi, to zawsze możemy policzyć średnią , wariancję i odchylenie standardowe (lub , ). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach.

 

Zakładając, że rozkład czasu jest normalny oszacuj średni czas trwania badanej reakcji ( ).

 

W zadaniu występuje założenie normalności rozkładu i to już odnosi się do populacji (wcześniej wspominałam w części teoretycznej, że próba jest z reguły za mała aby stwierdzić rozkład normalny). Nie mamy informacji na temat tego rozkładu, zatem możemy tylko zapisać - rozkład normalny o nieznanej średniej i nieznanym odchyleniu standardowym .

Podano też współczynnik ufności . Od razu wyznaczamy .

 

Podsumowując tworzymy przejrzystą tabelę z danymi:

 

POPULACJA

reakcje chemiczne

PRÓBA

10 wybranych reakcji

- rozkład normalny o nieznanej średniej i nieznanym odchyleniu standardowym

  – dane indywidualne (można obliczyć średnią , wariancję , odchylenie standardowe )

- współczynnik ufności,

 

 

3. WYBÓR ODPOWIEDNIEGO WZORU.

 

Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:

 

Zakładając, że rozkład czasu jest normalny oszacuj średni czas trwania badanej reakcji ( ).

 

Wyraz średni oznacza, że będziemy budować przedział ufności dla wartości średniej z populacji.

Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby. nie jest znana, a liczebność próby jest mniejsza od 30 ( ), zatem wybieramy model II. Dysponujemy danymi indywidualnymi, więc możemy wyznaczyć z nich lub . Decyzja, którą opcję wybrać należy do nas, jest to właściwie obojętne, ale najczęściej wybiera się (o ile nie zostanie narzucone inaczej), także interesuje nas pierwsza wersja wzoru z wybranego modelu.

  1. grafika4

4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.

  1.  

Wracamy do danych w tabeli i uzupełniamy wzór konkretnymi liczbami. Jak widać potrzebujemy średniej z próby i odchylenia standardowego . W związku z tym zanim zajmiemy się uzupełnianiem właściwego wzoru należy obliczyć dwa (na razie) nieznane parametry. Liczenie średniej, wariacji i odchylenia standardowego jest zagadnieniem ze statystyki opisowej. Dysponujemy danymi indywidualnymi (wypisanymi po przecinku), jest ich niewiele i  w dużej mierze nie powtarzają się - zatem średnią liczymy ze wzoru . Oczywiście na chłopski rozum średnią można policzyć sumując wszystkie dane, a potem dzieląc przez ilość – i jest to jak najbardziej prawidłowe rozwiązanie, a ten wzór oznacza to samo. Jednak zdaję sobie sprawę, że widząc „hieroglify” tego typu wiele osób nie wie co robić, a tym bardziej jak je rozpisywać :). Mając to na uwadze postaram się przybliżyć kwestię wzorów rozpisując je na czynniki pierwsze.

Znak oznacza sumę. Pod tym symbolem znajduje się zapis , a nad nim , to wartości kolejnych obserwacji. Wszytko razem oznacza, że będziemy sumować kolejne obserwacje oznaczone symbolem , gdzie będzie rosło od aż do wartości , a więc .

Tak więc średnia będzie miała uproszczony wzór:

 

Teraz przełożymy wszystko na dane z zadania. Liczebność próby wynosi , a więc wzór na średnią możemy zapisać następująco:

 

Czym jest ? To są konkretne wyniki z próby, a więc . Jeśli ktoś chciałby uporządkować dane indywidualne od najmniejszej do największej, może to spokojnie zrobić. Porządkowanie liczb nie wpływa na wynik, także może zostać tak jak jest. A więc .

 

Obliczamy średnią:

 

Zostało nam jeszcze odchylenie standardowe . Na początek i tak musimy obliczyć wariancję , bo . Wzór na wariancję z danych indywidualnych wygląda tak: . Jest też alternatywa , ale będziemy używać pierwszej wersji. Rozpisanie wzoru będzie analogiczne jak w przypadku średniej. Na początek ogólnie:

 

i dla :

 

Jak widać do policzenia wariancji i tak niezbędna jest średnia.

Możemy już podstawiać liczby za , ale proponuję utworzyć tabelkę i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższym tasiemcem niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na wariancję z danych indywidualnych, a jej nagłówki zawsze wyglądają tak samo. Na początku od każdego wartości odejmujemy średnią, a następnie wynik podnosimy do kwadratu. Sumujemy ostatnią kolumnę (przecięcie wiersza z symbolem i daje kompletny licznik wzoru na wariancję )

 

(suma)

 

 

 

Odchylenie standardowe to pierwiastek z wariancji .

 

Wracamy do istoty zadania i wreszcie uzupełniamy wzór .

 

 

 

Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka t, zatem skorzystamy z tablic t-Studenta. Zapis oznacza statystykę dla i 9 stopni swobody.

grafika5

Wracamy do obliczeń i podstawiamy :

 

 

5. WYNIK I INTERPRETACJA.

 

Ostatecznie otrzymujemy: .

Interpretacja brzmi następująco:

Z ufnością 0,95 średni czas trwania badanej reakcji mieści się w przedziale od 9,01 sekund do 12,19 sekund.

 

Ad. b)

Na początku ustalimy precyzję oszacowania dla danych wyjściowych. Aby porównać precyzję oszacowania po zmianie liczebności próby najlepiej posłużyć się względną precyzją szacunku, ponieważ porównywanie wielkości wyrażonych w procentach jest najbezpieczniejsze.

 

Względną precyzję oszacowania wartości oczekiwanej określamy wzorem: , gdzie (bezwzględny błąd szacunku) jest wielkością odejmowaną i dodawaną do średniej , a w związku z tym, że wybraliśmy dla liczebności próby formułę na estymację średniej: , to wygląda tak:

 

czyli . Powtarzam jeszcze raz, że formuła na obliczenie zależy od wzoru wybranego na przedział ufności, ale zawsze jest to wielkość odejmowana i dodawana do średniej .

Uzupełniamy wzór:

 

W podpunkcie a) odczytaliśmy z tablic t – Studenta

 

 

Względna precyzja , a więc

 

Teraz ustalimy względną precyzję szacunku po czterokrotnym zwiększeniu próby, a więc nowa liczebność . Zakładamy, że inne parametry z danych nie ulegają zmianie (średnia, odchylenie standardowe). Tym razem jednak, gdyby pytano nas o estymację średniej, wzór uległby zmianie. Nie znamy dalej , ale liczebność próby jest już większa od 30, zatem wybralibyśmy model III i wzór .

I tu analogicznie względną precyzję oszacowania wartości oczekiwanej określamy wzorem , gdzie (bezwzględny błąd szacunku) jest znowu wielkością odejmowaną i dodawaną do średniej :

czyli .

Oczywiście zależy od wybranego wzoru na estymację.

Uzupełniamy wzór:

 

Symbol u oznacza konieczność odczytania odpowiedniej statystyki z tablic rozkładu normalnego.

Czytanie z tablic rozkładu normalnego nie jest trudne. Sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. W przypadku sumujemy i czyli .

grafika10

Wracamy do obliczeń i podstawiamy (zaokrąglanie to indywidualna sprawa wynikająca najczęściej z preferencji prowadzącego):

Względna precyzja , a więc

 

Po zwiększeniu liczebności próby z 10 osób do 40 względna precyzja oszacowania wzrosła o około punktu procentowego, czyli około 2,5 raza. Coś tu jednak się nie zgadza, prawda? Przecież po zwiększeniu liczebności próby otrzymaliśmy mniejszą liczbę i na chłopski rozum względna precyzja uległa zmniejszeniu. Z względną precyzją szacunku jest tak, że im większa wartość liczbowa otrzymana w wyniku tym gorsza precyzja oszacowania. Jeśli interpretuje się względną precyzję szacunku to wartość poniżej 5% mówi nam, że wnioskowanie o parametrze (w tym przypadku ) jest uprawnione i całkowicie bezpieczne, jeżeli mieści się od 5% do 10% wnioskowanie jest możliwe, ale z zalecaną ostrożnością, a jeśli przekracza 10% wnioskowanie jest niewiarygodne i należy je przerwać. Uzyskiwanie niezadowalającej (powyżej 5%, a tym bardziej powyżej 10%) względnej precyzji szacunku może być spowodowane zbyt wysokim współczynnikiem ufności, zbyt małą liczebnością próby oraz wysokim zróżnicowaniem wyników w próbie (np. duży rozstrzał danych).

 

 

 

Zadanie pochodzi z: Statystyka zbiór zadań / Helena Kassyk-Rokicka. - Polskie Wydawnictwo Ekonomiczne - ISBN 83-208-1107-4