Zadanie 35

Wylosowano niezależnie 10 indywidualnych gospodarstw rolnych w pewnej wsi i otrzymano dla nich następujące wielkości uzyskanych plonów owsa (w q/ha): 18,1; 17,0; 17,5; 17,8; 18,3; 16,7; 18,0; 15,9; 17,6; 18,1. Wyznacz przedział ufności dla średniego plonu owsa przyjmując współczynnik ufności 0,98.

1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?

Po przeczytaniu zadania zwracamy uwagę na zdania:

„Wyznacz przedział ufności dla średniego plonu owsa przyjmując współczynnik ufności 0,98. ”

Odnajdujemy w nich zwroty: wyznacz przedział ufności i współczynnik ufności. Teraz mamy pewność, że zadanie dotyczy estymacji przedziałowej.

2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.

Analizujemy zdanie po zdaniu.

„Wylosowano niezależnie 10 indywidualnych gospodarstw rolnych w pewnej wsi i otrzymano dla nich następujące wielkości uzyskanych plonów owsa (w q/ha): 18,1; 17,0; 17,5; 17,8; 18,3; 16,7; 18,0; 15,9; 17,6; 18,1.”

W tym momencie wiemy, że wylosowaliśmy próbę, a jej liczebność to gospodarstw i w związku z tym będziemy prawdopodobnie stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji. Podano również informacje o konkretnych wynikach z próby. Jeżeli dysponujemy wartościami wypisanymi po przecinku tzw. danymi indywidualnymi, to zawsze możemy policzyć średnią , wariancję i odchylenie standardowe (lub , ). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach.

„Wyznacz przedział ufności dla średniego plonu owsa przyjmując współczynnik ufności 0,98. „

Podano też współczynnik ufności . Od razu wyznaczamy .

Podsumowując tworzymy przejrzystą tabelę z danymi:

POPULACJA

gospodarstwa rolne w pewnej wsi

PRÓBA

10 wybranych gospodarstw

– dane indywidualne (można obliczyć średnią , wariancję , odchylenie standardowe )

- współczynnik ufności,

3. WYBÓR ODPOWIEDNIEGO WZORU.

Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:

„Wyznacz przedział ufności dla średniego plonu owsa przyjmując współczynnik ufności 0,98. ”

Wyraz średniego oznacza, że będziemy budować przedział ufności dla wartości średniej z populacji.

Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby. nie jest znana, a liczebność próby jest mniejsza od 30 ( ), zatem wybieramy model II. Dysponujemy danymi indywidualnymi, więc możemy wyznaczyć z nich lub . Decyzja, którą opcję wybrać należy do nas, jest to właściwie obojętne, ale najczęściej wybiera się (o ile nie zostanie narzucone inaczej), także interesuje nas pierwsza wersja wzoru z wybranego modelu.

4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.

Wracamy do danych w tabeli i uzupełniamy wzór konkretnymi liczbami. Jak widać potrzebujemy średniej z próby i odchylenia standardowego . W związku z tym zanim zajmiemy się uzupełnianiem właściwego wzoru należy obliczyć dwa (na razie) nieznane parametry. Liczenie średniej, wariacji i odchylenia standardowego jest zagadnieniem ze statystyki opisowej. Dysponujemy danymi indywidualnymi (wypisanymi po przecinku), jest ich niewiele i w dużej mierze nie powtarzają się - zatem średnią liczymy ze wzoru . Oczywiście na chłopski rozum średnią można policzyć sumując wszystkie dane, a potem dzieląc przez ilość – i jest to jak najbardziej prawidłowe rozwiązanie, a ten wzór oznacza to samo. Jednak zdaję sobie sprawę, że widząc „hieroglify” tego typu wiele osób nie wie co robić, a tym bardziej jak je rozpisywać :). Mając to na uwadze postaram się przybliżyć kwestię wzorów rozpisując je na czynniki pierwsze.

Znak oznacza sumę. Pod tym symbolem znajduje się zapis , a nad nim , to wartości kolejnych obserwacji. Wszytko razem oznacza, że będziemy sumować kolejne obserwacje oznaczone symbolem , gdzie będzie rosło od aż do wartości , a więc .

Tak więc średnia będzie miała uproszczony wzór:

Teraz przełożymy wszystko na dane z zadania. Liczebność próby wynosi , a więc wzór na średnią możemy zapisać następująco:

Czym jest ? To są konkretne wyniki z próby, a więc . Jeśli ktoś chciałby uporządkować dane indywidualne od najmniejszej do największej, może to spokojnie zrobić. Porządkowanie liczb nie wpływa na wynik, także może zostać tak jak jest. A więc .

Obliczamy średnią:

Zostało nam jeszcze odchylenie standardowe . Na początek i tak musimy obliczyć wariancję , bo . Wzór na wariancję z danych indywidualnych wygląda tak: . Jest też alternatywa , ale będziemy używać pierwszej wersji. Rozpisanie wzoru będzie analogiczne jak w przypadku średniej. Na początek ogólnie:

i dla :

Jak widać do policzenia wariancji i tak niezbędna jest średnia.

Możemy już podstawiać liczby za , ale proponuję utworzyć tabelkę i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższym tasiemcem niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na wariancję z danych indywidualnych, a jej nagłówki zawsze wyglądają tak samo. Na początku od każdego wartości odejmujemy średnią, a następnie wynik podnosimy do kwadratu. Sumujemy ostatnią kolumnę (przecięcie wiersza z symbolem i daje kompletny licznik wzoru na wariancję )












(suma)

Odchylenie standardowe to pierwiastek z wariancji .

Wracamy do istoty zadania i wreszcie uzupełniamy wzór .

Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka t, zatem skorzystamy z tablic t-Studenta. Zapis oznacza statystykę dla i 9 stopni swobody.

Wracamy do obliczeń i podstawiamy :

5. WYNIK I INTERPRETACJA.

Ostatecznie otrzymujemy: .

Interpretacja brzmi następująco:

Z ufnością 0,98 wartość nieznanego średniego plonu ziemi dla ogółu gospodarstw w danej wsi mieści się się w przedziale od 16,82 q/ha do 18,18 q/ha.