Zadanie 35
Wylosowano niezależnie 10 indywidualnych gospodarstw rolnych w pewnej wsi i otrzymano dla nich następujące wielkości uzyskanych plonów owsa (w q/ha): 18,1; 17,0; 17,5; 17,8; 18,3; 16,7; 18,0; 15,9; 17,6; 18,1. Wyznacz przedział ufności dla średniego plonu owsa przyjmując współczynnik ufności 0,98.
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu zadania zwracamy uwagę na zdania:
„Wyznacz przedział ufności dla średniego plonu owsa przyjmując współczynnik ufności 0,98. ”
Odnajdujemy w nich zwroty: wyznacz przedział ufności i współczynnik ufności. Teraz mamy pewność, że zadanie dotyczy estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
„Wylosowano niezależnie 10 indywidualnych gospodarstw rolnych w pewnej wsi i otrzymano dla nich następujące wielkości uzyskanych plonów owsa (w q/ha): 18,1; 17,0; 17,5; 17,8; 18,3; 16,7; 18,0; 15,9; 17,6; 18,1.”
W tym momencie wiemy, że wylosowaliśmy próbę, a jej liczebność to
gospodarstw i w związku z tym będziemy prawdopodobnie stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji. Podano również informacje o konkretnych wynikach z próby. Jeżeli dysponujemy wartościami wypisanymi po przecinku tzw. danymi indywidualnymi, to zawsze możemy policzyć średnią
, wariancję
i odchylenie standardowe
(lub
,
). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach.
„Wyznacz przedział ufności dla średniego plonu owsa przyjmując współczynnik ufności 0,98. „
Podano też współczynnik ufności
. Od razu wyznaczamy
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
|
POPULACJA
gospodarstwa rolne w pewnej wsi
|
PRÓBA
10 wybranych gospodarstw
|
|
|
– dane indywidualne (można obliczyć średnią , wariancję , odchylenie standardowe )
|
- współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:
„Wyznacz przedział ufności dla średniego plonu owsa przyjmując współczynnik ufności 0,98. ”
Wyraz średniego oznacza, że będziemy budować przedział ufności dla wartości średniej
z populacji.
Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy
jest znana i jaka jest liczebność próby.
nie jest znana, a liczebność próby
jest mniejsza od 30 (
), zatem wybieramy model II. Dysponujemy danymi indywidualnymi, więc możemy wyznaczyć z nich
lub
. Decyzja, którą opcję wybrać należy do nas, jest to właściwie obojętne, ale najczęściej wybiera się
(o ile nie zostanie narzucone inaczej), także interesuje nas pierwsza wersja wzoru z wybranego modelu.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
-
Wracamy do danych w tabeli i uzupełniamy wzór
konkretnymi liczbami. Jak widać potrzebujemy średniej z próby
i odchylenia standardowego
. W związku z tym zanim zajmiemy się uzupełnianiem właściwego wzoru należy obliczyć dwa (na razie) nieznane parametry. Liczenie średniej, wariacji i odchylenia standardowego jest zagadnieniem ze statystyki opisowej. Dysponujemy danymi indywidualnymi (wypisanymi po przecinku), jest ich niewiele i w dużej mierze nie powtarzają się - zatem średnią liczymy ze wzoru
. Oczywiście na chłopski rozum średnią można policzyć sumując wszystkie dane, a potem dzieląc przez ilość – i jest to jak najbardziej prawidłowe rozwiązanie, a ten wzór oznacza to samo. Jednak zdaję sobie sprawę, że widząc „hieroglify” tego typu wiele osób nie wie co robić, a tym bardziej jak je rozpisywać :). Mając to na uwadze postaram się przybliżyć kwestię wzorów rozpisując je na czynniki pierwsze.
Znak
oznacza sumę. Pod tym symbolem znajduje się zapis
, a nad nim
,
to wartości kolejnych obserwacji. Wszytko razem oznacza, że będziemy sumować kolejne obserwacje oznaczone symbolem
, gdzie
będzie rosło od
aż do wartości
, a więc
.
Tak więc średnia będzie miała uproszczony wzór:
Teraz przełożymy wszystko na dane z zadania. Liczebność próby wynosi
, a więc wzór na średnią możemy zapisać następująco:
Czym jest
? To są konkretne wyniki z próby, a więc
. Jeśli ktoś chciałby uporządkować dane indywidualne od najmniejszej do największej, może to spokojnie zrobić. Porządkowanie liczb nie wpływa na wynik, także może zostać tak jak jest. A więc
.
Obliczamy średnią:
Zostało nam jeszcze odchylenie standardowe
. Na początek i tak musimy obliczyć wariancję
, bo
. Wzór na wariancję z danych indywidualnych wygląda tak:
. Jest też alternatywa
, ale będziemy używać pierwszej wersji. Rozpisanie wzoru będzie analogiczne jak w przypadku średniej. Na początek ogólnie:
i dla
:
Jak widać do policzenia wariancji i tak niezbędna jest średnia.
Możemy już podstawiać liczby za
, ale proponuję utworzyć tabelkę i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższym tasiemcem niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na wariancję z danych indywidualnych, a jej nagłówki zawsze wyglądają tak samo. Na początku od każdego wartości
odejmujemy średnią, a następnie wynik podnosimy do kwadratu. Sumujemy ostatnią kolumnę (przecięcie wiersza z symbolem
i
daje kompletny licznik wzoru na wariancję )
Odchylenie standardowe
to pierwiastek z wariancji
.
Wracamy do istoty zadania i wreszcie uzupełniamy wzór
.
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka t, zatem skorzystamy z tablic t-Studenta. Zapis
oznacza statystykę dla
i 9 stopni swobody.
Wracamy do obliczeń i podstawiamy
:
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy: .
Interpretacja brzmi następująco:
Z ufnością 0,98 wartość nieznanego średniego plonu ziemi dla ogółu gospodarstw w danej wsi mieści się się w przedziale od 16,82 q/ha do 18,18 q/ha.