Spośród rencistów województwa podkarpackiego wylosowano 60 osób i zapytano o wysokość rocznego dochodu z tytułu pobieranej renty, a wyniki przedstawiono następująco:
Dochód (w tys. zł)
|
0 - 4
|
4 - 8
|
8 - 12
|
12 - 16
|
16 - 20
|
20 - 24
|
Liczba rencistów
|
2
|
15
|
23
|
10
|
6
|
4
|
Źródło: dane umowne
Przyjmując współczynnik ufności równy 0,95, zbudować przedział ufności dla odchylenia standardowego dochodu dla populacji rencistów.
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu całego zadania zwracamy uwagę na zdanie:
Przyjmując współczynnik ufności równy 0,95, zbudować przedział ufności dla odchylenia standardowego dochodu dla populacji rencistów.
Występują tu zwroty:
zbudować przedział ufności
i
współczynnik ufności
- w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
Spośród rencistów województwa podkarpackiego wylosowano 60 osób i zapytano o wysokość rocznego dochodu z tytułu pobieranej renty, a wyniki przedstawiono następująco:
Dochód (w tys. zł)
|
0 - 4
|
4 - 8
|
8 - 12
|
12 - 16
|
16 - 20
|
20 - 24
|
Liczba rencistów
|
2
|
15
|
23
|
10
|
6
|
4
|
Źródło: dane umowne
Od razu uzyskujemy informację, że wylosowaliśmy próbę, a jej liczebność to
osób i od tego momentu będziemy stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji. Podano również wyniki z próby w tabeli. Jeżeli dysponujemy danymi dotyczącymi próby ujętymi w tabeli, to zawsze możemy policzyć średnią
, wariancję
i odchylenie standardowe
(lub
,
). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach.
Przyjmując współczynnik ufności równy 0,95, zbudować przedział ufności dla odchylenia standardowego dochodu dla populacji rencistów.
Podano też współczynnik ufności
. Od razu wyznaczamy
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA
renciści województwa podkarpackiego
|
PRÓBA
60 wybranych rencistów
|
|
- dane tabelaryczne (można obliczyć średnią
, wariancję
, odchylenie standardowe
)
|
- współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:
Przyjmując współczynnik ufności równy 0,95, zbudować przedział ufności dla
odchylenia standardowego
dochodu dla populacji rencistów.
Wyrażenie
odchylenie standardowe
oznacza, że będziemy budować przedział ufności oczywiście dla odchylenia standardowego
z populacji.
Spójrzmy w kartę wzorów. Dla odchylenia standardowego mamy do wyboru dwa modele. Teraz wracamy do danych i sprawdzamy, czy jest
znana i jaka jest liczebność próby.
nie jest znana
, a liczebność próby
jest większa od 30
, zatem wybieramy
model II
.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych z tabeli i uzupełniamy wzór
konkretnymi danymi.
Jak widać do obliczenia końcówek przedziału ufności potrzebujemy odchylenia standardowego
z próby. W związku z tym, zanim zajmiemy się uzupełnianiem właściwego wzoru, należy obliczyć (na razie) nieznany parametr. Liczenie odchylenia standardowego jest zagadnieniem ze statystyki opisowej. Dysponujemy danymi tabelarycznymi, gdzie warianty cechy (dochód) są w formie przedziałów tzn. od jednej wartości do drugiej wartości. Taki szereg określa się szeregiem rozdzielczym przedziałowym. Przeredagujmy zatem tabelę z zadania właśnie na tą postać szeregu.
- warianty obserwacji (dochód)
|
- liczebności poszczególnych przedziałów klasowych (liczba rencistów)
|
|
|
|
|
|
|
|
|
|
|
|
|
(suma)
|
|
W przypadku szeregu rozdzielczego przedziałowego nie ma możliwości pomyłki do tego, co jest wariantem cechy, a co liczebnością
, ponieważ nie zdarza się, aby
było zapisane w formie przedziałów. Symbol
to po prostu ogólny zapis przedziału lewostronnie domkniętego i prawostronnie otwartego (chyba najczęściej używany – chociaż zależy od preferencji prowadzącego). Należy pilnować, aby końcówka każdego przedziału była początkiem następnego. W tabeli z zadania mamy właśnie przedstawioną sytuację
,
(kończymy przedział na 4, następny również zaczynamy od 4), itd. w związku z tym nie musimy nic zmieniać, zachowana jest ciągłość.
Aby otrzymać odchylenie standardowe i tak musimy obliczyć wariancję, bo odchylenie jest pierwiastkiem kwadratowym z wariacji. Wzór na wariancję z danych szeregu przedziałowego wygląda następująco:
. Jest też alternatywa
, ale będziemy używać pierwszej wersji. Okazuje się, że do policzenia wariancji i tak niezbędna jest średnia.
W szeregu przedziałowym średnią liczymy ze wzoru
. Na początku wyjaśnijmy symbol
. Oznacza on środek każdego z podanych przedziałów, a obliczany jest na podstawie formuły
. Upraszczając, należy zsumować początek i koniec każdego przedziału i wynik podzielić na dwa. Wracamy do wzoru na średnią. Znak
oznacza sumę. Pod tym symbolem znajduje się zapis
, a nad nim
,
to środki kolejnych przedziałów , a
liczebności dla kolejnych przedziałów. Wszystko razem oznacza, że będziemy sumować kolejne iloczyny
, gdzie
będzie rosło od
aż do wartości
, czyli
, a więc ogólnie:
W naszym przypadku
znad znaku sumy oznacza liczbę przedziałów klasowych (ilość wierszy w tabeli z danymi). Tak więc średnia będzie miała uproszczony wzór:
=
Czym jest
,
oraz
? Wszystko to zostanie pokazane dokładnie w tabeli. Obliczmy w niej również środki poszczególnych przedziałów.
Numer klasy
|
- warianty obserwacji (dochód)
|
- środki przedziałów
|
- liczebności poszczególnych przedziałów klasowych (liczba rencistów)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(suma)
|
|
|
Uzupełniając wzór średniej dla
otrzymujemy:
=
i oczywiście możemy uzupełnić go danymi z tabeli, ale proponuję nadal korzystać z tabeli i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższy niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na średnią z szeregu przedziałowego, a jej nagłówki zawsze wyglądają tak samo. Każdą wartość
mnożymy przez odpowiadającą jej wartość
, a następnie sumujemy powstałe iloczyny. Przecięcie wiersza z symbolem
i kolumny
daje kompletny licznik wzoru na średnią.
Numer klasy
|
- środki przedziałów
|
- liczebności poszczególnych przedziałów klasowych
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Dysponujemy wartością średniej, zatem możemy wrócić do obliczania wariancji. Rozpiszemy wzór analogicznie jak w przypadku średniej. Najpierw ogólnie:
i dla
:
Tu też można podstawiać dane z tabeli, ale ponownie proponuję trzymać się obliczeń tabelarycznych. Można kontynuować poprzednią tabelę dopisując kolejne kolumny. Znowu krok po kroku będziemy tworzyć licznik ze wzoru. Dopisana pierwsza kolumna - od każdego środka przedziału
odejmujemy wcześniej wyliczoną średnią
, druga kolumna to podniesienie wyników z poprzedniej do kwadratu. Ostatnia to wymnożenie wyników z drugiej przez odpowiadające im wartości
i dopiero ona jest sumowana (przecięcie wiersza z symbolem
i
daje kompletny licznik wzoru na wariancję).
Numer klasy
|
- środki przedziałów
|
- liczebności poszczególnych przedziałów klasowych
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Odchylenie standardowe
to pierwiastek z wariancji
.
Wracamy do danych z tabeli i wreszcie uzupełniamy wzór
konkretnymi danymi.
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka
u
, zatem skorzystamy z tablic rozkładu normalnego (link). Zapis
oznacza konieczność odnalezienia statystyki dla
. Czytanie z tablic rozkładu normalnego nie jest trudne. Sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. W przypadku
sumujemy
i
czyli
.
Wracamy do obliczeń i podstawiamy
(zaokrąglanie to indywidualna sprawa wynikająca najczęściej z preferencji prowadzącego):
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy:
Interpretacja brzmi następująco: Z ufnością 0,95 nieznane odchylenie standardowe dochodu dla populacji rencistów województwa podkarpackiego mieści się w przedziale od 4,14 do 5,94 tys. zł.
Statystyka ogólna w zadaniach / Woźniak Michał, Wyd. 2, Kraków: Wydawnictwo Akademii Ekonomicznej w Krakowie, ISBN: 978-83-7252-474-4, str. 171