ISBN 83-7011-783-X str.278

Struktura wieku inwestorów giełdowych w pewnej grupie zawodowej jest następująca:

Wiek w latach	15 - 25	25 - 35	35 - 45	45 - 55
Liczba osób	2	5	10	9

Zakładając, że wiek ma rozkład , wyznaczyć przedział ufności dla wariancji wieku na poziomie ufności .

1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?

Po przeczytaniu całego zadania zwracamy uwagę na zdanie:

Zakładając, że wiek ma rozkład , wyznaczyć przedział ufności dla wariancji wieku na poziomie ufności .

Występują tu charakterystyczne dla tej grupy zadań zwroty: wyznaczyć przedział ufności i poziom ufności - w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej.

2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.

Analizujemy zdanie po zdaniu.

Struktura wieku inwestorów giełdowych w pewnej grupie zawodowej jest następująca:

Wiek w latach	15 - 25	25 - 35	35 - 45	45 - 55
Liczba osób	2	5	10	9

W zadaniu nie poinformowano bezpośrednio, że wylosowano próbę, ale podano w tabeli dane dotyczące inwestorów w pewnej grupie zawodowej. Możemy z dużą pewnością przyjąć, że jest to właśnie próba, ponieważ przedstawienie wieku całej populacji inwestorów jest zwyczajnie niemożliwe (to tak jakby pytano w sondażach wyborczych wszystkich obywateli - wybiera się grupę). W związku z tym, gdy w zadaniu pojawia się tabela i nie ma wskazań, że dotyczy populacji, przyjmujemy, że dane w niej zawarte dotyczą próby. Możemy również podać liczebność próby sumując liczbę osób z poszczególnych kategorii wiekowych, a więc Estymacja wariancji - obraz numer 1601 . Jeżeli dysponujemy danymi dotyczącymi próby ujętymi w tabeli, to zawsze możemy policzyć średnią , wariancję i odchylenie standardowe (lub , ). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach.

Zakładając, że wiek ma rozkład , wyznaczyć przedział ufności dla wariancji wieku na poziomie ufności .

W tym zdaniu występuje założenie normalności rozkładu wieku inwestorów i to już odnosi się do populacji (wcześniej wspominałam w części teoretycznej, że próba jest z reguły za mała aby stwierdzić rozkład normalny). Nie mamy informacji na temat tego rozkładu, zatem możemy tylko zapisać Estymacja wariancji - obraz numer 1609 - rozkład normalny o nieznanej średniej i nieznanym odchyleniu standardowym . Podano też współczynnik ufności . Od razu wyznaczamy .

Podsumowując tworzymy przejrzystą tabelę z danymi:

POPULACJA inwestorzy giełdowi w pewnej grupie zawodowej	PRÓBA 26 wybranych inwestorów
- rozkład normalny o nieznanej średniej i nieznanym odchyleniu standardowym	- dane tabelaryczne (można obliczyć średnią , wariancję , odchylenie standardowe )

Estymacja wariancji - obraz numer 1621 - współczynnik ufności,

3. WYBÓR ODPOWIEDNIEGO WZORU.

Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:

Zakładając, że wiek ma rozkład , wyznaczyć przedział ufności dla wariancji wieku na poziomie ufności .

Słowo wariancja oznacza, że będziemy budować przedział ufności oczywiście dla wariancji z populacji.

Spójrzmy w kartę wzorów. Dla wariancji mamy do wyboru dwa modele. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby. nie jest znana , a liczebność próby Estymacja wariancji - obraz numer 1628 jest mniejsza od 30 , zatem wybieramy model I . W danych nie ma ani , więc nie ma znaczenia, którą wersję wzoru wybierzemy. Z reguły interesuje nas pierwsza wersja wzoru z wybranego modelu.

Estymacja wariancji - obraz numer 1632

4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.

Wracamy do danych z tabeli i uzupełniamy wzór Estymacja wariancji - obraz numer 1633 konkretnymi danymi.

Jak widać brakuje tylko Estymacja wariancji - obraz numer 1634 , więc dopóki nie znajdziemy wartości tego parametru nie możemy obliczyć końcówek przedziału ufności dla wariancji. Wyliczanie wariacji z próby jest zagadnieniem ze statystki opisowej.

Dysponujemy danymi tabelarycznymi, gdzie warianty cechy (wiek w latach) są w formie przedziałów tzn. od jednej wartości do drugiej wartości. Taki szereg określa się szeregiem rozdzielczym przedziałowym. Przeredagujmy zatem tabelę z zadania właśnie na tą postać szeregu.

- warianty obserwacji (wiek w latach)	- liczebności poszczególnych przedziałów klasowych (liczba osób)




(suma)

W przypadku szeregu rozdzielczego przedziałowego nie ma możliwości pomyłki do tego, co jest wariantem cechy, a co liczebnością Estymacja wariancji - obraz numer 1647 , ponieważ nie zdarza się, aby było zapisane w formie przedziałów. Symbol to po prostu ogólny zapis przedziału lewostronnie domkniętego i prawostronnie otwartego (chyba najczęściej używany – chociaż zależy od preferencji prowadzącego). Należy pilnować, aby końcówka każdego przedziału była początkiem następnego. W tabeli z zadania mamy właśnie przedstawioną sytuację Estymacja wariancji - obraz numer 1650 , (kończymy przedział na 25, następny również zaczynamy od 25), itd. w związku z tym nie musimy nic zmieniać, zachowana jest ciągłość.

Wzór na wariancję z danych szeregu przedziałowego wygląda następująco: Estymacja wariancji - obraz numer 1652 . Jest też alternatywa , ale będziemy używać pierwszej wersji. Okazuje się, że do policzenia wariancji i tak niezbędna jest średnia.

W szeregu przedziałowym średnią liczymy ze wzoru Estymacja wariancji - obraz numer 1655 . Na początku wyjaśnijmy symbol . Oznacza on środek każdego z podanych przedziałów, a obliczany jest na podstawie formuły . Upraszczając, należy zsumować początek i koniec każdego przedziału i wynik podzielić na dwa. Wracamy do wzoru na średnią. Znak Estymacja wariancji - obraz numer 1659 oznacza sumę. Pod tym symbolem znajduje się zapis , a nad nim , to środki kolejnych przedziałów , a liczebności dla kolejnych przedziałów. Wszystko razem oznacza, że będziemy sumować kolejne iloczyny Estymacja wariancji - obraz numer 1664 , gdzie będzie rosło od aż do wartości , czyli , a więc ogólnie:

Estymacja wariancji - obraz numer 1669

W naszym przypadku Estymacja wariancji - obraz numer 1670 znad znaku sumy oznacza liczbę przedziałów klasowych (ilość wierszy w tabeli z danymi). Tak więc średnia będzie miała uproszczony wzór:

Estymacja wariancji - obraz numer 1671 =

Czym jest Estymacja wariancji - obraz numer 1674 , oraz ? Wszystko to zostanie pokazane dokładnie w tabeli. Obliczmy w niej również środki poszczególnych przedziałów.

Numer klasy	- warianty obserwacji (wiek w latach)	- środki przedziałów	- liczebności poszczególnych przedziałów klasowych (liczba osób)




	(suma)

Uzupełniając wzór średniej dla Estymacja wariancji - obraz numer 1699 otrzymujemy:

Estymacja wariancji - obraz numer 1700 = i oczywiście możemy uzupełnić go danymi z tabeli, ale proponuję nadal korzystać z tabeli i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższy niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na średnią z szeregu przedziałowego, a jej nagłówki zawsze wyglądają tak samo. Każdą wartość Estymacja wariancji - obraz numer 1703 mnożymy przez odpowiadającą jej wartość , a następnie sumujemy powstałe iloczyny. Przecięcie wiersza z symbolem i kolumny daje kompletny licznik wzoru na średnią.

Numer klasy	- środki przedziałów	- liczebności poszczególnych przedziałów klasowych

Estymacja wariancji - obraz numer 1729

Dysponujemy wartością średniej, zatem możemy wrócić do obliczania wariancji. Rozpiszemy wzór analogicznie jak w przypadku średniej. Najpierw ogólnie:

Estymacja wariancji - obraz numer 1730

i dla Estymacja wariancji - obraz numer 1731 :

Estymacja wariancji - obraz numer 1732

Tu też można podstawiać dane z tabeli, ale ponownie proponuję trzymać się obliczeń tabelarycznych. Można kontynuować poprzednią tabelę dopisując kolejne kolumny. Znowu krok po kroku będziemy tworzyć licznik ze wzoru. Dopisana pierwsza kolumna - od każdego środka przedziału Estymacja wariancji - obraz numer 1733 odejmujemy wcześniej wyliczoną średnią , druga kolumna to podniesienie wyników z poprzedniej do kwadratu. Ostatnia to wymnożenie wyników z drugiej przez odpowiadające im wartości i dopiero ona jest sumowana (przecięcie wiersza z symbolem Estymacja wariancji - obraz numer 1736 i daje kompletny licznik wzoru na wariancję).

Numer klasy	- środki przedziałów	- liczebności poszczególnych przedziałów klasowych

Estymacja wariancji - obraz numer 1770

Wracamy do istoty zadania i wreszcie uzupełniamy wzór Estymacja wariancji - obraz numer 1771 :

Estymacja wariancji - obraz numer 1772

Estymacja wariancji - obraz numer 1773

Estymacja wariancji - obraz numer 1774

Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka Estymacja wariancji - obraz numer 1775 (grecka litera czyt. chi ), zatem skorzystamy z tablic rozkładu chi-kwadrat (link). W tym przypadku będziemy odczytywać statystykę dwukrotnie, ponieważ w uzupełnionym wzorze występują dwa nieco różniące się symbole: oraz Estymacja wariancji - obraz numer 1777 . Zapis oznacza konieczność odnalezienia w tablicach statystyki dla i 25 stopni swobody:

Estymacja wariancji - obraz numer 1780

Z kolei zapis Estymacja wariancji - obraz numer 1781 oznacza konieczność odnalezienia w tablicach statystyki dla i 25 stopni swobody:

Estymacja wariancji - obraz numer 1783

Wracamy do obliczeń i podstawiamy Estymacja wariancji - obraz numer 1784 oraz :

Estymacja wariancji - obraz numer 1786

5. WYNIK I INTERPRETACJA.

Ostatecznie otrzymujemy: Estymacja wariancji - obraz numer 1787

Interpretacja brzmi następująco: Z ufnością 0,98 nieznana wariancja wieku ogółu inwestorów giełdowych w pewnej grupie zawodowej mieści się w przedziale od 49,65 do 192,58 (lat) ² .

Powstała dziwna jednostka - (lat) ² , ale w przypadku wariancji (jednostka podniesiona do kwadratu) nie jest to nic nadzwyczajnego i nie należy na to zwracać większej uwagi. Przyjęło się zresztą, że samej wariancji się nie interpretuje, ale już odchylenie standardowe, które jest pierwiastkiem z wariacji - jak najbardziej.