NEW | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
ISBN 83-7011-783-X str.278 Struktura wieku inwestorów giełdowych w pewnej grupie zawodowej jest następująca:
Zakładając, że wiek ma rozkład , wyznaczyć przedział ufności dla wariancji wieku na poziomie ufności . 1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?Po przeczytaniu całego zadania zwracamy uwagę na zdanie: Zakładając, że wiek ma rozkład , wyznaczyć przedział ufności dla wariancji wieku na poziomie ufności . Występują tu charakterystyczne dla tej grupy zadań zwroty: wyznaczyć przedział ufności i poziom ufności - w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej. 2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.Analizujemy zdanie po zdaniu. Struktura wieku inwestorów giełdowych w pewnej grupie zawodowej jest następująca:
W zadaniu nie poinformowano bezpośrednio, że wylosowano próbę, ale podano w tabeli dane dotyczące inwestorów w pewnej grupie zawodowej. Możemy z dużą pewnością przyjąć, że jest to właśnie próba, ponieważ przedstawienie wieku całej populacji inwestorów jest zwyczajnie niemożliwe (to tak jakby pytano w sondażach wyborczych wszystkich obywateli - wybiera się grupę). W związku z tym, gdy w zadaniu pojawia się tabela i nie ma wskazań, że dotyczy populacji, przyjmujemy, że dane w niej zawarte dotyczą próby. Możemy również podać liczebność próby sumując liczbę osób z poszczególnych kategorii wiekowych, a więc . Jeżeli dysponujemy danymi dotyczącymi próby ujętymi w tabeli, to zawsze możemy policzyć średnią , wariancję i odchylenie standardowe (lub , ). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach. Zakładając, że wiek ma rozkład , wyznaczyć przedział ufności dla wariancji wieku na poziomie ufności . W tym zdaniu występuje założenie normalności rozkładu wieku inwestorów i to już odnosi się do populacji (wcześniej wspominałam w części teoretycznej, że próba jest z reguły za mała aby stwierdzić rozkład normalny). Nie mamy informacji na temat tego rozkładu, zatem możemy tylko zapisać - rozkład normalny o nieznanej średniej i nieznanym odchyleniu standardowym . Podano też współczynnik ufności . Od razu wyznaczamy . Podsumowując tworzymy przejrzystą tabelę z danymi:
- współczynnik ufności, 3. WYBÓR ODPOWIEDNIEGO WZORU.Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo: Zakładając, że wiek ma rozkład , wyznaczyć przedział ufności dla wariancji wieku na poziomie ufności . Słowo wariancja oznacza, że będziemy budować przedział ufności oczywiście dla wariancji z populacji. Spójrzmy w kartę wzorów. Dla wariancji mamy do wyboru dwa modele. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby. nie jest znana , a liczebność próby jest mniejsza od 30 , zatem wybieramy model I . W danych nie ma ani , więc nie ma znaczenia, którą wersję wzoru wybierzemy. Z reguły interesuje nas pierwsza wersja wzoru z wybranego modelu.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.Wracamy do danych z tabeli i uzupełniamy wzór konkretnymi danymi. Jak widać brakuje tylko , więc dopóki nie znajdziemy wartości tego parametru nie możemy obliczyć końcówek przedziału ufności dla wariancji. Wyliczanie wariacji z próby jest zagadnieniem ze statystki opisowej. Dysponujemy danymi tabelarycznymi, gdzie warianty cechy (wiek w latach) są w formie przedziałów tzn. od jednej wartości do drugiej wartości. Taki szereg określa się szeregiem rozdzielczym przedziałowym. Przeredagujmy zatem tabelę z zadania właśnie na tą postać szeregu.
W przypadku szeregu rozdzielczego przedziałowego nie ma możliwości pomyłki do tego, co jest wariantem cechy, a co liczebnością , ponieważ nie zdarza się, aby było zapisane w formie przedziałów. Symbol to po prostu ogólny zapis przedziału lewostronnie domkniętego i prawostronnie otwartego (chyba najczęściej używany – chociaż zależy od preferencji prowadzącego). Należy pilnować, aby końcówka każdego przedziału była początkiem następnego. W tabeli z zadania mamy właśnie przedstawioną sytuację , (kończymy przedział na 25, następny również zaczynamy od 25), itd. w związku z tym nie musimy nic zmieniać, zachowana jest ciągłość. Wzór na wariancję z danych szeregu przedziałowego wygląda następująco: . Jest też alternatywa , ale będziemy używać pierwszej wersji. Okazuje się, że do policzenia wariancji i tak niezbędna jest średnia. W szeregu przedziałowym średnią liczymy ze wzoru . Na początku wyjaśnijmy symbol . Oznacza on środek każdego z podanych przedziałów, a obliczany jest na podstawie formuły . Upraszczając, należy zsumować początek i koniec każdego przedziału i wynik podzielić na dwa. Wracamy do wzoru na średnią. Znak oznacza sumę. Pod tym symbolem znajduje się zapis , a nad nim , to środki kolejnych przedziałów , a liczebności dla kolejnych przedziałów. Wszystko razem oznacza, że będziemy sumować kolejne iloczyny , gdzie będzie rosło od aż do wartości , czyli , a więc ogólnie:
W naszym przypadku znad znaku sumy oznacza liczbę przedziałów klasowych (ilość wierszy w tabeli z danymi). Tak więc średnia będzie miała uproszczony wzór: = Czym jest , oraz ? Wszystko to zostanie pokazane dokładnie w tabeli. Obliczmy w niej również środki poszczególnych przedziałów.
Uzupełniając wzór średniej dla otrzymujemy: = i oczywiście możemy uzupełnić go danymi z tabeli, ale proponuję nadal korzystać z tabeli i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższy niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na średnią z szeregu przedziałowego, a jej nagłówki zawsze wyglądają tak samo. Każdą wartość mnożymy przez odpowiadającą jej wartość , a następnie sumujemy powstałe iloczyny. Przecięcie wiersza z symbolem i kolumny daje kompletny licznik wzoru na średnią.
Dysponujemy wartością średniej, zatem możemy wrócić do obliczania wariancji. Rozpiszemy wzór analogicznie jak w przypadku średniej. Najpierw ogólnie:
i dla :
Tu też można podstawiać dane z tabeli, ale ponownie proponuję trzymać się obliczeń tabelarycznych. Można kontynuować poprzednią tabelę dopisując kolejne kolumny. Znowu krok po kroku będziemy tworzyć licznik ze wzoru. Dopisana pierwsza kolumna - od każdego środka przedziału odejmujemy wcześniej wyliczoną średnią , druga kolumna to podniesienie wyników z poprzedniej do kwadratu. Ostatnia to wymnożenie wyników z drugiej przez odpowiadające im wartości i dopiero ona jest sumowana (przecięcie wiersza z symbolem i daje kompletny licznik wzoru na wariancję).
Wracamy do istoty zadania i wreszcie uzupełniamy wzór :
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka (grecka litera czyt. chi ), zatem skorzystamy z tablic rozkładu chi-kwadrat (link). W tym przypadku będziemy odczytywać statystykę dwukrotnie, ponieważ w uzupełnionym wzorze występują dwa nieco różniące się symbole: oraz . Zapis oznacza konieczność odnalezienia w tablicach statystyki dla i 25 stopni swobody:
Z kolei zapis oznacza konieczność odnalezienia w tablicach statystyki dla i 25 stopni swobody:
Wracamy do obliczeń i podstawiamy oraz :
5. WYNIK I INTERPRETACJA.Ostatecznie otrzymujemy: Interpretacja brzmi następująco: Z ufnością 0,98 nieznana wariancja wieku ogółu inwestorów giełdowych w pewnej grupie zawodowej mieści się w przedziale od 49,65 do 192,58 (lat) 2 . Powstała dziwna jednostka - (lat) 2 , ale w przypadku wariancji (jednostka podniesiona do kwadratu) nie jest to nic nadzwyczajnego i nie należy na to zwracać większej uwagi. Przyjęło się zresztą, że samej wariancji się nie interpretuje, ale już odchylenie standardowe, które jest pierwiastkiem z wariacji - jak najbardziej. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||