Zadanie 42
W celu oszacowania średniej powierzchni mieszkań powstałych w 2001 w Gdańsku, wylosowano niezależnie 120 wybudowanych w tym roku mieszkań i otrzymano dla nich następujący rozkład powierzchni mieszkalnej ( w m2):
|
Powierzchnia mieszkalna
|
Liczba mieszkań
|
|
15 - 25
|
10
|
|
25 - 35
|
25
|
|
35 - 45
|
40
|
|
45 - 55
|
30
|
|
55 - 65
|
10
|
|
65 - 75
|
5
|
-
Zbuduj przedział ufności dla średniej powierzchni mieszkań wybudowanych w Gdańsku w badanym roku, przyjmując współczynnik ufności 0,90.
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu całego zadania zwracamy uwagę na zdanie:
„Zbuduj przedział ufności dla średniej powierzchni mieszkań wybudowanych w Gdańsku w badanym roku, przyjmując współczynnik ufności 0,90.”
Odnajdujemy w nim zwroty: zbuduj przedział ufności i poziom ufności. Teraz mamy pewność, że zadanie dotyczy estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
„W celu oszacowania średniej powierzchni mieszkań powstałych w 2001 w Gdańsku, wylosowano niezależnie 120 wybudowanych w tym roku mieszkań i otrzymano dla nich następujący rozkład powierzchni mieszkalnej ( w m2):”
|
Powierzchnia mieszkalna
|
Liczba mieszkań
|
|
15 - 25
|
10
|
|
25 - 35
|
25
|
|
35 - 45
|
40
|
|
45 - 55
|
30
|
|
55 - 65
|
10
|
|
65 - 75
|
5
|
W tym momencie wiemy, że wylosowano próbę, a jej liczebność to
mieszkań i w związku z tym będziemy prawdopodobnie stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji.
Podano również wyniki z próby w tabeli. Jeżeli dysponujemy danymi dotyczącymi próby ujętymi w tabeli zawsze możemy policzyć średnią
, wariancję
i odchylenie standardowe
(lub
,
). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach.
„Zbuduj przedział ufności dla średniej powierzchni mieszkań wybudowanych w Gdańsku w badanym roku, przyjmując współczynnik ufności 0,90.”
Podano też współczynnik ufności
, od razu wyznaczamy
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
|
POPULACJA
mieszkania wybudowane w 2001 w Gdańsku
|
PRÓBA
120 wybranych mieszkań
|
|
|
dane tabelaryczne - (można obliczyć średnią , wariancję , odchylenie standardowe )
|
- współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:
„Zbuduj przedział ufności dla średniej powierzchni mieszkań wybudowanych w Gdańsku w badanym roku, przyjmując współczynnik ufności 0,90. ”
Wyrażenie średniej oznacza, że będziemy budować przedział ufności dla wartości średniej
z populacji.
Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy
jest znana i jaka jest liczebność próby.
nie jest znana, a liczebność próby
jest większa od 30 (
), zatem wybieramy model III.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych w tabeli i uzupełniamy wzór
konkretnymi liczbami. Jak widać potrzebujemy średniej z próby
i odchylenia standardowego
. W związku z tym zanim zajmiemy się uzupełnianiem właściwego wzoru należy obliczyć dwa (na razie) nieznane parametry. Liczenie średniej, wariacji i odchylenia standardowego jest zagadnieniem ze statystyki opisowej.
Dysponujemy danymi tabelarycznymi, gdzie warianty cechy (powierzchnia mieszkalna) są w formie przedziałów tzn. od jednej wartości do drugiej wartości. Taki szereg określa się szeregiem rozdzielczym przedziałowym. Przeredagujmy zatem tabelę z zadania właśnie na tą postać szeregu.
|
- warianty obserwacji
(powierzchnia mieszkalna)
|
- liczebności poszczególnych przedziałów klasowych
(liczba mieszkań)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(suma)
|
|
W przypadku szeregu rozdzielczego przedziałowego nie ma możliwości pomyłki do tego co jest wariantem cechy, a co liczebnością
, ponieważ nie zdarza się, aby
było zapisane w formie przedziałów. Symbol
to po prostu ogólny zapis przedziału lewostronnie domkniętego i prawostronnie otwartego (chyba najczęściej używany – chociaż zależy od preferencji prowadzącego). Należy pilnować, aby końcówka każdego przedziału była początkiem następnego. W tabeli z zadania mamy właśnie przedstawioną sytuację
,
(kończymy przedział na 25, następny również zaczynamy od 25), itd. w związku z tym nie musimy nic zmieniać, zachowana jest ciągłość.
W szeregu przedziałowym średnią liczymy ze wzoru
.
Na początku wyjaśnijmy symbol
. Oznacza on środek każdego z podanych przedziałów, a obliczany jest na podstawie formuły
. Upraszczając należy zsumować początek
i koniec
każdego przedziału i wynik podzielić na dwa.
Wracamy do wzoru na średnią. Znak
oznacza sumę. Pod tym symbolem znajduje się zapis
, a nad nim
,
to środki kolejnych przedziałów, a
liczebności dla kolejnych przedziałów. Wszytko razem oznacza, że będziemy sumować kolejne iloczyny
, gdzie
będzie rosło od
aż do wartości
, a więc
, a więc ogólnie:
W naszym przypadku
znad znaku sumy oznacza liczbę przedziałów klasowych (ilość wierszy w tabeli z danymi). Tak więc średnia będzie miała uproszczony wzór:
Czym jest
,
oraz
? Wszystko to zostanie pokazane dokładnie w tabeli. Obliczmy również środki poszczególnych przedziałów.
|
Numer klasy
|
- przedziały klasowe
(wiek pracowników)
|
-
środki przedziałów
|
-liczebności poszczególnych przedziałów klasowych
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(suma)
|
|
|
Uzupełniając
otrzymujemy wzór:
i oczywiście możemy uzupełnić go danymi z tabeli, ale proponuję nadal korzystać z tabeli i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższym tasiemcem niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na średnią z szeregu przedziałowego, a jej nagłówki zawsze wyglądają tak samo. Każdą wartość
mnożymy przez odpowiadającą jej wartość
, a następnie sumujemy powstałe iloczyny. Przecięcie wiersza z symbolem
i kolumny
daje kompletny licznik wzoru na średnią.
|
Numer klasy
|
-
środki przedziałów
|
- liczebności poszczególnych przedziałów klasowych
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(suma)
|
|
|
Zostało nam jeszcze odchylenie standardowe
. Na początek i tak musimy obliczyć wariancję
, bo
. Wzór na wariancję z danych szeregu przedziałowego wygląda następująco:
. Jest też alternatywa
, ale będziemy używać pierwszej wersji. Rozpisanie wzoru analogiczne jak w przypadku średniej. Jak widać do policzenia wariancji i tak niezbędna jest średnia. Na początek ogólnie:
i dla ilości klas z zadania
:
Tu też można podstawiać dane z tabeli, ale ponownie proponuję trzymać się obliczeń tabelarycznych. Można kontynuować poprzednią tabelę dopisując kolejne kolumny. Znowu krok po kroku będziemy tworzyć licznik ze wzoru. Dopisana pierwsza kolumna - od każdego środka przedziału
odejmujemy wcześniej wyliczoną średnią
, druga kolumna to podniesienie wyników z poprzedniej do kwadratu. Ostatnia to wymnożenie wyników z drugiej przez odpowiadające im wartości
i dopiero ona jest sumowana (przecięcie wiersza z symbolem
i
daje kompletny licznik wzoru na wariancję ).
|
Numer klasy
|
- środki przedziałów
|
- liczebności poszczególnych przedziałów klasowych
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(suma)
|
|
|
|
|
Odchylenie standardowe
to pierwiastek z wariancji
.
Wracamy do istoty zadania i wreszcie uzupełniamy wzór
:
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka u, zatem skorzystamy z tablic rozkładu normalnego. Zapis
oznacza konieczność odnalezienia statystyki dla
.
Czytanie z tablic rozkładu normalnego nie jest trudne. Sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. W przypadku
sumujemy
i
czyli
.
Wracamy do obliczeń i podstawiamy
(zaokrąglanie to indywidualna sprawa wynikająca najczęściej z preferencji prowadzącego)
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy:
Interpretacja brzmi następująco:
Z ufnością 0,90 nieznana średnia wartość powierzchni dla populacji mieszkań wybudowanych w Gdańsku w badanym roku mieści się się w przedziale od 39,88 m2 do 43,52 m2.