NEW | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Zadanie 42W celu oszacowania średniej powierzchni mieszkań powstałych w 2001 w Gdańsku, wylosowano niezależnie 120 wybudowanych w tym roku mieszkań i otrzymano dla nich następujący rozkład powierzchni mieszkalnej ( w m2):
Zbuduj przedział ufności dla średniej powierzchni mieszkań wybudowanych w Gdańsku w badanym roku, przyjmując współczynnik ufności 0,90.
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu całego zadania zwracamy uwagę na zdanie:
„Zbuduj przedział ufności dla średniej powierzchni mieszkań wybudowanych w Gdańsku w badanym roku, przyjmując współczynnik ufności 0,90.”
Odnajdujemy w nim zwroty: zbuduj przedział ufności i poziom ufności. Teraz mamy pewność, że zadanie dotyczy estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH. Analizujemy zdanie po zdaniu.
„W celu oszacowania średniej powierzchni mieszkań powstałych w 2001 w Gdańsku, wylosowano niezależnie 120 wybudowanych w tym roku mieszkań i otrzymano dla nich następujący rozkład powierzchni mieszkalnej ( w m2):”
W tym momencie wiemy, że wylosowano próbę, a jej liczebność to mieszkań i w związku z tym będziemy prawdopodobnie stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji. Podano również wyniki z próby w tabeli. Jeżeli dysponujemy danymi dotyczącymi próby ujętymi w tabeli zawsze możemy policzyć średnią , wariancję i odchylenie standardowe (lub , ). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach.
„Zbuduj przedział ufności dla średniej powierzchni mieszkań wybudowanych w Gdańsku w badanym roku, przyjmując współczynnik ufności 0,90.”
Podano też współczynnik ufności , od razu wyznaczamy .
Podsumowując tworzymy przejrzystą tabelę z danymi:
- współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo: „Zbuduj przedział ufności dla średniej powierzchni mieszkań wybudowanych w Gdańsku w badanym roku, przyjmując współczynnik ufności 0,90. ”
Wyrażenie średniej oznacza, że będziemy budować przedział ufności dla wartości średniej z populacji. Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby. nie jest znana, a liczebność próby jest większa od 30 ( ), zatem wybieramy model III.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych w tabeli i uzupełniamy wzór konkretnymi liczbami. Jak widać potrzebujemy średniej z próby i odchylenia standardowego . W związku z tym zanim zajmiemy się uzupełnianiem właściwego wzoru należy obliczyć dwa (na razie) nieznane parametry. Liczenie średniej, wariacji i odchylenia standardowego jest zagadnieniem ze statystyki opisowej. Dysponujemy danymi tabelarycznymi, gdzie warianty cechy (powierzchnia mieszkalna) są w formie przedziałów tzn. od jednej wartości do drugiej wartości. Taki szereg określa się szeregiem rozdzielczym przedziałowym. Przeredagujmy zatem tabelę z zadania właśnie na tą postać szeregu.
W przypadku szeregu rozdzielczego przedziałowego nie ma możliwości pomyłki do tego co jest wariantem cechy, a co liczebnością , ponieważ nie zdarza się, aby było zapisane w formie przedziałów. Symbol to po prostu ogólny zapis przedziału lewostronnie domkniętego i prawostronnie otwartego (chyba najczęściej używany – chociaż zależy od preferencji prowadzącego). Należy pilnować, aby końcówka każdego przedziału była początkiem następnego. W tabeli z zadania mamy właśnie przedstawioną sytuację , (kończymy przedział na 25, następny również zaczynamy od 25), itd. w związku z tym nie musimy nic zmieniać, zachowana jest ciągłość. W szeregu przedziałowym średnią liczymy ze wzoru . Na początku wyjaśnijmy symbol . Oznacza on środek każdego z podanych przedziałów, a obliczany jest na podstawie formuły . Upraszczając należy zsumować początek i koniec każdego przedziału i wynik podzielić na dwa. Wracamy do wzoru na średnią. Znak oznacza sumę. Pod tym symbolem znajduje się zapis , a nad nim , to środki kolejnych przedziałów, a liczebności dla kolejnych przedziałów. Wszytko razem oznacza, że będziemy sumować kolejne iloczyny , gdzie będzie rosło od aż do wartości , a więc , a więc ogólnie:
W naszym przypadku znad znaku sumy oznacza liczbę przedziałów klasowych (ilość wierszy w tabeli z danymi). Tak więc średnia będzie miała uproszczony wzór:
Czym jest , oraz ? Wszystko to zostanie pokazane dokładnie w tabeli. Obliczmy również środki poszczególnych przedziałów.
Uzupełniając otrzymujemy wzór: i oczywiście możemy uzupełnić go danymi z tabeli, ale proponuję nadal korzystać z tabeli i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższym tasiemcem niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na średnią z szeregu przedziałowego, a jej nagłówki zawsze wyglądają tak samo. Każdą wartość mnożymy przez odpowiadającą jej wartość , a następnie sumujemy powstałe iloczyny. Przecięcie wiersza z symbolem i kolumny daje kompletny licznik wzoru na średnią.
Zostało nam jeszcze odchylenie standardowe . Na początek i tak musimy obliczyć wariancję , bo . Wzór na wariancję z danych szeregu przedziałowego wygląda następująco: . Jest też alternatywa , ale będziemy używać pierwszej wersji. Rozpisanie wzoru analogiczne jak w przypadku średniej. Jak widać do policzenia wariancji i tak niezbędna jest średnia. Na początek ogólnie:
i dla ilości klas z zadania :
Tu też można podstawiać dane z tabeli, ale ponownie proponuję trzymać się obliczeń tabelarycznych. Można kontynuować poprzednią tabelę dopisując kolejne kolumny. Znowu krok po kroku będziemy tworzyć licznik ze wzoru. Dopisana pierwsza kolumna - od każdego środka przedziału odejmujemy wcześniej wyliczoną średnią , druga kolumna to podniesienie wyników z poprzedniej do kwadratu. Ostatnia to wymnożenie wyników z drugiej przez odpowiadające im wartości i dopiero ona jest sumowana (przecięcie wiersza z symbolem i daje kompletny licznik wzoru na wariancję ).
Odchylenie standardowe to pierwiastek z wariancji .
Wracamy do istoty zadania i wreszcie uzupełniamy wzór :
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka u, zatem skorzystamy z tablic rozkładu normalnego. Zapis oznacza konieczność odnalezienia statystyki dla . Czytanie z tablic rozkładu normalnego nie jest trudne. Sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. W przypadku sumujemy i czyli .
Wracamy do obliczeń i podstawiamy (zaokrąglanie to indywidualna sprawa wynikająca najczęściej z preferencji prowadzącego)
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy: Interpretacja brzmi następująco: Z ufnością 0,90 nieznana średnia wartość powierzchni dla populacji mieszkań wybudowanych w Gdańsku w badanym roku mieści się się w przedziale od 39,88 m2 do 43,52 m2.
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||