NEW | |||||||||||||||||||||||||||||||||||||||||||||||||
MINIMALNA LICZEBNOŚĆ PRÓBY - WSTĘP Próba to część populacji, w skład której wchodzą jednostki bezpośrednio podlegające badaniu statystycznemu. Próba jest losowana z populacji. Jeśli nadal masz problemy z rozróżnieniem obu zbiorowości, różnice między próbą a populacją zostały przedstawione we wstępie do estymacji http://matma-po-ludzku.pl/statystyka/wnioskowanie/estymacja/estymacja_sredniej/wstep/ . Wybranie odpowiedniej próby jest istotną kwestią, ponieważ na podstawie wyników uzyskanych w tej próbie mamy orzekać na temat całej populacji, której częścią jest właśnie ta próba. Najczęściej pobiera się się tylko jedną próbę o określonej wcześniej liczebności ze względu na koszty, ale też na przykład dane badanie niszczy jednostki z próby. W związku z tym musi ona być oczywiście odpowiednio liczna w celu otrzymania określonej wiarygodności badania. Wprawdzie można zwiększać liczebność próby, ale takie postępowanie wiąże się z ponoszeniem dużych kosztów, które są proporcjonalne do liczebności tej próby. Poza tym duża liczebność próby pociąga za sobą wydłużenie czasu opracowywania wyników. Z kolei zbyt mała liczebność próby nie zapewnia wiarygodności badania, co może spowodować jego przekreślenie i odrzucenie wniosków. Przystępując do określenia minimalnej liczebności próby należy określić z góry poziom współczynnika ufności i maksymalny (dopuszczalny) błąd szacunku . Tyle tytułem wstępu teoretycznego. Teraz przedstawię Wam schemat rozwiązywania zadań dotyczących minimalnej liczebności próby. 1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE MINIMALNEJ LICZEBNOŚCI PRÓBY ?Proponuje przeczytać całe zadanie i najpierw zwrócić uwagę na tzw. słowa – klucze . Przykładowo: - ile jednostek należy wylosować do próby ...? - jak liczna powinna być próba ... ? - ile jednostek powinno znaleźć się w próbie losowej ... ? - ile pomiarów należy wykonać...?, itd. Drugą wskazówką nakierowującą na ten typ zadania jest pojawienie się w treści słowa: maksymalny (dopuszczalny) błąd szacunku lub dokładność oszacowania, który oznaczamy literą . Wielkość ta, jak sama nazwa wskazuje, określa wartość o którą możemy się pomylić w szacowaniu parametrów. Wartość jest podawana w treści zadania, rzadziej należy ją obliczać samemu, ale czasem bywa zakamuflowana pod pojęciem rozpiętości (długości) przedziału ufności. Może się wtedy wydawać, że zadanie dotyczy estymacji przedziałowej, ale zawsze wtedy pojawia się charakterystyczne wyrażenie: ile należy wylosować do próby itd. Maksymalny błąd szacunku to połowa przedziału ufności - warto to zapamiętać. Szersze wytłumaczenie kryje się tutaj: http://matma-po-ludzku.pl/statystyka/wnioskowanie/estymacja/estymacja_sredniej/zadanie29.php . Nie ma w tym nic dziwnego, ponieważ zagadnienie minimalnej liczebności próby ściśle wiąże się z estymacją przedziałową. Praktycznie zawsze występuje wyrażenie współczynnik ufności i oczywiście jego wartość jest również określona w treści zadania, czasem podana jest gotowa (poziom istotności). Jeżeli znaleźliśmy w zadaniu wszystkie z tych zwrotów, to na pewno mamy do czynienia z zadaniem dotyczącym minimalnej liczebności próby. 2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.Ten etap nie różni się absolutnie niczym od wypisania danych w zadaniach dotyczących estymacji przedziałowej, więc jeśli ogranęliście zagadnienie estymacji możecie spokojnie przejść do następnego punktu. Dla nowych użytkowników przypomnienie w pigułce:
W jaki sposób wypisując dane odróżniamy próbę od populacji? Najlepiej czytajmy po jednym zdaniu. Jeżeli pojawiają się zwroty np. wylosowano próbę , zmierzono x obserwacji , obserwowano x próbek , zbadano ... , to jakiekolwiek dane po tych słowach zapisujemy używając symboli dla próby, zresztą i tak pojawia się się konkretna liczba mówiąca o liczebności wylosowanej próby. Jeśli nie ma wyraźnie zwrotu wskazującego na próbę lub występuje zwrot: rozkład normalny ze średnią bądź odchyleniem standardowym to używamy symboli dla populacji. Nie należy się dziwić, gdy po wypisaniu danych okaże się, że miejsce na parametry z populacji jest puste. To dość częsta sytuacja. Jeśli dysponujemy tabelką lub wynikami z próby np. wypisanymi po przecinku zawsze możemy policzyć średnią, wariancję, odchylenie standardowe. Oznaczenia oraz z tzw. daszkiem to odpowiednio odchylenie i wariancja nieobciążona. Używamy zapisu z daszkiem tylko w przypadku, gdy znajdziemy słowo nieobciążona lub po prostu w zadaniu jest wyraźny zapis . Szukana jest zawsze liczebność próby, którą oznaczamy , czasem w zadaniu pojawia się liczebność próby, co może wydawać się dziwne, ponieważ właśnie szukamy minimalnej liczebności próby. Nie ma powodu do niepokoju, jest to tzw. próba pilotażowa - jej liczebność oznaczamy . Oczywiście wypisujemy maksymalny (dopuszczalny) błąd szacunku lub dokładność oszacowania, który oznaczamy literą i współczynnik ufności . Od razu wyznaczamy (wartość uzupełniająca 1). 3. WYBÓR ODPOWIEDNIEGO WZORU.Po wypisaniu danych należy wybrać odpowiedni wzór. W przypadku zadań dotyczących minimalnej liczebności próby mamy do wyboru tylko pięć modeli. W tabeli poniżej przedstawione zostaną charakterystyczne sformułowania i dopasowanie do odpowiednich wzorów:
Pamiętajmy również o tym, że błąd szacunku w przypadku trzech pierwszych modeli (szacowanie średniej) musi być podany w tych samych jednostkach co parametry . Nie może być tak, że na przykład odchylenie jest podane w centymetrach, a błąd szacunku w procentach - błąd szacunku musi być wielkością podaną w centymetrach. W ostatnich dwóch modelach dotyczących wskaźnika struktury, który oczywiście jest wielkością podawaną w ułamku lub procencie, błąd szacunku musi być określony również w ułamku lub procencie. Pierwsza uwaga odnośnie wzorów z modelu II. Bardziej popularny jest wzór z (z daszkiem). Niemniej jednak, gdy podano w danych samo (bez daszka) można użyć drugiego wzoru z tego modelu albo przeliczyć na na podstawie wzoru i spokojnie użyć pierwszego wzoru. Niektórzy prowadzący każą przyjąć studentom, że i nie wykonując żadnych przeliczeń używają wyłącznie popularniejszej wersji wzoru z daszkiem. Teraz uwaga dotycząca wzoru z modelu III. Bardzo rzadko spotyka się ten wzór i nawet dla prób liczniejszych niż 30 jednostek używa się modelu II. Nie jest to błąd, jednakże tablice t - studenta używane modelu II nie są tak dokładne jak tablice rozkładu normalnego w dużych próbach (powyżej 30), ale czesto to też zależy od preferencji wykładowcy. I na koniec jeszcze jedna uwaga dotycząc modelu IV. Pamiętamy, że wskaźnik struktury z próby oznaczono , a wskaźnik struktury z populacji . W zadaniach dotyczących tego modelu wartość wskaźnika struktury podawana jest albo na podstawie próby pilotażowej albo wsześniejszych ustaleń z całej populacji. Wobec tego należałoby raz stosować oznaczenie , a innym razem . Aby uniknąć zamieszania tylko w tym typie zadań przyjmujemy Uprzedzam tym samym, że wartość będzie raz lądowała w tabelce z danymi raz w próbie, raz w populacji (zależnie co wynika z treści zadania), żeby nie wytrącić Was z nawyku prawidłowego wypisywania danych ;). 4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.Po wybraniu odpowiedniego wzoru należy uzupełnić go wielkościami wypisanymi w danych. Wielkości zaznaczone na zielono zastępujemy liczbami z danych, reszta zostaje nienaruszona.
We wzorach pojawiają się różne litery, które wcześniej nie były wypisane w danych tzn. , . Symbole te po uzupełnieniu i oznaczają konieczność odczytania wartości statystyk z tablic: - tablice rozkładu normalnego (nie mylić z tablicami dystrybuanty rozkładu normalnego) , - tablice t – Studenta Odpowiednie tablice można pobrać tu: http://matma-po-ludzku.pl/statystyka/wzory/ . Odczytywanie statystyk z tablic jest jest bardzo prostą czynnością i będzie przedstawiona na konkretnych przykładach. Po odczytaniu cały symbol tzn. , lub zastępujemy JEDNĄ liczbą. Podsumowując ten wątek można dojść do wniosku, że dopiero po wybraniu wzoru odczytujemy wartości statystyk z odpowiednich tablic. Tak więc wzór spokojnie nam wskaże, które tablice mamy wybrać :). 5. WYNIK I INTERPRETACJA.Rezultatem obliczeń jest zapis: Rezultat otrzymany z obliczeń musi być liczbą naturalną, wobec tego ZAWSZE zaokrąglamy wynik w górę - nie obowiązują tu matematyczne zasady zaokrągleń !!! Wynika to z faktu, że trudno wylosować np. 45,3 jednostek, bo z reguły są one niepodzielne (zresztą dzielenie na części jest bez sensu), wobec tego losujemy jednostek do próby. Jeśli wymagana jest interpretacja, to wygląda ona zawsze bardzo podobnie i jest dość lakoniczna (chyba że prowadzący wymaga w interpretacji słownego opisania wszystkich czynności wykonanych w zadaniu): Aby z ufnością (tu wpisujemy wartość współczynnika ufności ) oszacować (wpisujemy parametr - zależy o co pytano w zadaniu) minimalna liczebność próby wynosi . |
|||||||||||||||||||||||||||||||||||||||||||||||||