Maria Balcerowicz-Szkutnik Podstawy statystyki w przykładach i zadaniach Statystyka opisowa elementy wnioskowania statystycznego Bytom 2004 Redakcja: Magdalena Goik Recenzent: dr hab. Zygmunt Przybycin Spis treści ISBN 83-88587-86-2 Przedmowa ............. Rozdział I Analiza struktury zjawisk........ Zadania do samodzielnego rozwiązywania Rozdział III Elementy teorii współzależności cech .... Zadania do samodzielnego rozwiązywania Rozdział III Analiza dynamiki zjawisk........ Zadania do samodzielnego rozwiązywania Rozdział IV Wybrane zagadnienia statystyki matematycznej Zadania do samodzielnego rozwiązywania Rozdział V Przykładowe zadania testowe ...... Bibliografia 36 55 65 85 92 102 108 126 Copyright by Wv7c y sza Szkoła Ekonomii i Administracji w By tomiu Przedmowa Przedstawiony skrypt stanowi opracowanie będące, w swoim zamierzeniu uzupełnieniem istniejącej szerokiej literatury przedmiotu o nową pozycję, kierowaną przede wszystkim do studentów uczelni ekonomicznych. Skrypt obejmuje zakres statystyki opisowej prezentowanej w ramach wykładu ze statystyki dla studiów licencjackich i magisterskich uczelni ekonomicznych, głównie studiujących w trybie zaocznym i wieczorowym. W prezentowanej wersji skryptu pominięto treści teoretyczne, zwracając uwagę na techniki rozwiązywania zadań jako, że ten element wraz z umiejętnością aplikacji teoretycznych aspektów statystyki sprawia studentom najwięcej trudności. Z tego też względu szczególną uwagę skierowano na przedstawienie typowych i wariantowych sposobów rozważania problemów statystycznych w licznych rozwiązanych w skrypcie przykładach. Opracowanie podzielono na cztery zasadnicze części (zgodnie z wymogami przedmiotu) i w każdej z nich przedstawiono kilkanaście zadań rozwiązanych w szczegółowy sposób z podaniem pełnej postaci wykorzystanych wzorów i warunkami ich zastosowania oraz od 25 do 30 zadań do samodzielnego rozwiązania. Osobną część stanowi propozycja 50 zadań testowych (każde do rozwiązania w ciągu przeciętnie 3 minut) jako, że te formy sprawdzania wiedzy studentów cieszą się coraz większą popularnością. Zdecydowana część zadań ma charakter autorski i tylko nieliczne są modyfikacjami zadań zamieszczonych w już istniejących podręcznikach. Jako podręczniki, uzupełniające wykłady o charakterze teoretycznym, student może wykorzystać dowolny podręcznik z zamieszczonego spisu literatury, a głównie z podręcznika Mieczysława Sobczyka. Niniejszy skrypt stanowi tylko część tematów realizowanych w ramach przedmiotu statystyka. W zamierzeniu autora jest przygotowanie części II, w której zamieszczone będą podstawy teoretyczne wszystkich tematów objętych gramem studiów ze statystyki wraz z zagadnieniami nie zamieszczonymi :m opracowaniu, a dotyczącymi tematów z zakresu rachunku prawdopodo-istwa, estymacji parametrów zbiorowości statystycznej i weryfikacji hipotez ystycznych. Rozdział I Analiza struktury zjawisk 3 Zadanie 1. W sześcioosobowej grupie pracowników wpłaty do urzędów skarbowych z tytułu podatku dochodowego od osób fizycznych były za rok 1999 następujące: 2039,40 zł; 2699,40 zł; 3670,20 zł; 2236,80 zł; 1602,30 z; 2963,70 zł. Jaka była wartość przeciętna wpłaconego do urzędów skarbowych podatku? vr Rozwiązanie. Dla ustalenia wartości przeciętnej w przypadku szeregu wyliczającego wykorz-stuje się wzór w następującej postaci: X, +x- ' J.J. gdzie odpowiednio: x - oznaczenie wartości przeciętnej (wartości średniej) x. - realizacja cechy statystycznej n - liczba realizacji cechy statystycznej W naszym przypadku __ 2039,4 + 2699,4 + 3670,2 + 2236,8 + 1602,3 + 2963,7 [1] co oznacza, że przeciętna wpłata podatku dochodowego od osób fizycznych do urzędu skarbowego w tej grupie pracowników była równo 2535,3 zł. 3 Zadanie 2. Ustalić średni wzrost 10-letniego chłopca w szkołach podstawowych miasta Siemianowice dysponując danymi uzyskanymi z kart lekarskich pielęgniarek szkolnych. 7 Rozdział I t Rozwiązanie. Ze względu na postać szeregu statystycznego (szereg punktowy), w którym zaprezentowano dane do oceny poziomu przeciętnego wykorzystamy średnią ważoną zgodnie z wzorem: Wzrost w cm 150 151 152 153 154 155 156 Razem Liczba dzieci 25 35 40 45 40 30 20 235 Źródło: dane umowne X = x1n1 +x2n2 [2] ni +n2 i-l gdzie: x x. n. oznaczenie wartości przeciętnej (przeciętnej); realizacja cechy statystycznej; liczebność cząstkowa realizacji x., czyli liczba jej powtórzeń; liczba różnych realizacji cechy statystycznej. W naszym przypadku otrzymujemy: - 150-25+ 151-35+ 152-40 + 153-45+ 154-40 + 155-30+ 156-20 _ 35330 = 1J2 89 _ 153cm 25 + 35 + 40 + 45 + 40 + 30 + 20 35 ' Cm O Zadanie 3. Dla celów sprawozdawczości finansowej ustalić średnie wynagrodzenie w pierwszym kwartale 1999 r. pracowników spółki akcyjnej „Ania" w Białej Podlaskiej dysponując danymi. Wynagrodzenie w zł (xid'x„) Liczba pracowników ni 1000-1200 65 1200-1400 110 1400-1600 42 1600-1800 83 300 ,f Zrodlo: dane umowne Rozwiązanie. Ze względu na postać szeregu statystycznego (szereg przedziałowy) w postaci, 8 którego przedstawiono dane źródłowe do wyznaczenia miary poziomu przeciętnego wykorzystamy średnią ważoną w postaci: x2n k In, i 2n2 xnn n"k n, +n2 [3] Izie: x X - oznaczenie miernika; - środek przedziału klasowego wyznaczamy jako średnie arytmetyczne granic przedziału (x.d - dolna granica przedziału i x. — górna granica , . , > „ Xid + Xig przedziału) x =----------- ; n. - liczebności cząstkowe, czyli liczba elementów przedziału o numerze „i"; k - liczba przedziałów klasowych szeregu. W naszym przypadku wartość średnia jest równa: 1100-65+ 1300-110+ 1500-42+ 1700-83 418600 65 + 110 + 42 + 83 300 = 1395,33 co oznacza, że średnia płaca pracownika spółki akcyjnej „Ania" w pierwszym kwartale 1999 roku była równa 1395,33 zł. O Zadanie 4. Na podstawie informacji zamieszczonych w szeregu statystycznym, przedstawionym w postaci poniższej tablicy, ustalić poziom średni cechy, wskaźniki struktury oraz dokonać prezentacji graficznej przedstawionego materiału statystycznego. Tablica Zakłady usługowe w Gdańsku według obrotów osiągniętych w styczniu 1999 r. i i Obroty w zł (**-*,.) 10 000-14 000 14 000-18 000 18 000-22 000 22 000-26 000 26 000-30 000 Razem Liczba Zakładów 306 408 629 272 85 1700 Rozdział I Analiza struktury zjawisk. 1r Rozwiązanie. Dla wyznaczenia wartości średniej wykorzystamy wzór na średnią ważoną (patrz zad. 3), czyli otrzymamy: _ 12000-306+ 16000-408+ 20000-629+ 24000-272+ 2800-85 3168800 ,„„ , x =------------------------------------------------------------------------=----------= 18640 zł 1700 1700 co oznacza, że średni poziom obrotów w rozważanej grupie zakładów usługowych jest równy 18 640 zł. Wskaźniki struktury lub inaczej częstości wyznaczamy jako ilorazy liczebności cząstkowych i liczebności ogólnej przyjmując oznaczenie: n j =— przy czym n =1 Otrzymujemy odpowiednio: 306 406 n-,A 629 w, =^- = 0,18; w2= —= 0,24; w3=-------- 1700 1700 1700 1700 w5 = 1700 co oznacza, że 18% zakładów usługowych miało obroty w wysokości od 10 tys. do 14 tys. zł; 24% zakładów miało obroty w wysokości od 14 tys. zł do 18 i dalej interpretując 5% zakładów miało obroty od 26 tys. do 30 tys. zł. Do prezentacji graficznej możemy wybrać dowolną postać wykresu statystycznego: wykres powierzchniowy (koło) lub słupkowy, czyli klasyczny histogram. Wykres kołowy będzie miał postać: Natomiast histogram przedstawiony w układzie współrzędnych w( (100%) 40 - 30 -20 - 10 - obroty w tys. 10 14 18 22 26 30 Rys. 1 Na podstawie histogramu możemy wyznaczyć diagram jako łamaną łączącą punkty o współrzędnych (x,n.) lub (x, w.). Wygładzona postać diagramu tworzy krzywą liczebności, której kształt pozwala na określenie rodzaju asymetrii rozkładu analizowanej cechy. W przypadku analizowanej cechy stwierdzamy asymetrię lewostronną. 3 Zadanie 5. Akcje Spółki Akcyjnej „Kant" w czasie kolejnych notowań giełdowych w roku 1999 osiągnęły następujące wartości (w zł): 26, 18, 30, 20, 23, 25, 19, 28, 20, 24, 18, 28, 21, 26, 25, 23, 21, 26, 20, 28, 25, 21, 26, 20, 19, 19, 20, 22, 23, 18, 19, 31, 23, 28, 25, 19, 21, 26, 26, 20, 25, 26, 20, 21, 2.6, 21, 20, 21, 26, 30, 21, 21, 20, 29, 28, 20, 21, 18, 20, 22, 21, 26, 19, 31, 25, 26, 26, 25, 20, 21, 26, 30, 28, 26, 30, 22, 28, 25, 23, 21, 20, 26, 20, 21, 26, 20, 21, 20, 21,29,21. Wskaż dominującą cenę akcji Spółki „Kant" na giełdzie. ^ Rozwiązanie. Wartość dominująca dla szeregu wyliczającego lub punktowego jest realizacją cechy statystycznej o największej liczbie powtórzeń lub największej liczebności cząstkowej. Zatem najważniejszym elementem pracy będzie uporządkowanie szeregu w sposób monotoniczny i określenie wartości dominującej. Wybieramy najpierw najmniejszą (xmjn) i największą (xmax) realizację cechy x_,_ = 18 i x_... = 31 10 11 Rozdział I Analiza struktury zjawisk i porządkujemy szereg monotonicznie: 18, 18, 18, 18, 19, 19, 19, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21, 21, 21, 21, 21, 21, 21, 21, 21, 21, 21, 21, 21, 21, 22, 22, 22, 23, 23, 23, 23, 23, 24, 25, 25, 25, 25, 25, 25, 25, 25, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 28, 28, 28, 28, 28, 28, 28, 28, 29, 29, 30, 30, 30, 30,31,31. Okazało się, że najczęściej w roku 1999 notowania akcji Spółki „Kant" osiągnęły cenę 21 zł i tę wartość uznajemy za dominantę. O Zadanie 6. Na podstawie informacji zawartej w tablicy określić dominujący wiek pracownika zatrudnionego na stanowisku kierowniczym w przedsiębiorstwach budowlanych w Nowym Sączu w lipcu 1999 roku. Tablica Pracownicy przedsiębiorstw budowlanych w Nowym Sączu w lipcu 1999 roku wg wieku Źródło: dane umowne 4Ł Rozwiązanie. Wyznaczenie dominanty dla szeregu przedziałowego wymaga zastosowania wzoru interpolacyjnego postaci ~nD-i nD-nD_!+nD-nD+1 ¦¦ AxT [4] gdzie odpowiednio: D - oznaczenie miernika (dominanty, wartości najczęstszej lub mody); xD - początek przedziału miernika, czyli przedziału o największej liczebności cząstkowej; nD, nD ,, nD+1 - liczebności cząstkowe przedziałów dominanty i sąsiednich, czyli poprzedzającego i następującego po przedziale dominanty; AxD - długość przedziału miernika, czyli różnica pomiędzy końcem i początkiem przedziału AxD = x. - x.d. Konieczne jest przy stosowaniu tego wzoru założenie, że długości przedziałów klasowych w rozważanym szeregu są równe lub jego osłabiona postać, że równe co do długości są co najmniej trzy przedziały klasowe - dominanty i sąsiednie. W naszym przypadku otrzymujemy: 12 = 30 + 45-15 45-15 + 45-9 ,10 = 30 + 4,545 = 34,55 « 34,5 lat czyli najczęściej na stanowiskach kierowniczych w przedsiębiorstwach prywatnych zatrudniano pracowników w wieku około 34,5 lat. Dominantę możemy wyznaczyć również metodą graficzną. Niezbędny jest do tego fragment histogramu (wykresu słupkowego) obejmujący przedział dominanty i dwa sąsiednie: 40 -f-30 20 Rys. 2 30 D 34,5 Łączymy odcinkami wierzchołki słupków histogramowych odpowiadających początkom przedziału dominanty i następującego po nim oraz końcowi przedziału dominanty i przedziału poprzedzającego ten przedział. Punkt przecięcia tych odcinków zrzutowany na oś realizacji cechy pozwala na wyznaczenie wartości dominanty. W naszym przypadku jest to wartość zbliżona do 34,5. O Zadanie 7. Dla następującego szeregu statystycznego wyznaczyć dominantę metodą analityczną i graficzną. 20-30 30-50 50-80 80-100 n. 10 40 45 20 Źródło: dane umowne ^r Rozwiązanie. Przedstawiony szereg statystyczny nie spełnia założeń niezbędnych do wyznaczenia dominanty w oparciu o wzór przedstawiony w zadaniu 6., gdyż przedziały klasowe nie są równej długości. Konieczne jest zatem przeprowadzenie pewnego rodzaju procedur normalizujących przedstawiony szereg, czyli odniesienie liczebności cząstkowych do jednostki długości przedziału klasowego, co 13 Rozdział I oznacza zastąpienie liczebności tzw. gęstościami przedziałów (oznaczającymi dokładnie natężenie liczebności na jednostkę długości przedziału klasowego). Gęstości oznaczamy symbolem g. i wyznaczamy jako ilorazy liczebności i długości poszczególnych przedziałów. :—- i = 1,2 ... k [5] Mamy zatem odpowiednio: Z\x, = 10 10 . Ax2 = 20 40 4x3 = 30 Ax4 = 20 20 Warto przy tym zauważyć, że nastąpiło przesunięcie dominanty: z trzeciego o granicach 50-80 do drugiego o granicach 30-50 (przedział dominanty to przedział o największym natężeniu liczebności cechy na jednostkę długości przedziału klasowego - co w przypadku przedziałów o równych długościach pokrywa się z największą liczebnością cząstkową). Wzór określający dominantę ma zatem postać: gD-SD-1 gD-SD-1+gD-gD+l gdzie oznaczenia są analogiczne jak w zadaniu 6. W naszym przypadku otrzymaliśmy: •Axr D = 30 + - Również w metodzie graficznej otrzymamy odpowiednio: Analiza struktury zjawisk Rys. 3 3 Zadanie 8. Wydatki na zakup prasy w badanej grupie osób były następujące: 20,0; 25,0; 34,0; 28,8; 28,8; 47,0; 60,2; 20,0; 28,8; 20,0; 34,0; 28,8; 47,0; 20,0; 60,2; 20,0; 34,0; 60,2; 25,0; 25,0; 27,0; 28,8; 25,0; 20,0; 28,8; 60,2; 28,8; 28,8; 60,2; 34,0; 28,8; 28,8; 28,8. Ustalić wartości kwartyli rzędu pierwszego, drugiego i trzeciego oraz zinterpretować je. $ Rozwiązanie. Wyznaczenie miar pozycyjnych w szeregu wyliczającym wymaga jego uporządkowanej w sposób monotoniczny postaci. Zatem pierwszy etap pracy polegać będzie na monotonicznym uporządkowaniu przedstawionych danych. Otrzymujemy szereg w postaci ciągu liczb: 20,0; 20,0; 20,0; 20,0; 20,0; 20,0; 25,0; 25,0; 25,0; 25,0; 27,0; 28,8; 28,8; 28,8; 28,8; 28,8; 28,8; 28,8; 28,8; 28,8; 28,8; 28,8; 34,0; 34,0; 34,0; 34,0; 47,0; 47,0; 60,2; 60,2; 60,2; 60,2; 60,2. Liczebność próby statystycznej jest równa 33 i kwartyle dla szeregu wyliczającego wyznaczamy zgodnie z następującymi zasadami. Najprostszym do wyznaczenia kwartylem jest kwartyl drugiego rzędu, czyli mediana (Me) lub inaczej wartość środkowa. W przypadku szeregu o nieparzystej n + 1 liczbie jednostek jest to realizacja cechy o numerze ~~i— , czyli u . par2ystej wyrazów o numerze - i - + ] , [6] 14 czyli 15 Analiza struktury zjawisk Me = 2 2 W przedstawionym powyżej szeregu jest odpowiednio: Me = x33+i =xl7 =28,8 zł co oznacza, że połowa spośród rozważanej grupy osób wydaje na prasę co najmniej 28,8 zł lub inaczej połowa spośród analizowanych osób wydaje na prasę nie więcej niż 28,8 zł. Kwartyl rzędu pierwszego (Q,) wyznaczamy w szeregu wyliczającym jako medianę pierwszej połowy realizacji cechy, czyli jest to w naszym przypadku wartość x8, a kwartyl rzędu trzeciego (0^,,) to mediana drugiej połowy realizacji cechy, czyli w przypadku rozważanego szeregu realizacja x25. Wyznaczone wartości kwartyli interpretuje się następująco: dla kwartyla Qj 25% ogółu osób w rozważanej grupie wydaje na zakup prasy co najwyżej 25 zł oraz 75% osób wydaje na prasę na co najmniej 75%; dla kwartyla Q,n 25% osób wydaje na prasę nie mniej niż 34 zł, a 75% osób z rozważanej grupy wydaje co najwyżej 34 zł. Dla ułatwienia interpretacji kwartyli posługujemy się również pomocniczym rysunkiem. Rvs. 4 Nadstawie następujących informacji ustalić przeciętny wiek kobiety zawierającej związek małżeński w Chełmie w 1999 roku. Tablica Kobiety zawierające związek małżeński w Chełmie w 1999 roku wg wieku Wiek kobiety w latach do 20 20-29 30-39 40-49 ponad 50 Razem Liczba kobiet 182 219 162 127 84 774 Źródło: dane umowne 4' Rozwiązanie. Ze względu na tzw. niepełną informację statystyczną, czyli niedomknięte skrajne przedziały klasowe miarą poziomu średniego (przeciętnego) musi być w miejsce wartości średniej mediana. Dla szeregu przedziałowego wyznaczamy ją zgodnie z zależnością: Me = xM„ + 0,5n-cumn. Me lMe Me [7] gdzie odpowiednio: Me - oznaczenie miernika; xMe ~ początekprzedziału mediany, czyli przedziału, wktórym znajduje się wyraz n o numerze — ; 2 AxMe - długość przedziału mediany; cuma- skumulowane (zsumowane) liczebności przedziałów poprzedzających przedział mediany; nMe - liczebność cząstkowa przedziału mediany. Niezbędna jest zatem skumulowana (czyli zsumowana) postać szeregu przedziałowego - czyli szereg, w którym przedziałowi klasowemu przyporządkowana jest suma liczebności tego przedziału i wszystkich przedziałów poprzedzających. Ma on postać: Wiek kobiety Liczba kobiet Skumulowana liczba kobiet do 20 lat 20-29 30-39 40-49 ponad 50 182 219 162 127 84 182 401 563 690 774 Razem 774 X Przedział mediany, czyli przedział zawierający element o numerze — = 387, to przedział o granicach 20-29 lat. Możemy zatem wyznaczyć wartość miernika zgodnie z przedstawionym powyżej wzorem: 16 17 Analiza struktury zjawisk Me = 20+ -10 = 2936 lat 219 co oznacza, że przeciętny wiek kobiety zawierajęcej związek małżeński w Chełmie w 1999 r. to wiek około 29,5 lat, a dokładniej połowa kobiet zawierających związek małżeński w Chełmie w 1999 r. nie przekroczyła wieku 29,5 lat. 3 Zadanie 10. Dokonać oceny poziomu wewnętrznego zróżnicowania oraz asymetrii na podstawie danych zamieszczonych w tablicy przedstawiających tygodniowe wydatki na zakup biletów MZK ponoszone przez jednoosobowe rodziny emeryckie w maju 2000 r. Tablica Wydatki na zakup biletów MZK ponoszone przez rodziny emeryckie jednoosobowe w V/02 ' Wy?*tki^ł I • - I o ,0 I ,,_,* I lń_20 I 20_24 I 24-28 I 28-32 (x ,,x. ) ____________V id' ig'___________ Liczba emerytów Źródto: dane umowne r~ Rozwiązanie. Absolutną miarą zróżnicowania jest odchylenie standardowe S(x) wyznaczane jako pierwiastek z wariancji S2(x), czyli średniej arytmetycznej sumy kwadratów odchyleń realizacji cechy od swojej wartości średniej. W przypadku szeregu przedziałowego wariancję liczymy zgodnie z wzorem: 16-20 10 20-24 8 [8] rii=i Względnym miernikiem poziomu zróżnicowania jest współczynnik zmienności, czyli iloraz odchylenia standardowego i wartości średniej. v>=1r [9] Miernikiem asymetrii może być natomiast zestandaryzowany moment centralny rzędu trzeciego postaci: [10] A =- S3(x) lub współczynnik asymetrii Pearsonea postaci: Ap = x-D S(x) [U] W przypadku szeregu punktowego lub wyliczającego znaczne uproszczenie obliczeń uzyskuje się przez ich tabelaryczny zapis (przedstawiono go poniżej). Tablica robocza do wyznaczania miar klasycznych położenia, rozproszenia i asymetrii (*id.*J n. X. x.'ni x,-x (x,-x)2 (x-x)2n. (x.-x)3 n. 4-8 10 6 60 -9,02 81,3604 813,604 -7338,7080 8-12 20 10 200 -5,02 25,2004 504,008 -2530,1201 12-16 31 14 434 -1,02 1,0404 32,2524 -32,8974 16-18 10 18 180 2,98 8,8804 88,804 264,6359 18-22 8 22 176 6,98 48,7204 389,7632 2720,5471 22-26 7 26 182 10,98 120,5604 843,9228 9266,2723 26-32 4 30 120 14,98 224,4004 897,6016 13 446,071 Razem 90 X 1352 X X 3569,956 15795,8 Źródło: dane umowne Wybierając odpowiednie sumy w tablicy roboczej otrzymujemy: _ 1352 x = 90 = 15,02 3569,956 90 S(x) = Vz= f\ T5of '100% = — •15795,8 A. = 90_____ (6,298)3 = 0,7025 i możemy stwierdzić co następuje: • odchylenie standardowe równe 6,298 <*> 6,3 oznacza, że przeciętne wydatki na zakup biletów MZK różnią się od wydatków średnich równych 15,02 zł o ± 6,3 zł; • współczynnik zmienności równy 41,93% oznacza, że odchylenie standardowe 19 Analiza struktury zjawisk stanowi około 42% wartości średniej, co świadczy o silnym wewnętrznym zróżnicowaniu jednoosobowych rodzin emeryckich ze względu na wielkość wydatków na bilety MZK; • współczynnik asymetrii równy 0,7 oznacza silną asymetrię prawostronną, czyli , że wydatki na zakup biletów w większej części rozważanej grupy rodzin nie przekraczają poziomu średniego równego 15,02 zł. 3 Zadanie 11. Na postawie danych zamieszczonych w tablicy dotyczących struktury wieku bezrobotnych kobiet i mężczyzn w dniu 30 czerwca 1998 r. (w tys.) dokonać oceny podobieństwa tych struktur. ?r Rozwiązanie. Wiek Liczba kobiet Liczba mężczyzn Źródto: dane umowne Oceny stopnia podobieństwa struktur dokonujemy za pomocą względnego wskaźnika podobieństwa struktur postaci: [12] czyli ilorazu sum mniejszych wskaźników struktury i większych wskaźników struktury określonych dla każdego z przedziałów analizowanych szeregów (przy czym W; = —L ). n Struktura bezrobotnych wg pici i wieku (w tys.] Odpowiednie obliczenia przedstawimy w tablicy: Z = 1,0385 = 0,9022 Ponieważ wartość miernika jest zbliżona do 1 (czyli do struktur identycznych) możemy stwierdzić, że struktura bezrobotnych kobiet i mężczyzn ze względu na wiek były podobne). O Zadanie 12. Czterech robotników wykonywało w czasie ośmiogodzinnego dnia pracy ten sam detal, przy czym czas poświęcony na wykonanie detalu był różny. Pierwszy robotnik wykonywał detal w ciągu 4 minut, drugi 3 minut, trzeci - 5 minut i czwarty również 4 minut. Obliczyć jaki był średni czas pracy robotnika nad jednym detalem. *r Rozwiązanie. Ze względu na specyfikę mianowania analizowanej cechy (w min./szt.) poziom przeciętny ustalamy za pomocą zmodyfikowanej postaci średniej arytmetycznej, czyli średniej harmonicznej: XH =¦ [13] X; czyli XH = 1+1+1+1 H 1 1 1 1 15 + 12 + 20 + 15 -+-+-+- ---------------- 4 5 3 4 60 4-60 240 -------=-----= 3,87 min/ szt 62 62 Poprawność obliczeń możemy sprawdzić metodą bezpośredniego ustalenia zależności łącznego czasu poświęconego na wyprodukowanie określonego liczby detali. Każdy z robotników pracował 480 min (razem 4 x 480 = 1920 min) i wytworzyli odpowiednio: I 480 : 4 = l2° części II 480 : 3 = l6° części III 480 : 5 = 96 części IV 480 : 4 = l^P części Razem 496 części 21 Rozdział I stanowi około 42% wartości średniej, co świadczy o silnym wewnętrznym zróżnicowaniu jednoosobowych rodzin emeryckich ze względu na wielkość wydatków na bilety MZK; • współczynnik asymetrii równy 0,7 oznacza silną asymetrię prawostronną, czyli że wydatki na zakup biletów w większej części rozważanej grupy rodzin nie przekraczają poziomu średniego równego 15,02 zł. O Zadanie 11. Na postawie danych zamieszczonych w tablicy dotyczących struktury wieku bezrobotnych kobiet i mężczyzn w dniu 30 czerwca 1998 r. (w tys.) dokonać oceny podobieństwa tych struktur. •»' Rozwiązanie. Tablica Struktura bezrobotnych wg pici i wieku (w tys.) Analiza struktury zjawisk Wiek do 25 lat 25-34 35-44 45-54 Ponad 55 lat Razem 409,7 390,1 309,2 99,4 12,0 1220,4 Liczba mężczyzn 353,8 311,8 271,1 110,3 29,3 1076,3 Źródło: dane umowne Oceny stopnia podobieństwa struktur dokonujemy za pomocą względnego wskaźnika podobieństwa struktur postaci: k Z = [12] czyli ilorazu sum mniejszych wskaźników struktury i większych wskaźników struktury określonych dla każdego z przedziałów analizowanych szeregów (przy czym Wj = — ). n Odpowiednie obliczenia przedstawimy w tablicy: Wiek w.k min(w.) max(w.) do 25 25-34 35-44 45-54 pow. 55 0,3358 0,3196 0,2534 0,0814 0,0098 0,3287 0,2897 0,2519 0,1025 0,0272 0,3287 0,2897 0,2519 0,0814 0,0098 0,3358 0,3196 0,2534 0,1025 0,0272 Suma 1,0000 1,0000 0,9615 1,0385 20 Z = 1,0385 = 0,9022 Ponieważ wartość miernika jest zbliżona do 1 (czyli do struktur identycznych) możemy stwierdzić, że struktura bezrobotnych kobiet i mężczyzn ze względu na wiek były podobne). S Zadanie 12. Czterech robotników wykonywało w czasie ośmiogodzinnego dnia pracy ten sam detal, przy czym czas poświęcony na wykonanie detalu był różny. Pierwszy robotnik wykonywał detal w ciągu 4 minut, drugi 3 minut, trzeci - 5 minut i czwarty również 4 minut. Obliczyć jaki był średni czas pracy robotnika nad jednym detalem. *r Rozwiązanie. Ze względu na specyfikę mianowania analizowanej cechy (w min./szt.) poziom przeciętny ustalamy za pomocą zmodyfikowanej postaci średniej arytmetycznej, czyli średniej harmonicznej: x - XH ~ [13] czyli x„ =• 1+1+1+1 4 • 60 240 1 4 1 - 4 15 + 12 + 20 + 15 60 62 62 = 3,87 min/szt Poprawność obliczeń możemy sprawdzić metodą bezpośredniego ustalenia zależności łącznego czasu poświęconego na wyprodukowanie określonego liczby detali. Każdy z robotników pracował 480 min (razem 4 x 480 = 1920 min) i wytworzyli odpowiednio: I 480 : 4 = 120 części II 480 : 3 = 160 części III 480 : 5 = 96 części IV 480 : 4 = 120 części Razem 496 części 21 Rozdział I Analiza struktury zjawisk _ 1920 min „__.., x =-------------= 3,87 min/ szt 496 szt zatem możemy stwierdzić, że przeciętny czas wykonania 1 detalu przez czterech robotników jest równy 3,87 minuty. O Zadanie 13. W ramach przeprowadzonego przez GUS w maju 1999 r. Badania Aktywności Ekonomicznej Ludności pytano również o wykonywanie pracy dodatkowej poza głównym miejscem pracy. Dla losowo wybranych 100 osób mających dodatkowe miejsce pracy otrzymano następujące parametry rozkładu wg wieku: D = 38,7 lat; Vz = 25,64%; A = 0,04 Scharakteryzuj przeciętny wiek tych osób. Naszkicuj krzywą liczebności i zaznacz położenie miar tendencji centralnej. łr Rozwiązanie. Miarą poziomu przeciętnego jest wartość średnia i wyznaczymy ją z wzorów Pearsone'a określających współczynnik zmienności i współczynnik asymetrii. S(x) V, = —^-L x oraz A„ = P x-D ------- S(x) [14] S(x) = Vz-x i Ap- S(x) = x-38,7 dalej otrzymujemy S(x) = 0,2564x i 0,04 • S(x) = x- 38,7 0,04-0,2564-x = x-38,7 x-0,01026x = 38,7 x = 39,1 lat co oznacza, że średni wiek osoby pracującej dodatkowo poza głównym miejscem pracy to 39,1 lat. Uzupełniającą miarą centralną jest mediana. Wyznaczymy ją z przybliżonej równości Pearsone'a postaci: x_D = 3(x-Me) [15] Skąd mamy: 22 2x + D 2-39,1 + 38,7 Wszystkie miary centralne mają zbliżone wartości, co oznacza, że rozkład analizowanej cechy jest niemal symetryczny. Potwierdza to również miernik asymetrii równy 0,04. S Zadanie 14. Czy na podstawie poniższych informacji można obliczyć wartość mediany? a) ogólna liczebność zbiorowości: 150; b) dolna granica przedziału mediany: 10; c) rozpiętość przedziału mediany: 2; d) suma liczebności przedziałów poprzedzających przedział mediany: 60; e) suma liczebności przedziałów wraz z przedziałem mediany: 75. Wykonać niezbędne obliczenia. t Rozwiązanie. Zapiszmy podane informacje za pomocą symboliki statystycznej wykorzystywanej w prezentowanym uprzednio wzorze mediany: n = 150 v = io cumn._, = 60 cum n. = 75 zatem po podstawieniu tych wartości liczbowych do wzoru Me=x Me 'Me 15 Otrzymujemy, że Me = 12. O Zadanie 15. Grupę 150 pracowników pewnego przedsiębiorstwa zbadano pod względem wysokości premii miesięcznej i otrzymano następujące informacje: I wydział: xl = 400 zł; D, = 350 zł; A = 0,5; II wydział: x„ = 300 zł; DII = 330 zł; Ap = -0,5. Ustalić współczynnik zmienności i typowy przedział zmienności dla ogółu pracowników przedsiębiorstwa wiedząc, że proporcje liczebnościowe zatrudnionych pracowników wydziałów I i II mają się jak 2:1. t Rozwiązanie. Do ustalenia mierników rozproszenia zbiorowości podzielonej na rozłączne podgrupy wykorzystamy miary ogólne, czyli tzw. średnią ze średnich i wariancję 23 Analiza struktury zjawisk ogólną jako sumę wariancji wewnątrzgrupowych i międzygrupowych. Konieczna jest przy tym znajomość mierników (średniej i wariancji) w każdej z podgrup. Odpowiednie wzory mają postać: n [16] gdzie: x X. n. oraz gdzie średnia ogólna; średnia w każdej podgrupie; liczebność i-tej podgrupy. S20g(x) = [17] oraz przy czym S2(x) - wariancja w i-tej grupie. Często pierwszy składnik sumy nazywamy jest średnią z wariancji, a drugi wariancją ze średnich. W naszym przypadku konieczne jest wyznaczenie dla każdego wydziału odchylenia standardowego i potem wykorzystania proporcji Hczeb- »/ _2 ^ ¦ nosciowej — , . Przekształcając wzór A otrzymujemy: . . a x"-D S(x) = x-D [18] czyli x,-D, 400-350 50 xn-D„ 300-330 ^ apii u';) Dalej otrzymujemy zależność n, = 2n„ i ze wzorów ogólnych: = 400-2n[I+300-nII 800 + 300 x =------------Li-----------------=---------------= 366,67 zł 3n„ 3 52(X) =------------(1002 • 2n„ + 602 • n„) = - ¦ (20000 + 3600)= - ¦ 23600 = 7866,67 2nn+nn 3 3 S2(x) =------l-------((400-366,67)2 -2nn +(300-366,67)2nn) = 2nn+nnv = - • (2221,7778 + 4444,8889)= 2222,2222 S2(x) = 10088,888 skąd S (x) = 100,44 Ogólny współczynnik zmienności jako iloraz odchylenia standardowego i wartości średniej jest równy: Sog(x) 100,44 \r _ p____ — = 0,2739 x 366,67 Typowy przedział zmienności ustalamy jako przedział o granicach odpowied- nio: (x-S(x);x + s(x)) czyli w naszym przypadku dla ogółu pracowników granice przedziału typowego to: (366,67 -100,44; 366,67 + 100,44) Xtype (266,23; 467,11) 25 24 Analiza struktury zjawisk ogólną jako sumę wariancji wewnątrzgrupowych i międzygrupowych. Konieczna jest przy tym znajomość mierników (średniej i wariancji) w każdej z podgrup. Odpowiednie wzory mają postać: [16] gdzie: x X. n. oraz gdzie przy czym - średnia ogólna; - średnia w każdej podgrupie; - liczebność i-tej podgrupy. [17] oraz S2 (x) - wariancja w i-tej grupie. Często pierwszy składnik sumy nazywamy jest średnią z wariancji, a drugi wariancją ze średnich. W naszym przypadku konieczne jest wyznaczenie dla każdego wydziału odchylenia standardowego i potem wykorzystania proporcji liczeb- nosciowej 1 1 Przekształcając wzór A otrzymujemy: A -^ p S(x) S(x) = x-D [18] czyli 400-350 0,5 0,5 = ^ = 100 24 n-Dn 300-330 = 60 Pn Dalej otrzymujemy zależność nl = 2nn i ze wzorów ogólnych: = 400 • 2n„ + 300• n„ _ 800 + 300 X — ¦ 3nT = 366,67 zł S\x) =-----l------(1002 • 2n„ + 602 • n„) = - • (20000 + 3600)= - ¦ 23600 = 7866,67 2nn + nn 3 3 S2(x) =-----l------((400-366,67)2 -2nn +(300-366,67)2nn) = 7ti _L n -^ 2nn+nn 1 = - • (2221,7778 + 4444,8889)= 2222,2222 S2(x) = 10088,888 skąd S (x) = 100,44 Ogólny współczynnik zmienności jako iloraz odchylenia standardowego i wartości średniej jest równy: S^ 100,44 x 366,67 Typowy przedział zmienności ustalamy jako przedział o granicach odpowiednio: (x-S(x);x + s(x)} czyli w naszym przypadku dla ogółu pracowników granice przedziału typowego to: (366,67 -100,44; 366,67 + 100,44) Xtype (266,23; 467,11) 25 Zadania do samodzielnego rozwiązywania Zadania do samodzielnego rozwiązywania Lj Zadanie 1. Na podstawie danych zawartych w tablicy 1 przedstawić: a). Strukturę pracowników pracujących na stanowiskach robotniczych ze względu na udział dochodów męża w ogólnych dochodach rodziny oraz zilustrować ten szereg graficznie. b). Strukturę rodzin ze względu na miesięczny dochód na osobę (wraz z interpretacją graficzną). c). Zbudować tablicę przedstawiającą łącznie strukturę zbiorowości ze względu na dwie cechy - wiek męża i wiek żony. d). Zbudować tablicę dwudzielną ze względu na ilość dzieci w rodzinie i ilość izb w mieszkaniu, e). Wybrać cechę niemierzalną i dokonać klasyfikacji struktury ze względu na nią oraz zilustrować podział graficznie. Tablica 1 Miesięczny dochód na osobę (zł) Udział doch. męża w doch rodź. w % Lp. Udział doch. męża w doch. rodź. w % Liczba dzieci w rodź. Liczba izb w mieszkaniu Miesięczny dochód na osobę (zł) Posiada samochód Wiek męża Wiek żony 10. 64 1 2 860 tak 39 31 11. 67 1 3 880 tak 52 51 12. 68 3 4 830 nie 44 51 13. 70 1 3 1050 tak 38 33 14. 51 4 4 980 nie 60 49 15. 60 0 2 753 nie 56 51 16. 41 2 2 607 nie 46 38 17. 72 1 3 650 nie 43 38 18. 56 0 1 632 nie 26 24 19. 60 2 1 593 nie 42 39 20. 53 1 1 395 nie 30 28 21. 50 0 2 683 nie 25 22 22. 80 3 3 1020 tak 52 39 23. 100 2 4 700 nie 57 48 24. 63 I 2 680 nie 42 41 25. 50 0 2 950 nie 28 25 26. 63 1 2 1310 tak 37 36 27. 100 0 3 980 tak 33 30 28. 100 1 2 880 nie 39 35 29. 55 2 3 730 nie 40 41 30. 63 3 2 930 tak 62 58 31. 51 4 4 530 nie 61 53 32. 48 0 1 577 tak 40 30 33. 59 1 2 638 nie 70 65 34. 80 0 1 842 tak 29 26 35. 38 0 1 732 nie 31 35 36. 45 3 3 910 tak 48 45 37. 70 1 2 520 nie 57 55 38. 54 0 1 842 tak 45 47 39. 49 0 1 732 nie 42 40 40. 53 0 2 910 tak 35 30 41. 63 2 3 1000 tak 48 40 42. 67 1 2 1110 tak 26 25 43. 50 0 2 731 tak 29 30 44. 46 1 1 981 tak 48 47 26 27 Źródło: dane umowne »L> Zadanie 2. W 20-osobowej grupie studentów obserwowano liczbę godzin nauki w bibliotece w ciągu dnia. Uzyskano dane: 2; 2; 2,5; 3; 1; 1; 2,5; 2; 2; 1; 6; 1; 1,5; 1; 5; 2; 2; 3; 2; 1. Obliczyć średni dzienny czas poświęcony na naukę w bibliotece korzystając z odpowiedniej miary. Wybór miary uzasadnić. Jaki czas na naukę w bibliotece poświęcają studenci najczęściej? Ocenić poziom dyspersji i asymetrii. L> Zadanie 3. Ile wynosi dominanta wzrostu przedszkolaków, dla których dane indywidualne (w cm) są następujące: 120, 124, 124, 123, 120, 122, 124, 123, 124, 119? Ustalić środkową wartość wzrostu przedszkolaków. L> Zadanie 4. Narysuj histogram dla danych z poniższego szeregu, wyznacz medianę i dominantę. 20-30 1 30-50 I 50-80 iL> Zadanie 5. Dzienne zużycie energii elektrycznej (w kWh) w pewnym bloku mieszkalnym kształtowało się następująco: Zużycie energii I 2^4 I 4^6 I 6^8 I iMu I 10-12 ! 12-14 40 10 Liczba mieszkań _____6_____I 10 30 ______________ Oblicz średnią arytmetyczną, medianę, dominantę, kwaryle, współczynnik zmienności oraz typowy obszar zmienności. L¦ Zadanie 6. Strukturę rodzin wg ilości członków rodziny w miejscowości L charakteryzuje poniższy rozkład. 28 Zadania do samodzielnego rozwiązywania Liczba członków rodziny 2 3 4 5 6 7 8 Odsetek rodzin 15 30 20 15 10 5 5 Za pomocą poznanych miar klasycznych i pozycyjnych dokonać analizy rozkładu rodzin wg liczby jej członków. L• Zadanie 7. Czterech rowerzystów przebyło ten sam odcinek drogi. Pierwszy przyjechał z prędkością 6 km/h, drugi z prędkością 10 km/h, trzeci z prędkością 12 km/h, czwarty z prędkością 15 km/h. Jaka była średnia prędkość rowerzystów? Jakiej należy użyć miary przeciętnej? 4a Zadanie 8. W 1999 r. u pewnego sadownika ceny 1 kg jabłek wynosiły: za I gatunek 3,5 zł, za II gatunek 2 zł, za III 1,5 z. Sadownik uzyskał ze sprzedaży 10 200 zł, w tym po 2100 zł za I i III i 6000 zł za II gatunek. Ile wynosiła średnia cena jabłek u sadownika? L» Zadanie 9. W mieszance jest 20 kg składnika po 15 zł za kilogram, 15 kg składnika po 20 zł za kilogram i 5 kg składnika po 30 zł za kilogram. Obliczyć cenę 1 kg mieszanki. Zadanie 10. Na podstawie następujących danych oblicz średnią arytmetyczną i podaj jej interpretację Tablica Sklepy branży tekstylnej według obrotów osiągniętych w marcu 1998 r. Obroty w zł (xi„.xit) Liczba sklepów n, 8000-9000 23 9000-10000 45 10000-11000 67 11000-12000 55 12000-13000 10 Razem 200 Źródło: dane umowne Dokonaj analizy wielkości obrotów za pomocą znanych miar centralnych. *» Zadanie 11. Oblicz i podaj interpretację średniej arytmetycznej i wskaźników struktury, 29 Rozdziat I Zadania do samodzielnego rozwiązywania a także zaprezentuj graficznie (metoda powierzchniowa - koło) przedstawione w tablicy dane: Pracownicy: „ABA" S.A. w Skawinie wedtug wieku w 1998 roku Źródło: dane umowne Ustal dominujący wiek pracownika zakładu "ABA". Jakiego wieku nie przekroczyła połowa pracowników? Zadanie 12. Czas rozwiązywania pewnego zadania przez grupę uczniów przedstawia tablica: 12 Czas rozwiązywania w min. Liczba uczniów______|________________________ Przedstaw interpretację graficzną tego rozkładu i dokonaj analizy za pomocą miar centralnych. L• Zadanie 13. W jednym z domów studenckich przeprowadzono badanie dotyczące miesięcznych wydatków na cele kulturalne. Wyniki badania przedstawia tablica: Odsetek studentów_________10__________30 ~1 40 I 20 40-80 I 80-120 Wydatki miesięczne 120-160 160-200 Za pomocą klasycznych i pozycyjnych miar zmienności oceń zróżnicowanie badanej zbiorowości pod względem wydatków miesięcznych na cele kulturalne. L» Zadanie 14. Oblicz średnią powierzchnię indywidualnego gospodarstwa rolnego w pewnym województwie na podstawie poniższych danych. Powierzchnia gosp. w ha Skumulowany odsetek gosp. Największe obszarowo gospodarstwo miało w tym województwie 35 ha, a najmniejsze 1 ha. Dokonać następnie pełnej analizy struktury za pomocą poznanych miar klasycznych i pozycyjnych. Lj Zadanie 15. Zbadano dwie grupy na wydziałach Ekonomii i Administracji pod względem wzrostu. Uzyskano następujące wyniki: Wydział Ekonomi Wydział Administracji Mediana 170 cm Średnia arytmetyczna 170 cm Średnia arytmetyczna 168 cm Odchylenie standardowe 10 cm Wariancja 36 cm Współczynnik skośności 0,8 Dominanta 175 cm Mediana 164 cm Na podstawie tych informacji przeprowadzić wszechstronną analizę badanych zbiorowości po uprzednim uzupełnieniu brakujących parametrów. Li Zadanie 16. Koszt produkcji telewizorów w zakładzie I wynosi 570 zł przy rocznej produkcji 15 tys. sztuk. W zakładzie II koszt wynosi 650 zł przy rocznej produkcji 10 tys. sztuk. Ile wynosi łączny koszt produkcji telewizora dla obu zakładów? Jak zmieni się ten koszt, gdy w obu zakładach wzrośnie on o 8%. Wiedząc dodatkowo, że odchylenie standardowe kosztów dla zakładu I wynosi 30 zł, a dla zakładu II S2(x) = 2025. Zbadać zróżnicowanie za pomocą miar absolutnych i względnych. Zadanie 20. a) Zapisz zależność pomiędzy x, M(x) i D(x) w przypadku dodatniej skośności rozkładu empirycznego. b) Narysuj schemat krzywej liczebności stażu pracy, gdy x = 11,5, a D(x) = 13,8. Wypowiedz się na temat asymetrii tego rozkładu.
  • Zadanie 23. W dwóch regionach rolniczych przeprowadzono badanie mające na celu porównanie wielkości gospodarstw indywidualnych. Badanie wykazało, iż w regionie I najliczniej występują gospodarstwa o powierzchni 5,5 ha, połowa gospodarstw 32 miała powierzchnię mniejszą od 6 ha, średnia powierzchnia gospodarstwa wynosiła 6 ha. Współczynnik zmienności liczony w oparciu o odchylenie standardowe wyniósł 0,3. Dla regionu II opracowano następujący szereg liczbowy: Wielkość gospodarstwa w ha 2-A 4-6 6-H 8-10 10-12 Odsetek gospodarstw 10 20 25 35 10 Porównać możliwie wszechstronnie powierzchnię gospodarstw w obydwóch regionach. L¦ Zadanie 24. W wybranym oddziale Banku Śląskiego liczba udzielanych tygodniowo kredytów długoterminowych kształtowała się następująco: Kwota kredytu w tys. zł 0-10 10-20 20-30 30^0 40-50 Liczba kredytobiorców 7 12 19 8 4 Kierownik wydziału w swoim sprawozdaniu stwierdził, że najczęściej udzielanym kredytem jest kredyt w wysokości 25 tys. zł. Czy miał rację? Dodatkowo stwierdzono, że 1/4 kredytów o najwyższej wartości powinno być oprocentowanych według odrębnych zasad (bardziej dogodnych dla klientów). Czy kredytobiorca pobierający kredyt w wysokości 32 tys. może liczyć na dogodną formę oprocentowania? Określić poziom przeciętny wysokości udzielanego kredytu. /L¦ Zadanie 25. Najczęściej na targowisku osiedlowym sprzedawano w pierwszej dekadzie czerwca truskawki w cenie od 4,5 zł do 5 zł (około 30%). Dokładnie cena dominująca była równa 4,8 zł. Truskawek w cenie od 4,0 do 4,5 było 20%. Ile było truskawek w cenie 5,0 do 5,5 zł? L> Zadanie 26. Wyznaczyć poziom asymetrii mając dane: D = 5, Me = 6 oraz Vz = 0,4. Li Zadanie 27. Średnia płaca kobiet w przedsiębiorstwie X wynosi 850 zł, a średnia płaca mężczyzn 1050 zł. Ile wynosi średnia płaca dla całego przedsiębiorstwa, gdy kobiet jest trzykrotnie więcej niż mężczyzn? Jak zmieni się średnia płaca, gdy płace kobiet i mężczyzn wzrosną o 10%? Uzasadnić odpowiedź. Wiedząc dodatkowo, że odchylenie standardowe dla kobiet wynosi 100 zł, a dla mężczyzn S2(x) = 40 000. Oceń zróżnicowanie ogółu płaca za pomocą miar absolutnych i względnych. L¦ Zadanie 28. Dokonano pomiaru głębokości jednego z mazurskich jezior wybierając 100 33 Zadania do samodzielnego rozwiązywania *a) Z^ztaSność pomiędzy *, M(x) i D(x) w przypadku dodatniej skośności rozkładu empirycznego. <- D(x\ = 138 b) Narysuj schemat krzywej liczebności stażu pracy, gdy x - 11,5, a D(x) Wypowiedz się na temat asymetrii tego rozkładu. uzyskano dane (w zł) przedstawione^vpomzszej_tabelL .-U I 1,3-1 10 1,4-1 13 1,5-1 1,6-1, 1,7-1, 1,8-1, Ogóle 50 akcji Liczba sesji | i» | .^ , .. 1____________________________ Jednocześnie wiadomo, że wielkość pierwszego momentu zwykłego w rozkładzie akcji Okocimia wynosiła 55,71 zł, a drugi moment zwykły w tym rozkładzie był równy 3180,48. 1) Dokonać pełnej analizy zróżnicowania cen akcji BIG stosując znane miary dyspersji i spłaszczenia. 2) Porównać zróżnicowanie cen akcji obu przedsiębiorstw. Ocenić prawdziwość podanych poniżej stwierdzeń i skorygować sformułowania błędne: 1. Gdyby wszyscy pracownicy wyjeżdżali równie często za granicę, to czyniliby to przeciętnie 2 razy w roku. 2. Taki sam odsetek pracowników wyjeżdżał rzadziej niż jeden raz w roku, jak i częściej niż raz w roku. 3. Przeciętne zróżnicowanie wyjazdów w stosunku do średniej wynosiło 1,20. 4. Typowymi pracownikami byli ci, którzy wyjeżdżali nie więcej niż 2 razy. 5. W badanym roku pracownicy centrali odwiedzili kraje Europy Zachodniej łącznie 105 razy. L> Zadanie 23. W dwóch regionach rolniczych przeprowadzono badanie mające na celu porównanie wielkości gospodarstw indywidualnych. Badanie wykazało, iż w regionie I najliczniej występują gospodarstwa o powierzchni 5,5 ha, połowa gospodarstw 32 miała powierzchnię mniejszą od 6 ha, średnia powierzchnia gospodarstwa wynosiła 6 ha. Współczynnik zmienności liczony w oparciu o odchylenie standardowe wyniósł 0,3. Dla regionu II opracowano następujący szereg liczbowy: Wielkość gospodarstwa w ha 2-4 4-6 6-8 8-10 10-12 Odsetek gospodarstw 10 20 25 35 10 Porównać możliwie wszechstronnie powierzchnię gospodarstw w obydwóch regionach. L• Zadanie 24. W wybranym oddziale Banku Śląskiego liczba udzielanych tygodniowo kredytów długoterminowych kształtowała się następująco: Kwota kredytu w tys. zl 0-10 10-20 20-30 30-40 40-50 Liczba kredytobiorców 7 12 19 8 4 Kierownik wydziału w swoim sprawozdaniu stwierdził, że najczęściej udzielanym kredytem jest kredyt w wysokości 25 tys. zł. Czy miał rację? Dodatkowo stwierdzono, że 1/4 kredytów o najwyższej wartości powinno być oprocentowanych według odrębnych zasad (bardziej dogodnych dla klientów). Czy kredytobiorca pobierający kredyt w wysokości 32 tys. może liczyć na dogodną formę oprocentowania? Określić poziom przeciętny wysokości udzielanego kredytu. Zadanie 26. Wyznaczyć poziom asymetrii mając dane: D = 5, Me = 6 oraz V_ = 0,4. L¦ Zadanie 27. Średnia płaca kobiet w przedsiębiorstwie X wynosi 850 zł, a średnia płaca mężczyzn 1050 zł. Ile wynosi średnia płaca dla całego przedsiębiorstwa, gdy kobiet jest trzykrotnie więcej niż mężczyzn? Jak zmieni się średnia płaca, gdy płace kobiet i mężczyzn wzrosną o 10%? Uzasadnić odpowiedź. Wiedząc dodatkowo, że odchylenie standardowe dla kobiet wynosi 100 zł, a dla mężczyzn S2 (x) = 40 000. Oceń zróżnicowanie ogółu płaca za pomocą miar absolutnych i względnych. L» Zadanie 28. Dokonano pomiaru głębokości jednego z mazurskich jezior wybierając 100 33 Zadania do samodzielnego rozwiązywania punktów pomiarowych w odległości 70 m od brzegu. Uzyskano następujące dane: Głębokość dna w metrach 20-21 21-22 22-23 23-24 | 24-25 | Liczba punktów pomiarowych 14 24 38 16 Czy prawdą jest, że najczęściej głębokość ta wynosiła 23 metry? Postanowiono, że 1/4 punktów o największej głębokości ustawione zostaną dodatkowe znaki ostrzegawcze. Czy można będzie ustawić taki w miejscu głębokim na 22,75 metra? Oceń średnią głębokość jeziora w odległości 70 metrów od linii brzegu. L> Zadanie 29. Mając dane następujące miary statystyczne wyznacz pozostałe i podaj ich interpretację: As = -0,65; V =0,2;x = 50. Lj Zadanie 30. W dwóch wydziałach przedsiębiorstwa prowadzono badania kształtowania się premii obliczając średnią wysokość premii i współczynnik asymetrii. Dla 250 osób wydziału I otrzymano: x = 700 zł i współczynnik skośności As = -0,8 a dla 300 osób II wydziału x = 800 zł i współczynnik skośności As= -0,8. Odchylenie standardowe jest takie samo dla obydwóch wydziałów i wynosi 50 zł. Wyznaczyć współczynnik zmienności dla obydwóch wydziałów łącznie. ODPOWIEDZI DO ZADAŃ 2. D = 2; = 124; Me = 123; ?)= 8; Me = 8,2; D = 8,5; V = 0,2795; xt G (5,764; 10,236); x = 4,1; S(x) = 1,64; Vz = 0,4; D = 3; A$ = 0,67; Me,= 4; Q, = 3; Q2 = 5; Xh ~ 2100 6000 2100 ~ ' Z 3,5 + 2 + 2 xH = 18,75 zł/kg; { xH = 27,27 os/km; pow. 2750 km2; . x = 43,54; Me = 44,17; D = 45,44; . x = 7 min; S(x) = 2; D = 6,97 min; A, = 0,0142; Vz = 0,2857; , S(x) = 25, 46; Vz = 0,1988; Q = 27,5;VQ = 0,2115.' Po uwzględnieniu nierównej długości przedziałów klasowych okazuje się, że rozkład cechy jest skrajnie asymetryczny, zatem można wykorzystać jedynie miary pozycyjne. 7. 9. 10. 11. 12 13 14 Me = 9,7 ha; Q, = 6,03 ha; Q3 = 15,94 ha. 15. W. Ekonomii: x = 168 cm; Me = 170 cm; D = 174 cm; S(x) = 7 cm; Vz = 0,042; A = -0,86; W. Zarządzania: x = 170 cm; Me = 168 cm ; D = 164 cm; S(x) = 10 cm; V = 0,059; A = 0,6; x e (160; 180); 16. xog = 602 zł; Sog = 53,72 zł; V = 0,089; 17. xo = 1100 zł; Sog = 148,93 zł; V = 0,134; 18. DOS= 6,95. Miary tendencji centralnej x = 7; S(x) = 2; V = 0,28; x e (5; 9) 19. A^ = -0,33; 21. BIG: x = 1,442; S(x) = 0,1647; V = 0,1142; A, = 0,376; 1) Okocim: S(x) = 8,7678; V = 0,1576; 2) Ceny obligacji Okocimia są bardziej zróżnicowane od cen akcji BIG-u. 23. I obszar: x = 6,25; Me = 6; D = 5,5; V = 0,3; As = 0,4 II obszar: x = 7,3; Me = ; D = 8,57; V = 0,316; a] = -0,55 24. Kierownik nie miał racji, bo D = 23,89 tys. zł. Tak, klient pobierający kredyt w wysokości 32 tys. zł może liczyć na dogodną formę oprocentowania, bo Q3 = 29,74 tys. zł; x = 23. 25. Truskawek w cenie od 5 zł do 5,5 zł było 23,3%. 26. As = 0,577; 27. x! =900 zł; S = 158,11; V =0,1757; 2g og og zog a) nie, bo = 22,39 m; b) nie, bo Q3 = 22,94 m; c) x = 22,3 m; 29. x = 50; S(x) = 10; D = 56,5; Me = 52,17; 30. x=og = 754,55 zł; Vc = 0,118; 35 34 Elementy teorii współzależności cech Rozdział II Elementy teorii współzależności cech 3 Zadanie 1. W ramach przeprowadzanych okresowo badań konsumenckich prześledzono zależności pomiędzy średnimi miesięcznymi dochodami netto (w tys. zł) na 1 osobę w gospodarstwie domowym i wydatkami na produkty zbożowe (w zł) w mieście X na podstawie danych z próby losowej obejmującej 10 gospodarstw domowych czteroosobowych. Uzyskano następujące szeregi danych: —1 | | I . . | , jest cechą niezależną oznaczaną przez x, a wydatki cechą zależną oznaczoną przez y. Porównując zmiany szeregów danych opisujących każdą z cech stwierdzamy, że wraz ze wzrostem realizacji cechy niezależnej maleje realizacja cechy zależnej, czyli współzależność ma kierunek ujemny. b). Diagram rozrzutu korelacyjnego jest to przedstawienie w kartezjańskim układzie współrzędnych zbioru punktów reprezentujących obserwacje obydwu cech dla określonej jednostki statystycznej (tutaj gospodarstwa domowego). Przyjmując zatem oznaczenia par obserwacji jako (x., y.) wprowadzamy je do układu współrzędnych i otrzymujemy odpowiednio: Na tej podstawie ustalić: a). Czy pomiędzy wyróżnionymi zmiennymi zachodzi logiczny związek cech i jaki jest jego kierunek. b). W oparciu o diagram rozrzutu korelacyjnego stwierdzić, czy pomiędzy zmiennymi zachodzi liniowa zależność, jaki jest jej kierunek i przybliżona siła. c). Za pomocą odpowiedniego miernika statystycznego ocenić siłę i kierunek współzależności cech. d). Wyznaczyć postać funkcyjną związku pomiędzy cechami i ocenić stopień ich dopasowania. e). Wyznaczyć prawdopodobny poziom wydatków na produkty zbożowe w rodzinie o przeciętnym miesięcznym dochodzie netto równym 2,1 tys. zł. t Rozwiązanie. a). Zgodnie z ekonomicznymi przesłankami popyt na określone dobro kształtowany jest między innymi przez poziom dochodów w rodzinie, więc można stwierdzić, że pomiędzy poziomem wydatków na określone produkty, a poziomem dochodów netto zachodzi logiczny związek cech, przyjmując jednocześnie, że dochód 0,5 0,6 0,7 0,8 0,9 1 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2 Rys. 5 Na podstawie diagramu korelacyjnego możemy stwierdzić, że pomiędzy wielkością dochodów netto a poziomem wydatków na produkty zbożowe zachodzi ujemna współzależność liniowa o znacznej sile. Na taki wniosek pozwala kształt .obwiedm obejmującej wszystkiej punkty diagramu przypominający wąską elipsę skierowaną ku dołowi. c). Miernikiem pozwalającym na ocenę współzależności cech jest w tym przypadku współczynnik korelacji liniowej Pearsone'a postaci: cov(x,y) S(x)-S(y) [19] gdzie odpowiednio: cov(x,y) - oznacza kowariancję cech, czyli średnią arytmetyczną iloczynów odchyleń realizacji cech od swoich wartości średnich wyrażoną wzorem 1 cov(x, y) = -1 (xj - x)(y, - y) n n m S(x), S(y) - są to odchylenia standardowe cech X i Y. [20] 37 Elementy teorii współzależności cech Możemy wykorzystać jedną z uproszczonych postaci wzoru na współczynnik korelacji i obliczenie przedstawia się w postaci tablicy roboczej. Przyjmijmy więc: Tablica robocza y, 0,6 95 0,8 93 0,9 90 1,0 88 1,1 85 1,3 82 1,5 79 1,7 76 1,9 75 2,0 73 12,8 836 y-y -0,68 11,4 -0,48 9,4 -0,38 6,4 -0,28 4,4 -0,18 1,4 0,02 -1,6 0,22 -4.6 0,42 -7,6 0,62 -8,6 0,72 -10,( (x,-x)2 (y,-y)2 (x.-x) (yry) 0,4624 129,96 -7,752 0,2304 88,36 -4,512 0,1444 40,96 -2,432 0,0784 19,36 -1,232 0,0324 1,96 -0,252 0,0004 2,56 -0,032 0,0484 21,16 -1,012 0,1764 57,76 -3,192 0,3844 73,96 -5,332 0,5184 112,36 -7,632 2,0760 548,4 -33,38 Na podstawie tej tablicy wyznaczamy współczynnik korelacji rx : rxy = lub rxy - 1=1 [21, 22] i stwierdzamy, że pomiędzy dochodem na osobę w rodzinie i wydatkami na produkty zbożowe zachodzi silna współzależność w kierunku ujemnym, co potwierdza wcześniejszy wniosek o tym, że wraz ze wzrostem dochodu maleje spożycie produktów zbożowych. d) Funkcyjna zależność między cechami statystycznymi przedstawiona jest w postaci tzw. linii regresji II rodzaju, czyli w postaci teoretycznej linii regresji. W przypadku zależności liniowej można ją wyznaczyć metodą bezpośrednią, czyli za pomocą klasycznej metody najmniejszych kwadratów lub pośrednią w oparciu i wyznaczone wartości współczynnika korelacji liniowej Pearsone'a i odchylenia standardowe obydwu cech. Klasyczna metoda najmniejszych kwadratów określa linię regresji jako równa- nie: gdzie: 38 y = ax + b b= J=!-----i=L /=i V '=1 J 1=1 V /=i Natomiast w metodzie pośredniej ustalamy linię regresji następująco: y = ayx + by [24] gdzie: f S(y) xy S(x) by= y-ayx Linia regresji wyznaczona metodą pośrednią ma postać: y = -16,079x+ 104,1813 gdyż |548,4 ay = -0,9893 = -0,9893- 16,253 = -16,079 by = 83,6 - (-16,079)- 1,28 = 104,1813 Natomiast linia regresji wyznaczona metodą bezpośrednią jest postaci: y =-16,07899x + 104,1811 gdyż 10-1036,7-12,8-836 -333,8 [23] b = 10-18,46-(12,8)2 " 20,76 836-18.46 = 12.8-1036,7 _ 2170,48 10-18,46- (12,8)2 = -16,07899 = 104,1811 20,76 39 Elementy teorii współzależności cech postaci: i(yi-y*)2 d = r;v [25] gdzie: y* - oznacza wartość teoretyczną zmiennej zależnej wyznaczoną na podstawie teoretycznej linii regresji. Współczynniki ę2 i d są miarami uzupełniającymi się wzajemnie i interpretowanymi w postaci wielkości procentowych lub stosunkowych. Odpowiednie wartości teoretyczne y* są równe: yj = -16,079 • 0,6 + 104,1813 = 94,5339 y,; = 91,318 y; = 89,7102 ... i dalej y;o = 72,0233 Odpowiednio suma kwadratów odchyleń wartości empirycznych i teoretycznych jest równa: -y*)2= 11,683 = 0,0213 i współczynnik zbieżności jest równy: 2 11,683 (D =-------------- 548,4 S2 _ Q i daiej Su = 1,2085 Vu = 4r = 0,1446 y e) Spodziewany poziom zmiennej zależnej y wyznaczony na podstawie równania regresji dla hipotetycznej wielkości zmiennej x nazywamy prognozą statystyczną. W naszym przypadku prognoza zmiennej y - wydatków na produkty zbożowe w rodzinie o dochodzie średnim 2,1 tys. zł na osobę jest równa y', = -16,079 ¦ 2,1 + 104,1813 = 70,4154 czyli 70 zł i 42 grosze. Należy jednocześnie uwzględnić średni błąd prognozy, czyli przeciętną wielkość błędów losowych, jakie popełnia się, szacując y" na podstawie otrzymanej funkcji regresji. Wyznaczamy go zgodnie z wzorem: S . = Su • Jest on odpowiednio równy: x)2 r^2 [26] co oznacza w przeliczeniu na wartości procentowe, że 2,13% zmian zmiennej y zależy od przyczyn losowych, czyli innych czynników niż zmienna x. Natomiast współczynnik determinacji: d = rx2y = (- 0,9893)? = 0,9787 w przeliczeniu na jednostki procentowe oznacza, że w 97,87% zmiany wielkości wydatków na produkty zbożowe zależą od zmian dochodów. Oprócz tych miar wyznacza się również wartość odchylenia resztowego Su jako pierwiastek z wariancji resztowej S* i jego proporcję z poziomem przeciętnym zmiennej y. Miernik ten nazywany jest współczynnikiem zmienności przypadkowej. Odpowiednio: 40 S . = 1,2085 • Jl + — + (2;1 1>28* = 1,2085 • ^1,42389 = 1,442 yP V 10 2,076 Zatem wielkość prognozowana jest równa 70,42 ± 1,442, czyli możemy stwierdzić, że w rodzinie o dochodzie na osobę równym 2,1 tys. netto wydatki na produkty zbożowe będą się mieścić w przedziale (68,98; 71,86) zł. O Zadanie 2. Badanie rocznej stopy zwrotu dla pewnych akcji A oraz dla całego rynku papierów wartościowych w ciągu kolejnych 5 lat dało następujące wyniki: Rok 1 2 3 4 5 Akcje A 38,6% -24,7 12,7 8,2 40,1 Rynek 23,8% -7,2 6,6 20,5 30,6 Żródto: dane umowne 41 Dokonać analizy współzależności wartości stopy zwrotu akcji A i całego rynku papierów wartościowych ustalając linię regresji, współczynnik korelacji liniowej, współczynnik determinacji oraz ocenić poziom stopy zwrotu akcji dla znanej stopy zwrotu na rynku papierów wartościowych równej 10%. t Rozwiązanie. Konstruujemy pomocniczą tablicę roboczą i na jej podstawie ustalamy niezbędne parametry statystyczne pozwalające na ocenę współzależności cech. -----,-----------------1----------; -----1----- Elementy teorii współzależności cech Czas remontu (w dniach) 10-20 20-30 30-40 40-50 50-60 Liczba obrabiarek 10 30 50 40 20 -7,2 -24,7 51,84 43,56 420,25 -20,464 1,658 23,941 Linia regresji ma zatem postać y = l,6x - 8,92. Interpretując współczynnik regresji a, = 1,6 możemy stwierdzić, że wzrost stopy zwrotu wszystkich akcji o 1% spowoduje wzrost stopy zwrotu akcji A przeciętnie o 1,6%. Współczynnik korelacji liniowej Pearsone'a wyznaczony jako iloraz kowariancji i iloczynu odchyleń standardowych będzie równy. Średni wiek remontowanych obrabiarek jest równy 16 lat, a jego względna dyspersja wynosi 30%. Pomiędzy wiekiem obrabiarek a czasem remontu zachodzi zależność liniowa, przy czym wydłużenie czasu eksploatacji o rok powoduje przedłużenie czasu remontu przeciętnie o 2 dni. W oparciu o powyższe dane należy: a) określić siłę i kierunek zależności korelacyjnej; b) oszacować czas remontu obrabiarek dziesięcioletnich; c) ustalić czy czas remontu obrabiarek w większym stopniu zależy od ich wieku niż od innych przyczyn. ty Rozwiązanie. Aby odpowiedzieć na pytanie sformułowane w zadaniu należy określić logiczny związek cech przedstawionych w zadaniu i zapisać podane parametry symbolicznie. Przyjmując zależność, że czas remontu obrabiarki zależy od jej wieku oznaczamy przez y - czas remontu urządzenia a przez x - wiek obrabiarki. Na podstawie danych przedstawionych w tablicy wyznaczamy niezbędne parametry do ustalenia zależności korelacyjnej. 5550 150 = 37 293,15 13,52-23,73 = 0,913 S(y) = bo dodatkowo wiadomo, że x = 16 ay = 2; Vz(x) = 30% co oznacza, że zależność między stopą zwrotu wszystkich a ccji na ry <• ^ WSp5jCZynnj]c koreiacjj wyznaczamy ze współczynnika regresji 7wrotu akcii A jest silna i ma dodatni kierunek. mQlW = ""plliynńik dominacji d-I- r"„ iest odpowiedn.o ro»ny^ = 1 - (MB) tość stopy zwrotu akcji A przy zadanym poz.om.e stopy zwrotu na rynku c = 10% stopa zwrotu będzie równa 7,08%. i dalej O Zadanie 3. Empiryczny rozkład czasu remontu 150 obrabiarek w zakładzie remontowym przedstawia tablica: 42 rxy ~ay x-V. z(x) S(y) 11,075 = 0,8668 43 zmienne) y. Zatem: czyli gdzie i dalej y = ayx y = 2X = 37 _ 2 • 16 = 5 = 2X + 5 ™1rhvlenia standardowego reszt A mianowicie S „=S(y)-Jl-rxy czyli Su = 11,075 • -Jl - (0,8668^ =11,075-0,2486 = 5,526 co oznacza, że rzeczywisty czas remontu obrabiarek róż wyznaczonego na podstawie linii regresji o ± 5,5 dnia. Wzając współczynnik zmienności przypadkowej obrabiarek różnił się od teoretycznego znaczonego na p Wyznaczając współczynnik Vw - V 37 0,1493 okreto, ł r^. jako Elementy teorii współzależności cech Uwzględniając błąd prognozy Sf « Su stwierdzamy, że czas remontu obrabiarek dziesięcioletnich może trwać od 20 do 30 dni. c) Siłą wzajemnej współzależności cech ustalamy za pomocą współczynnika determinacji d, a siłą zależności losowych za pomocą współczynnika indetermina-cji (zbieżności) cp2. Obliczając d=rx2v = 0,86672 =0,7513 oraz >)-S(x)'s(x)~ S\x) " 1,96 by= y-ayx = 50,7-5,719-3,6 = 30,ll y = 5,719x + 30,11 Ustalamy odchylenie standardowe reszt Su i współczynnik zbieżności przypadkowej, aby na ich podstawie ocenić czy równanie regresji jest przydatne w prognozowaniu Su = S(y) • yl - rx2y = 10,6 ¦ Vl-0,7552 = 6,95058 __SU_ 6,95068 co oznacza, że tylko w 13,71% wartość przeciętna zmiennej zależnej obarczona jest błędem losowym, czyli przedstawione równanie może być wykorzystane w celach prognostycznych. Zatem rodzina czteroosobowa powinna zamieszkiwać w mieszkaniu o powierzchni 53 m2, ponieważ y* = 5,719 • 4 + 30,11 = 52,986 « 53 m2 Wyznaczamy następnie współczynniki determinacji i zbieżności i na ich podstawie oceniamy siłę zależności zmiennej y od różnych czynników. d = r2y; cp2=l-r2y d = (0,755)2 = 0,57; (p2 = 1 - (0,755)2 = 0,43 » i możemy stwierdzić, że powierzchnia mieszkania w silniejszym stopniu zależy od /. ilości ząrrueszkujących je osób niż od innych czynników. U) >*-"......~--N. Q ( O Zadanie^ ffwnym przedsiębiorstwie zbadano zależność pomiędzy zarobkami pracowników (y) a wydajnością ich pracy (x) i utrzymano następujące równania regresji y = 0,05x + 3,4; x = 5y + 2 OL y ex u, 46 O' Ocenić siłę zależności pomiędzy poziomem wynagrodzenia a wydajnością pracy pracowników rozważanego przedsiębiorstwa. ł Rozwiązanie. Konieczne jest ustalenie współczynnika korelacji liniowej Pearsone'a, co w przypadku dwustronnego logicznego związku cech (z którym w przypadku tych zmiennych mamy do czynienia), możliwe jest w oparciu o wielkość iloczynu współczynników regresji liniowej obydwu równań. Wykorzystując równoważność ~ r xy S(y) r S(x) xy S(x) = r. xy otrzymujemy przy czym znak + lub - wybieramy zgodnie ze znakiem współczynników regresji ponieważ kierunek regresji i korelacji jest ten sam. Zatem co pozwala na stwierdzenie, że pomiędzy wielkością zarobków a wydajnością pracy pracownika zachodzi umiarkowana współzależność o kierunku dodatnim, czyli wzrost jednego z czynników powoduje równoczesny wzrost drugiego z nich. Z> Zadanie 6. W procesie produkcyjnym wyrobu A zastosowano zmiany technologiczne wpływające na jakość wyrobu. Celem zbadania czy zmiany te mają istotny wpływ na zmiany jakości pobrano próbę liczącą 150 jednostek i sklasyfikowano ją wg gatunków otrzymując: ^^^-^^ Gatunek Tech. produkcji-~--~^ I II III Przed zmianą 50 10 20 Po zmianie 4(1 20 10 Ustalić czy zastosowanie zmian technologicznych w procesie produkcji wpływa na jakość produkowanych wyrobów. 4' Rozwiązanie. Ze względu na specyfikę zmiennych opisujących badane zjawisko (zmienne 47 Rozdział II jakościowe) konieczne jest zastosowanie odpowiedniego miernika pozwalającego na wykrycie istnienia współzależności. Najbardziej odpowiedni będzie współczynnik Czuprowa Tx lub współczynnik kontyngencji cx. Miary te mają postać: Txy=. oraz cxy = [27, 28] gdzie odpowiednio: s - liczba wierszy w tablicy wielodzielczej; k - liczba kolumn w tablicy wielodzielczej; n - liczba elementów próby statystycznej; X2 - statystyka chi kwadrat liczona zgodnie z wzorem X = . Przy czym: n.. - liczebność cząstkowa (liczba jednostek umieszczona na przecięciu i-tego wiersza i j-tej kolumny w tablicy obserwacji) r.'. - teoretyczna liczebność cząstkowa wyznaczona zgodnie z wzorem n. - liczebność brzegowa wiersza „i", czyli suma liczebności cząstkowych w wierszu „i" n. - liczebność brzegowa kolumny „j", czyli suma liczebności cząstkowych w kolumnie „j" Liczebności teoretyczne i wartość statystyki %2 można wyliczyć w pomocniczej tablicy gdzie odpowiednio: n, = 80, n2 = 70, n, = 90, n2 = 30, n3 = 30. 48 n. n.'. (n.. - n .'.)2 * ii i|' ("ii-nij)2 <] '1 nU 1,1 50 48 2 4 0,0833 1,2 10 16 -6 36 2,25 1.3 20 16 4 16 1,000 2,1 40 42 -2 4 0,0952 2.2 20 14 6 36 2,5714 2,3 10 14 -4 16 1,1429 Elementy teorii współzależności cech 80-90 .o . 80-30 ., ¦ 80-30 ,^ n,, =--------= 48 n,, =------— = 16 n13 = —— = 16 n21 = 150 70-90 150 = 42 150 70-30 150 70-30 150 =14 ^ 150 = 14 i dalej X2= 7,143 Współczynnik Czuprowa przyjmuje wartość Txy= ;7'143 xy i 150^(2 -0(3-1) =0,1833 zatem możemy stwierdzić, że współzależność między rodzajem technologii produkcji wyrobu, a jego jakością jest nieznaczna. 3 Zadanie 7. W grupie 400 absolwentów Akademii Ekonomicznej przeprowadzono analizę zgodności kierunku wykształcenia (finanse lub marketing) z łatwością znalezienia atrakcyjnej pracy. Wśród 200 absolwentów specjalności finanse pracę bez zbytnich problemów uzyskało 80 osób, a wśród absolwentów specjalności zarządzanie problemy ze znalezieniem atrakcyjnej pracy miało 50 osób. Czy na podstawie wyników tej ankiety możemy twierdzić, że istnieje statystycznie istotna zależność pomiędzy kierunkiem ukończonych studiów ekonomicznych a możliwością znalezienia atrakcyjnej pracy? & Rozwiązanie. Analizie podlegają dwie różne cechy statystyczne i charakterze dychotomicz-nym (czyli przyjmujące tylko dwie realizacje) dające się przedstawić w postaci tzw. tablicy czteropolowej. Zachodzi Nie zachodzi Zachodzi a b Nie zachodzi c d Na podstawie tej tablicy współzależności badamy za pomocą współczynnika asocjacji Yulle'a Y wyznaczonego jako: ad-bcj [29] 49 Rozdział II W naszym przypadku otrzymujemy tablicę postaci —_______^ Praca Wydział ~ ——__^ Bez problemów Z problemami Finanse 80 120 200 Zarządzanie 150 50 200 230 170 400 i współczynnik asocjacji 80-50-120-150 a/230-170-200-200 160^23-17-20-20 Współczynnik przyjmuje wartości z przedziału (0,1) i wartość bliska zeru oznacza brak statystycznie istotnej zależności. W przypadku analizowanej próby możemy stwierdzić, że kierunek ukończonych studiów w niezbyt silnym stopniu wpływa na możliwości znalezienia atrakcyjnej pracy. O Zadanie 8. W wybranej dekadzie miesiąca lipca przeprowadzono w nadmorskiej miejscowości wypoczynkowej analizę zależności średniej temperatury dziennej (mierzonej w °C w godzinach południowych) oraz stopnie zachmurzenia nieba. Uzyskano następujący ciąg danych empirycznych. Data 3.07 4.07 5.07 6.07 7.07 8.07 9.07 10.07 11.07 12.07 Temp. w °C 23° 25° 28° 28° 30° 27° 25° 23° 20° 21° Stopień zachmurzenia stabe bez chmur bez chmur stabe bez chmur stabe umiark. umiark. silne zachm. silne zachm. W oparciu o odpowiednią miarę statystyczną ocenić, czy zachodzi statystycznie istotna współzależność pomiędzy stopniem zachmurzenia nieba a temperaturą dzienną, ¦r Rozwiązanie. Ze względu na specyfikę zmiennych (jedna mierzalna, a druga niemierzalna) i małą próbę statystyczną na podstawie, której należy sformułować wniosek najbardziej odpowiednim miernikiem korelacji będzie współczynnik korelacji rang Spe-armana, w którym podstawą miernika są rangi, czyli numery nadane realizacjom cech w ich wewnętrznym, monotonicznym uporządkowaniu. Współczynnik Spe-armana ma postać: 6-Id,2 [30] gdzie: 50 Elementy teorii współzależności cech d. = t.-t.; i xi vi txj, ty. oznaczają rangi realizacji cech x oraz y. W przypadku, gdy w monotonicznym uporządkowaniu pojawiają się obok siebie dwie (lub więcej) te same realizacje cechy, to aby nie wyróżniać żadnej z nich nadajemy tym realizacjom rangę równą średniej arytmetycznej rang, które im odpowiadają. Procedurę rangowania i jej dalsze etapy przedstawimy w przypadku analizowanego zagadnienia w tablicy roboczej. X. y, *¦* d, d2. 23 stabe 3,5 6 -2,5 6,25 25 bez chmur 5,5 9 -3,5 12,25 28 bez chmur 8,5 9 -0,5 0,25 28 stabe 8,5 6 2,5 6,25 30 bez chmur 10 9 1 1 27 stabe 7 6 I 1 25 umiarkowane 5,5 3,5 2 4 23 umiarkowane 3,5 3,5 0 0 20 silne 1 1,5 -0,5 0,25 21 silne 2 1,5 0,5 0,25 Zatem współczynnik rs jest równy 6-31,5 r.=1- 10(100-l) = 1-0,1909 = 0,8091 Ponieważ miernik Spearmana zachowuje własność współczynnika Pearsona, czyli należy do przedziału (-1,1) i badana zależność jest tym silniejsza im miernik jest bliższy ± 1, możemy stwierdzić, że zależność pomiędzy temperaturą powietrza i stopniem zachmurzenia nieba jest statystycznie istotna i odznacza się znaczną siłą. 3 Zadanie 9. Współczynniki korelacji liniowej Pearsone'a miedzy produkcją dóbr trwałego użytkowania (x), podażą tych dóbr (y) oraz ich importem (z) są równe odpowiednio: r*y = 0.3; rxz = -0,5; rxz = 0,5 Obliczyć wszystkie logicznie uzasadnione związki miedzy badanymi zmiennymi wykorzystując w tym celu współczynniki korelacji cząstkowej. Czy prawdą jest, 51 Rozdziaf II że ok. 4% zmian podaży dóbr trwałego użytkowania zależą od innych czynników niż produkcja i import tych dóbr. 41 Rozwiązanie. Ze względu na wielokierunkowe współzależności mogące zachodzić pomiędzy dwiema lub trzema zmiennymi należy wybrać te powiązania, które są ekonomicznie logicznie uzasadnione i dla nich wyznaczyć mierniki korelacji cząstkowej i wielorakiej. Współczynniki korelacji cząstkowej określają współzależność pomiędzy dwiema wybranymi cechami z pominięciem pozostałych, a współczynniki korelacji wielorakiej pozwalają na ocenę zależności pomiędzy wybraną zmienną a wszystkimi pozostałymi równocześnie. Oznaczamy je odpowiednio: r, 2 3 k - zależność pomiędzy zmiennymi x,, x2 z pominięciem pozostałych; R| 23 k— równoczesna zależność zmiennej x, od wszystkich pozostałych. W naszym przypadku logiczne jest rozpatrywanie zależności pomiędzy produkcją i podażą z pominięciem importu (rx z) pomiędzy produkcją i importem z pominięciem podaży (rx ) i pomiędzy podażą i importem z pominięciem produkcji (rvzx). Natomiast do oceny w jakim stopniu zmiany podaży zależą od zmian innych czynników niż produkcja i import tych dóbr wykorzystamy współczynnik korelacji wielorakiej Rvzx, którego kwadrat daje współczynnik determinacji i w konsekwencji współczynnik zbieżności cp2. Współczynniki korelacji cząstkowej mają postać następującą: rxy- •'yz xyz ^(l _ r^ -rv2?) rxz- rxy •rzy *xzy >/(l-r- 2 Vi ;y/V 1 — 'zy/ r = ryZ- fxy •rzx -4) a współczynnik korelacji wielorakiej określamy wzorem Ryzx - yz gdzie: 52 Elementy teorii współzależności cech rxy, rK, ryz - współczynniki korelacji liniowej Pearsonea pomiędzy rozważany- mi zmiennymi. Wartości liczbowe mierników są równe odpowiednio: xyz 0,3-(-0,5) 0,5 _ 0,3 + 0,25 _ 0,55 " A/(l-(-0,5)2)(l-(0,5)2) ~ V0J5-0,75 ~ 0,75 -0,5-0,3-0,5 -0,5-0,15 _-0,65 V(l-(0,3)2)(l-(0,5)2) ~ a/0,9 1-0,75 ~~0J5~ 0,5-(-0,5>0,3 _ 0,65 V(l-(-0,5)2)(l-(0,3)2)~V0,75-0,91 = 0,733 'yzx = -0,7868 = 0,7868 0,32+0,32-2-0,3-0,5-(-0,5) _ 10,25+ 0,09+ 0,15 _ |0,49 1-0,25 Ryzx - Interpretując wartości mierników możemy stwierdzić, że: a) nie uwzględniając importu wybranego dobra pomiędzy jego podażą a produkcją zachodzi silna współzależność; b) również silna współzależność zachodzi pomiędzy importem i produkcją z pominięciem podaży oraz podażą a importem z pominięciem produkcji; c) nie jest prawdą, że w około 4% zmiany podaży zależy od innych czynników niż wielkość importu i produkcji określonego dobra, gdyż współczynnik ep- jest równy q>2=l-R2 =03467 O Zadanie 9. W grupie 100 uczniów gimnazjum badano zależność pomiędzy wynikami testu semestralnego z matematyki (x), czasem poświęcanym na naukę przedmiotu (y) i ilorazem inteligencji (z). Otrzymano następujące współczynniki korelacji liniowej określające związki pomiędzy poszczególnymi zmiennymi: rxy = 0,8; = 0,6. Nauczyciel przedmiotu twierdzi, że wyniki testu w dwóch trzecich zależą od ilorazu inteligencji i czasu poświęconego na naukę przedmiotu. Czy ma rację? 53 Rozdział II ?r* Rozwiązanie. Aby zweryfikować stwierdzenie nauczyciela należy •wyznaczyć współczynnik determinacji w oparciu o współczynnik korelacji wielorakiej Rx , czyli gdzie Jr2 4-r2 — lx r łxy ~ ixz Zllxy xyz i 3 1-r, yz odpowiednio T> __ Ivxyz ~ 0,82+0,62-2-0,8-0,3-0,6 (0,64 + 0,3-0,288 10,712 - (- 0,3)2 \ 1-0,09 d = (0,8845)2 = 0,7824 = 0,8845 co oznacza, że wyniki testu semestralnego w około 78% zależą od czasu poświęcanego na naukę i ilorazu inteligencji, zatem nauczyciel nie miał racji. 54 Zadania do samodzielnego rozwiązywania L• Zadanie 1. Zmierzono dwie zmienne w dwóch kolejnych doświadczeniach. Uzyskano następuje wartości obserwacji: X 2 3 4 5 6 y 3 5 5 5 7 Zakładając, że między zmiennymi istnieje dodatnia liniowa zależność korelacyjna ocenić siłę tego związku. Lj Zadanie 2. Przeprowadzono w wybranej grupie studenckiej badania statystyczne dotyczące wyniku egzaminu końcowego ze statystyki (y - w punktach), ilorazu inteligencji (x - jednostkach IQ) i liczby godzin poświęconych na naukę przedmiotu (z -w godzinach). Uzyskane dane prezentuje tablica. Nr studenta X y z Nr studenta X y z I 83 1 12 9 7 91 124 10 2 77 115 6 8 79 113 9 3 95 129 14 9 36 106 5 4 49 103 4 10 58 1 14 7 5 63 1 17 8 I 1 93 136 8 6 80 115 12 12 84 127 3 Źródło: dane umowne a) Ustalić, które z cech wykazują największą wewnętrzną zmienność. b) Obliczyć współczynniki korelacji liniowej Pearsone'a między cechami: x i y, x i z oraz y i z. 55 Rozdział II c) Określić, które z cech silniej wpływa na wyniki egzaminu - iloraz inteligencji czy czas poświęcony na naukę. d) Zbadać współzależność cech za pomocą współczynnika Spearmana. 43 Zadanie 3. W fabryce zbadano jak kształtuje się średnia wydajność pracowników w zależności od nieprzerwanej pracy. Otrzymano tablicę: Czas pracy I 2 3 4 5 6 7 Wydajność w szt./h 19 22 19 17 15 13 14 Określić rodzaj badanej zależności korelacyjnej na podstawie wykresu rozrzutu i obliczyć współczynnik korelacji. Jakiej wydajności możemy się spodziewać u pracownika pracującego nieprzerwanie 9 godz.? W jakim stopniu wydajność pracownika zależy od czasu nieprzerwanej pracy a w jakim od innych czynników? 43 Zadanie 3. Zbadano zależność między ilością reklam pewnego wyrobu emitowanych dziennie w TV, a wysokością obrotu w tys. zł uzyskanych ze sprzedaży rozważanego wyrobu. Dane przedstawia tablica. Ilość reklam 3 5 4 5 6 7 Wielkość obrotu 15 133 142 150 148 151 Źródto: dane umowne a) Sporządzić wykres rozrzutu korelacyjnego i na jego podstawie ustalić kształt, silę i kierunek zależność cech. b) Wyznaczyć i zinterpretować współczynnik korelacji Pearsonea. c) Jaki obrót może osiągnąć ze sprzedaży firma, gdy dziennie będzie emitowanych 8 reklam? d) W jakim stopniu liczba reklam kształtuje poziom obrotu firmy? e) Jak zmieni się obrót, gdy liczba emitowanych reklam wzrośnie o jedną dziennie? 43 Zadanie 5. Producent napojów chłodzących zgromadził dane o ilości zamówień (w tys. 1) i średniej temperaturze dobowej (w °C) w ciągu wybranych 10 dni. Dane te przedstawia tablica Średnie temperatury dobowe 18 24 29 20 35 18 14 27 30 22 Wielkość zamówienia 50 93 119 60 160 52 35 105 120 71 Źródło: dane umowne 56 Zadania do samodzielnego rozwiązywania a) Czy istnieje zależność między ilością zamówień i temperaturą dobową. Jeśli tak określić jej sil i kierunek? b) Zbudować odpowiedni model regresji liniowej. c) Określić w jakim stopniu ilość zamówienia zależy od temperatury. d) W jakim stopniu wzrośnie ilość zamówień, gdy temperatura wzrośnie o 1°C? 43 Zadanie 6. Analityk kosztów usług szpitalnych chce oszacować liniowy związek między liczbą dni hospitalizacji pacjenta ( jakiej będzie on wymagał w ocenie lekarza przyjmującego ) i całkowitym kosztem pobytu pacjenta w szpitalu. Wyniki badania mają być wykorzystane do prognozowania kosztów pobytu pacjenta w szpitalu na podstawie wstępnej oceny długości jego pobytu. Wybrano następującą losową grupę 11 przypadków zachorowań: Ilość dni 5 6 2 7 1 4 8 3 2 5 9 Koszt pobytu 2 845 3 030 2 568 3 288 2 327 2 966 3 760 2 580 2 772 3 199 3 520 Źródło: dane umowne Oszacuj parametry liniowego modelu regresji i oceń jego dokładność. 43 Zadanie 7. Analiza spożycia artykułu C zależnie od dochodu w losowej próbie gospodarstw domowych dostarczyła następujących informacji: • średnie spożycie artykułu C na 1 osobę wynosi 2,5 kg, • średni miesięczny dochód na 1 osobę wynosi 540 zł, • współczynnik zmienności dochodu wynosi 15%, a spożycia 20%, • poziom kowariancji równa się 27. Wypowiedzieć się na temat siły i kierunku zależności. Oszacować parametry funkcji regresji spożycia względem wielkości dochodów oraz obliczyć poziom spożycia dla rodzin o dochodach średnich wynoszących 600 zł. Czy wysokość dochodu wpływa na poziom spożycia silniej niż inne czynniki? 4a Zadanie 8. Z badania zależności między wielkością opłat za zużycie energii elektrycznej a wielkością gospodarstw domowych dla 80 wylosowanych wynika, że kowariancja tych zmiennych wynosi 32, średnia wielkość gospodarstwa domowego 4 osobowego z odchyleniem standardowym 0,8, a średnia wysokość miesięcznych opłat 300 zł, przy średnim zróżnicowaniu tych opłat 150 zł. Oszacować parametry liniowej funkcji regresji wysokości opłat za zużycie energii elektrycznej względem wielkości gospodarstw domowych. Jaka jest siła tej zależności? 57 Rozdział II W jakim stopniu wielkość gospodarstwa domowego wpływa na zużycie energii elektrycznej? Zadanie 9. Kierownik działu marketingowego sugeruje dyrektorowi pewnej firmy zwiększenie wydatków na reklamę w celu zwiększenia zysku firmy. Dyrektor nie chce się zgodzić i twierdzi, że związek pomiędzy tymi cechami jest bardzo słaby. Czy stanowisko dyrektora jest słuszne, jeśli wyniki w ciągu ostatnich 6 miesięcy były następujące: Wydatki na reklamę 1 3 4 8 6 9 Zysk w tys. zł 40 50 60 90 80 120 W jakim stopniu wydatki na reklamę wpływają na zysk firmy? Jaki zysk może osiągnąć firma, gdy wydatki na reklamę będą wynosić 7 j.p. (jednostek pieniężnych)? Jak zmieni się poziom zysku, gdy wydatki wzrosną o 1 j.p.? *L¦ Zadanie 10. W pewnym zakładzie pracy przeprowadzono badanie zależności pomiędzy stażem pracy (x) i odsetkiem braków w produkcji (y) wykonywanej przez 135 robotników i otrzymano następujące wyniki: a) średni staż pracy równy 8 lat, średni odsetek braków równy 10%, b) zróżnicowanie mierzone współczynnikiem zmienności wynosi: dla stażu - 30%, dla odsetka braków - 25%, c) współczynnik regresji odsetka braków względem stażu pracy wynosi -0,62. Co można powiedzieć o kierunku i sile korelacji między tymi zmiennymi:* Zadanie 12. W zakładach odzieżowych przeprowadzono badania w celu ustalenia zależności miedzy długością serii produkcji w tys. sztuk (x) a jednostkowym kosztem produkcji wyrobu w tys. zł (y). W rezultacie otrzymano następujące równania regresji: x = -0,003y +1,7 i y = -270x + 5160 a) Podać interpretację współczynników regresji a i ax. b) Co można powiedzieć o kierunku i sile zależności pomiędzy tymi cechami? c) Jaki jest teoretyczny poziom kosztu jednostkowego przy długości serii 10 tys sztuk? d) Jak zmieni się koszt jednostkowy jeśli długość serii wydłużymy o 1 tys. sztuk? Zadanie 13. Dane wyjściowe są następujące: , x = 10, y = 12, S(x) = 3, V =03 oraz ao= 2,5. Ustalić siłę i kierunek współzależności oraz ocenić w jakim stopniu jedna cecha wyjaśnia drugą. Ustalić poziom cechy y, gdy x = 12. L¦ Zadanie 14. Mamy dane: ax = 1,6, sx = 10, sv = 6. Obliczyć współczynnik determinacji. Zadanie 15. Wypowiedzieć się, które wyniki obliczeń są niewiarygodne i dlaczego? a) a, = -0,2 i 08 b) a, = 0,75 c) rxv = -0,75 , = 0,2 i r = 0,8 b, = 2,5 b, = -0,23 L3 Zadanie 16. W wybranej grupie studenckiej przeprowadzono badania dotyczące zależności pomiędzy płcią i paleniem papierosów. Wśród 50 kobiet 12 paliło papierosy a wśród 50 mężczyzn do palenia papierosów przyznało się 42. Ułożyć tablicę asocjacji i na podstawie odpowiedniego miernika stwierdzić czy istnieje zależność pomiędzy tymi cechami. L> Zadanie 17. Dla wybranej grupy osób opracowano test zręcznościowy. Wyniki tego testu określano jako pozytywne i negatywne. Wśród 220 kobiet objętych badaniem 2/5 uzyskało wynik negatywny a wśród 200 mężczyzn dla 65% określono wyniki również jako negatywny. Czy prawdą jest stwierdzenie, że wynik testu zależał od płci badanej osoby? 59 Rozdział II Lj Zadanie 18. Dla pewnej grupy gospodarstw domowych zbadano roczne spożycie na osobę dwóch artykułów spożywczych: mąki (A) i tłuszczów (B) w kg i otrzymano następujące wyniki: Spożycie A 10 20 25 30 40 45 60 Spożycie B 20 25 35 30 45 50 60 a) Wyznaczyć proste regresji spożycia wymienionych artykułów metodą najmniejszych kwadratów. b) Obliczyć współczynnik korelacji między tymi zmiennymi. Zadanie 21. Badając zależność pomiędzy stażem pracy (y) w latach a wydajnością pracownika (x) w sztukach dla grupy 50 wylosowanych pracowników wynagradzanych w systemie akordowym otrzymano następujące informacje: y = 0,3x + 3y = 18 lat, r2 = 0,81. XV Na podstawie tych informacji: a) Ustalić i zinterpretować parametry brakującego równania regresji. b) Ocenić siłę i kierunek współzależnych cech. 60 Zadania do samodzielnego rozwiązywania c) Określić jaka będzie wydajność pracownika z dwudziestoletnim stażem pracy. d) Ocenić w jakim stopniu wydajność pracownika zależy od jego stażu pracy. e) Jak zmieni się wydajność pracownika, gdy jego staż wzrośnie o rok. Zadanie 29. W mikroregionie centralnej Polski na podstawie danych dotyczących wydatków na edukację w gminach ( X ), liczby mieszkańców gmin ( Y ) oraz dochodów gmin (Z) obliczono współczynniki korelacji liniowej Pearsonea równe odpowiednio: r = 0,5774; rxz = 0,6805; r„ = 0,4236. Obliczyć właściwe w sensie logicznym współczynniki korelacji cząstkowej oraz współczynnik korelacji wielorakiej. 62 Zadania do samodzielnego rozwiązywania L3 Zadanie 30. Liczba kopalń, wydobycie oraz poziom zatrudnienia w kopalniach węgla brunatnego w kolejnych latach 1970-1974 przedstawia tablica: Rok Liczba kopalń Wydobycie w min ton Zatrudnienie w tyś 1970 8 32,8 13,1 1971 9 34,5 13,7 1972 8 38,2 14,5 1973 8 39,2 13,7 1974 6 38,8 12,7 ODPOWIEDZI DO ZADAŃ 1. r = 0,8944; 2. af V, = 0,24; V, . = 0,078; V . . = 0,387; b) rxy = 0,794; rx? = 0, ry/ = 0,34; c) dj = 0,631; d" = 0,323; dy, = 0,115; 3. r^ =7-0,888; d ='0,789; cp2 = 0,34; = 10,4 szt. 4. /y = 0,7949; y*8) = 163,23 tys. zł; d = 0,632; wzrośnie o ok. 7,8 tys. zł; 5. Zależność między zmiennymi ma charakter liniowy rxv = 0,8755; y = 5, 387; x - 35,78; d = 0,76 - w 76,66% wielkość zamówień zależ}' od temperatury; gdy temperatura wzrośnie o 1°C to zamówienie wzrośnie o 5,39 tys. litrów; 6. Linia regresji dla kosztów pobytu w zależności od czasu pobytu w szpitalu y = 153,5958 x + 2260,73; ę2 = 0,1364; 7. rxy = 0,667, funkcje regresji: y = 0,004x + 0,34; y(;o()) = 2,74 kg; d = 44,5% jn H___ k 2>jo H [42] gdzie: w.o - wartość „j"-tego elementu agregatu (zespołu elementów podlegających zmianom) w momencie bazowym (wcześniejszym w sensie chronologicznym); wjn - wartość „j "-tego elementu agregatu w momencie badania (chronologicznie późniejszym). • Agregatowy indeks cen: a) Laspeyeresa TL_ lp — IPjoljo b) Paaschego • Agregatowy indeks ilości: a) Laspeyeresa b) Paaschego 70 IPjoljn [43] [44] TP_ lp — [45] [46] jo Analiza dynamiki zjawisk gdzie odpowiednio: PjO> Pjn ~ ceny -)"- teSo eIem- agregatu w momencie wzorcowym i badania; q|O' % ~ ilości "i"- teg° elem- agregatu w momencie wzorcowym i badania. Indeksy agregatowe wartości, cen i ilości Laspeyeresa i Paaschego pozwalają na ocenę zmian wartości z uwzględnieniem przyczyny tych zmian lub bez podania przyczyn. . Łączne zmiany cen i ilości ustalamy za pomocą indeksów Fischera (odpowiednio cen i ilości) czyli średnich geometrycznych indeksów agregatowych Laspeyeresa i Paaschego. Ip=Vlp-Ip Ip^aAp'1? [47.48] W naszym przypadku obliczanie warto przeprowadzić w pomocniczej tablicy: Artykuł Pi. % Pn % P. q Pi„-q„ Cytryny Pomarańcze Banany 4,5 3,8 2,7 400 900 700 4,8 6,5 3,3 400 500 850 1800 3420 1890 1920 3250 2805 1 800 1900 2295 1920 5850 2310 X X X X 71 10 7975 5995 10080 Wykorzystując do obliczenia mierników wartości z ostatniego wiersza tablicy (wiersza sumacyjnego) otrzymujemy: ip = 7110 10080 7110 5995 7110 = 1,4177 = o,8432 5995 = 13303 10080 = 0,7912 lF = 71,4177-13303 = 1,3733 1^=70,8432-0,7912=0,8168 71 Rozdział III Ocenić zmiany wartości cen i ilości sprzedawanych owoców. Stwierdzić co w silniejszym stopniu wpływa na zmiany wartości sprzedaży - zmiana cen czy zmiana ilości. V Rozwiązanie. Ze względu na potrzebę rozpatrywanie łącznie zmian wszystkich (tzn. trzech) gatunków owoców w zakresie wartości, cen i ilości w miejsce indywidualnych mierników dynamiki wykorzystujemy mierniki agregatowe. Mają one postać: • Agregatowy indeks wartości: k Iw [42] JO gdzie: wjo - wartość „j"-tego elementu agregatu (zespołu elementów podlegających zmianom) w momencie bazowym (wcześniejszym w sensie chronologicznym); w - wartość „j"-tego elementu agregatu w momencie badania (chronologicznie późniejszym). • Agregatowy indeks cen: a) Laspeyeresa b) Paaschego • Agregatowy indeks ilości: a) Laspeyeresa b) Paaschego 70 I? = Ipi [43] [44] «=¦ [45] [46] Analiza dynamiki zjawisk gdzie odpowiednio: po, p.n - ceny „j"- tego elem. agregatu w momencie wzorcowym i badania; q o, q.n - ilości „j"- tego elem. agregatu w momencie wzorcowym i badania. Indeksy agregatowe wartości, cen i ilości Laspeyeresa i Paasche'go pozwalają na ocenę zmian wartości z uwzględnieniem przyczyny tych zmian lub bez podania przyczyn. . Łączne zmiany cen i ilości ustalamy za pomocą indeksów Fischera (odpowiednio cen i ilości) czyli średnich geometrycznych indeksów agregatowych Laspeyeresa i Paaschego. ^ ~ " ^ ~ [47,48] W naszym przypadku obliczanie warto przeprowadzić w pomocniczej tablicy: Artykuł Pio p. Mn % P. q |O 1,1. Cytryny Pomarańcze Banany 4,5 3,8 2,7 400 900 700 4,8 6,5 3,3 400 500 850 1800 3420 1890 1920 3250 2805 1800 1900 2295 1920 5850 2310 X X X X 7110 7975 5995 10080 Wykorzystując do obliczenia mierników wartości z ostatniego wiersza tablicy (wiersza sumacyjnego) otrzymujemy: w 7110 1^=^ = 1,4177 7110 5995 7110 = 0,8432 5995 10080 = 0,7912 IqF = = Vl,4177-13303 = 1,3733 ' =0,8168 71 Rozdział III Interpretując wartości mierników stwierdzamy, że: • pomiędzy marcem a majem nastąpił wzrost wartości sprzedawanych owoców cytrusowych o 12,17% (Iw = 112,17%); • gdyby ilość sprzedanych owoców była w maju taka sama jak w marcu, to zmiany cen owoców spowodowałby wzrost łącznych obrotów ze sprzedaży o 41,77% (IL = 141,77%); • gdyby ilość sprzedawanych owoców była w marcu taka sama jak w maju to zmiany cen spowodowałby wzrost łącznych obrotów ze sprzedaży o 33,03% (Ip =133,03%); • zmiana cen owoców spowodowała wzrost łącznych obrotów z ich sprzedaży o 37,33% (F =137,33%); • gdyby ceny owoców w maju były takie same jak w marcu to zmiany wielkości sprzedaży spowodowałyby spadek obrotów o 20,88% (Ip =79,12%); • zmiana ilości sprzedawanych owoców spowodowała spadek obrotów z ich sprzedaży o 18,32% (P =81,68%). Odpowiadając na pytanie co w większym stopniu kształtuje wielkości obrotów zmiany cen czy zmianę wielkości masy fizycznej sprzedawanych owoców stwierdzamy silniejszy wpływ zmiany cen pomiędzy rozważanymi miesiącami. Spowodowały one wzrost obrotów o 37,33%, podczas gdy zmiany wielkości sprzedaży tylko w 18,32% wpłynęły na wielkość obrotów. S Zadanie 5. Biuro turystyczne „Ramzes" oferowało w swojej ofercie „Lato 2002" wyjazdy do Egiptu, Kenii i Maroko. W związku z doskonale przeprowadzoną kampanią reklamową sprzedano wczasy do Egiptu za 40 000 euro, do Kenii za 33 000 euro i do Maroka za 25 000 euro. Okazało się przy tym, że z wczasów do Egiptu zysk był większy o 1/3 niż w roku 2001, z wyjazdów do Kenii o 10% a z wyjazdów do Maroka niższy o 20%. Ocenić łącznie zmiany obrotów biura turystyki „Ramzes" w dwóch kolejnych latach. Co w silniejszym stopniu wpłynęło na ewentualne zmiany wielkości obrotów - zmiany cen czy ilości sprzedanych wycieczek, gdy wiadomo, że wycieczki do Egiptu potaniały przeciętnie o 10%, do Kenii ceny nie uległy zmianie a do Maroka zdrożały o 10%. T Rozwiązanie. Aby odpowiedzieć na pytanie sformułowana w treści zadania należy wyznaczyć indeksy agregatowe wartości oraz cen i ilości Fischera. Ze względu na tzw. ograniczoną informację statystyczną zamiast pełnej postaci mierników wykorzystamy ich zmodyfikowaną formę opartą o równości: Pjn wj0 •1P=Pjo-qjo — = pjn -qjo Pjo 72 Analiza dynamiki zjawisk ip Pin. ljn Zmodyfikowana postać indeksów Laspeyeresa i Paaschego są następujące: I,L=- IPP=: Warto przy tym zauważyć, że pomiędzy miernikami zachodzą pewne zależności zwane równościami indeksowymi i ich wykorzystanie, zdecydowanie przyspiesza proces obliczania wskaźników. Równości te mają postać: I =ILIP I =IL -T [49, 50] Tablica robocza do wyznaczania wartości mierników w naszym przypadku będzie miała postać: Impreza w. zmiany cen io w. • i PO D w. : i Egipt Kenia Maroko 30.000 30.000 31.250 40.000 33.000 25.000 0,9 1,0 1,1 27.000 30.000 34.375 44.444 33.000 22.727 91.250 98.000 X 91.375 100.172 Odpowiednio wartości mierników będą równe: 98000 L, = 91250 = 1,074 1^^75=1,001 p 91250 Ipp =0,978 73 Rozdział III ij, =0,990 ^ = il074 = q fp 0,978 f =hL = h91± = io73 q IL 0,001 IqF =1,085 Możemy zatem stwierdzić, że ogólnie obroty firmy turystycznej „Ramzes" wzrosły w roku 2002 o 7,4% w porównaniu do roku 2001, przy czym zdecydowany wpływ na zysk firmy miały zmiany ilości sprzedanych wycieczek, a nie zmiany cen. S Zadanie 6. Ilościowe spożycie kawy w latach 1995-2001 wzrosło o 10%, natomiast herbaty pozostało bez zmian. Ustalić dynamikę spożycia obydwu używek łącznie jeśli wiadomo, że obrót wartościowy kawą w roku 2001 był trzykrotnie wyższy niż herbatę, r Rozwiązanie. Dysponując ograniczoną informację statystyczną możemy wyznaczyć jedynie jeden z mierników ilościowych i na jego podstawie formułować wnioski odnośnie dynamiki spożycia. Wyznaczymy agregatowy indeks ilości Paaschego: 3x w Jn 3x x ----1— 1,1 1 4x 3,72x -1,073 W liczniku wskaźnika wprowadzona została niewiadoma x jako, że nie były znane wartości spożycie używek a jedynie zależność między nimi. Możemy zatem stwierdzić, że ogólnie poziom spożycie kawy i herbaty wzrósł o 7,3%. 3 Zadanie 7. Na 12 kolejnych sesjach giełdowych ceny akcji pewnej spółki kształtowały się następująco: 5, 7, 7, 9, 8, 10, 13, 14, 12, 15, 15, 17. Wyznaczyć postać teoretycznej linii trendu cen akcji tej spółki i ocenić dobroć jej do dopasowania do danych empirycznych. 74 Analiza dynamiki zjawisk & Rozwiązanie. Teoretyczna linia trendu może być wyznaczona na podobnych zasadach, jak teoretyczna linia regresji, czyli za pomocą klasycznej metody najmniejszych kwadratów, przy czym rolę zmiennej niezależnej pełni zmienna czasowa. Zatem yt = at + b, gdzie w rozwinięciu macierzowym wektor szacowanych parametrów ma postać: Lt Zt ¦— [51] [52] lub w przekształconej postaci (z układu równań normalnych) a = b = y - at [53] Natomiast dokładność oszacowania oceniamy za pomocą współczynnika zbież- ności qr postaci: 2= -\2 I(yt-y) [54] gdzie: yt - oznacza empiryczną wartość zjawiska; y' - oznacza wartość teoretyczną wyznaczoną w oparciu o linię trendu. Dla celów naszego zadania zbudujemy pomocniczą tablicę roboczą. t y, t2 yt y,' y.-y," (y.-y.T y,-y (y,-y)2 1 5 1 5 5,3075 0,3075 0,0946 -16 36 2 7 4 14 6,3425 -0,6575 0,4323 -4 16 3 7 9 21 7,38 0,38 0,1444 -4 16 4 9 16 36 8,415 -0,585 0,3422 -2 4 5 8 25 40 9,45 1,45 2,1025 -3 9 6 10 36 60 10,485 0,485 0,2352 -1 I 7 13 49 91 11,52 -1,48 2,1904 2 4 8 14 64 112 12,555 -1,445 2,0880 3 9 9 12 81 108 13,59 1,59 2,5281 I 1 10 15 100 150 14,625 0,375 0,1406 4 16 11 15 121 165 15,66 0,66 0,4356 4 16 12 17 144 204 16,695 0,305 0,0930 6 36 78 132 650 1 006 X X 10 827 X 164 75 Rozdział III Wartości parametrów są następujące: 12-1006-78-132 12072-10296 1776 12-650-C78)2 7800-6084 1716 b = 11 - 1,035 ¦ 6,5 = 11 - 6,7275 = 4.2725 = 1,035 a linia trendu ma postać: yt = l,035t + 4,2725 Na jej podstawie wyznaczamy wartości teoretyczne yt' i odpowiednio współczynnik zbieżności cp2. 2 10,827 o =---------= 0,066 164 Możemy zatem stwierdzić, że z sesji na sesję przeciętna cena akcji spółki wzrasta o 1,03 zł. Współczynnik zbieżności świadczy o dobrym dopasowaniu linii teoretycznej do danych empirycznych, gdyż tylko 6,6% zmian zmiennej y nie zostało wyjaśniona przez linię trendu. 3 Zadanie 8. Średnie liczba wypłaconych odszkodowań z tytułu uszczerbku na zdrowiu przez klasy KRUS w województwie nowosądeckim w poszczególnych kwartałach lat 1996-1999 przedstawiała się następująco: ^^^^^^ Lata Kwartał --—^_ 1996 1997 1998 1999 I 8 9 10 1 1 II 12 16 79 28 III 11 14 1S 20 IV 10 11 12 14 Wyodrębnić trend metodą mechaniczną stosując średnie ruchome 3-okresowe i 4-okresowe. ?r Rozwiązanie. Trendem nazywamy powolne, regularne i systematyczne zmiany określonego zjawiska obserwowane w dostatecznie długim przedziale czasowym będące rezultatem działania tzw. przyczyn głównych. Najprostszą metodą pozwalającą na wyznaczenie trendu, czyli ustalenie kierunku zmian analizowanego zjawiska jest metoda mechaniczna, czyli metoda średnich ruchomych, polegająca na zastąpieniu warto- 76 Analiza dynamiki zjawisk ści empirycznej uśrednieniami uzyskanymi z danej wartości i wartości sąsiednich. Należą przy tym określić długość cyklu uśrednień. Przy parzystej długości cyklu stosujemy tzw. średnią scentrowaną, a przy nieparzystej średnią prostą. Dla k = 3 średnia zastępująca wartość empiryczną ma postać - [55] a dla k = 4 średnie scentrowane wyznaczamy zgodnie z wzorem ]_ 1_ yt-2 + yt-l+yt+yt+1+-yt+2 [56] Interpretując graficznie szereg empiryczny i szeregi wartości uśrednionych możemy zauważyć, że empiryczna linia trendu ulega zdecydowanemu wygładzeniu. W przypadku zaprezentowanego szeregu obrazującego liczbę wypłaconych wartości wygładzone możemy przedstawić w tablicy roboczej: t y, y t (3 okr> y ( (4 okr) 1/96 8 _ 11/96 12 10,33 _ 111/96 11 11,00 10,375 IV/96 10 10,00 11,0 1/97 9 11,66 11,875 11/97 16 13,00 12,375 111/97 14 13,66 12,625 IV/97 1 1 11,66 13,5 1/98 10 14,33 14,75 11/98 22 16,67 15,375 111/98 18 17,33 15,625 IV/98 12 13,67 16,5 1/99 11 17,00 17,5 11/99 28 19,67 18,0 111/99 20 20,66 - IV/99 14 - - W tablicy widoczna jest wada metody mechanicznej, a mianowicie skrócenie szeregu obserwacji o wartości skrajnej. Zaletą natomiast jest zdecydowanie prostota obliczeń i możliwość wykrycia metodą „wzrokową" tendencji zmian zjawiska. W naszym przypadku na podstawie analizy wzrokowej ostatniej kolumny możemy stwierdzić, że liczba wypłaconych odszkodowań, wykazuje tendencję wzrostową. Jest to widoczne również na wykresie. 77 Rozdział III 30 25 20 ¦ dane empiryczne ' ¦ średnie 3 okresowe " A średnie 4 okresowe 1/96 11/96 111/96 IV/96 1/97 11/97 111/97 IV/97 1/98 11/98 111/98 IV/98 1/99 11/99 01/99 IV/99 O Zadanie 9. Poniższe tabela przedstawia kwartalne dochody z akcji akcjonariuszy koncernu Coca-Cola w latach 1995-1996. Ustalić czy wysokość uzyskiwanej dywidendy wykazuje zmiany sezonowe. Ocenić względne i bezwzględne poziomy wahań sezonowych i zinterpretować je. "~~~~--^.^^ Lata Kwarta! " —^____ I II III IV 1995 0,26 0,36 0,46 0,26 1996 0,32 0,42 0,52 0,34 1997 0,35 0,47 0,59 0,36 1998 0,38 0,51 0,66 0,38 1999 0,43 0,57 0,75 0.48 *r Rozwiązanie. Sezonowość jest swoistą nierównomiernością, którą charakteryzują się szeregi czasowe, polegająca na występowaniu cyklicznych odchyleń powtarzających się w tych samych jednostkach kalendarzowych jeśli zostanie zachowana określona długość cyklu podstawowego (np. rok, miesiąc, tydzień). Ustalamy sezonowość za pomocą względnych i absolutnych mierników wahań. Najprostszym sposobem wyodrębnienia wahań sezonowych jest metoda oparta na średnich jednoimiennych podokresów. Wskaźniki sezonowości mają wtedy postać: [57] 78 Analiza dynamiki zjawisk gdzie: S. - wskaźnik sezonowości dla i-tego podokresu; yj - średnia asymetryczna empirycznych wielkości zjawisk w jednoimiennych podokresach; d - liczba podokresów (np. 4 dla kwartałów, 12 dla miesięcy). Suma wskaźników sezonowości Si powinna być równa liczbie podokresów, czyli: Wtedy wskaźniki S. nazywamy oczyszczonymi wskaźnikami sezonowości, a w przypadku gdy relacja równości nie jest spełniona wskaźniki noszą miano surowych wskaźników sezonowości. Wskaźniki surowe poddawane są tzw. oczyszczaniu przez wprowadzenie poprawki korygującej postaci: k = [58] i dalej S. = k • s. gdzie dla oczyszczonych (skorygowanych) wskaźników żądana równość zachodzi. Absolutne poziomy wahań sezonowych dla poszczególnych podokresów wyznaczamy z równości: [59] gdzie: g. - oznaczenie miernika absolutnego; S. - oczyszczone wskaźniki sezonowości; y. - średni poziom badanego zjawiska. Przy czym suma absolutnych poziomów wahań jest równa 0 tzn. W naszym przykładzie obliczenie przedstawiamy w tablicy: 79 Rozdział III Kwartał Lata S ly, i=i y s, 1995 1996 1997 1998 1999 I II III IV 0,26 0,36 0,46 0,26 0,32 0,42 0,52 0,34 0,35 0,47 0,59 0,36 0,38 0,51 0,66 0,38 0,43 0,57 0,75 0,48 1,74 2,33 2,98 1,82 0,348 0,466 0,596 0,364 0,785 1,051 1,344 0,821 1,774 4,001 Suma wskaźników sezonowości przedstawionych w ostatniej kolumnie tablicy nie jest równa 4, zatem zachodzi współczynnik korekty równy: k = 4.001 = 0,99975 i dalej 0S, = 0,99975 • 0,785 = 0,7848; oS„ = 0,99975 • 1,051 = 1,0507; oSIU = 0,99975 ¦ 1,344 = 1,3436; oSlv = 0,99975 ¦ 0,821 = 0,8208 Natomiast absolutne poziomy wahań dla kolejnych kwartałów są równe: g, = 0,4435(0,785 - 1) = -0,0953; g„ = 0,4435(0,051 - 1) = 0,0226; gIM = 0,4435(1,344 - 1) = 0,1526; g|V = 0,4435(0,821 - 1) = -0,0794 Interpretując wskaźniki sezonowości możemy stwierdzić, że: • w pierwszych kwartałach badanego okresu na skutek działania czynników sezonowych następował spadek wartości akcji o 21,5%, w drugich wzrost o 5,1%, w trzecich zdecydowany wzrost o 34,4% i w czwartych spadek o 17,9% w stosunku do przeciętnej wartości akcji w całym okresie; • w jednostkach naturalnych (czyli w $) spadek wartości w pierwszych kwartałach był równy około 0,1$, w drugich wzrost byl przeciętnie równy 0,02$, w trzecich około 0,15$, a w czwartych spadek utrzymywał się na poziomie około 0,08$ w stosunku do poziomu przeciętnego z okresu 1995-1999 wynoszącego 0,44$. 3 Zadanie 10. Według danych działu socjalnego kopalni „Piast" liczba spóźnień do pracy przekraczających 30 minut w kolejnych półroczach lat 1992-1999 liczona w tys. przedstawiała się następująco: 80 Analiza dynamiki zjawisk "-~----^_____^ Rok Półrocze ^~~~~—~-^^ 1992 1993 1994 1995 1996 1997 1998 1999 I 59 40 37 39 42 47 43 57 II 36 37 36 39 43 46 45 49 Źródło: dane umowne Ustalić prognozę liczby spóźnień na kolejne półrocze roku 2000 i 2001 uwzględniając sezonowość zjawiska i błąd prognozy. rr Rozwiązanie. Prognozę wartości zjawiska opracowaną na podstawie wyznaczonej metody najmniejszych kwadratów linii trendu uzyskujemy przez podstawienie do linii teoretycznej bieżącego numeru momentu czasowego (oznaczamy je przez y'y). Należy dodatkowo uzupełnić prognozę o wielkość absolutnego poziomu wahań charakterystycznego dla momentu czasowego na który wyznaczana jest prognoza. Jednocześnie zakładając możliwość występowania wahań przypadkowych w szeregu czasowym dokonujemy ich eliminacji uwzględniając odchylenie standardowe reszt i błąd prognozy zależny od tego odchylenia standardowego. Zapisując kolejne etapy analizy symbolicznie otrzymujemy: • wyznaczamy wartości teoretyczne szeregu y* yt" = a + b • wyznaczamy składniki resztowe dla poszczególnych podokresów z, = y,-y,"-g„ [60] • ustalamy wariancję resztową i na jej podstawie odchylenie standardowe reszt [61] wyznaczamy prognozę a podstawie linii trendu [62] • uzupełniamy prognozę błędami średnimi prognozy i absolutnym wskaźnikiem wahań sezonowych s-.8w.Ll*.*-* n l(T-t)2 [63] 81 Rozdział III Kwartał Lata ty, i=l y s, 1995 1996 1997 1998 1999 I II III IV 0,26 0,36 0,46 0,26 0,32 0,42 0,52 0,34 0,35 0,47 0,59 0,36 0,38 0,51 0,66 0,38 0,43 0,57 0,75 0,48 1,74 2,33 2,98 1,82 0,348 0,466 0,596 0,364 0,785 1,051 1,344 0,821 1,774 4,001 Suma wskaźników sezonowości przedstawionych w ostatniej kolumnie tablicy nie jest równa 4, zatem zachodzi współczynnik korekty równy: k = 4.001 = 0,99975 i dalej 0S, = 0,99975 • 0,785 = 0,7848; oS„ = 0,99975 ¦ 1,051 = 1,0507; oSm = 0,99975 ¦ 1,344 = 1,3436; oSIV = 0,99975 ¦ 0,821 = 0,8208 Natomiast absolutne poziomy wahań dla kolejnych kwartałów są równe: g, = 0,4435(0,785 - 1) = -0,0953; g„ = 0,4435(0,051 - 1) = 0,0226; g,„ = 0,4435(1,344 - 1) = 0,1526; g|V = 0,4435(0,821 - 1) = -0,0794 Interpretując wskaźniki sezonowości możemy stwierdzić, że: • w pierwszych kwartałach badanego okresu na skutek działania czynników sezonowych następował spadek wartości akcji o 21,5%, w drugich wzrost o 5,1%, w trzecich zdecydowany wzrost o 34,4% i w czwartych spadek o 17,9% w stosunku do przeciętnej wartości akcji w całym okresie; • w jednostkach naturalnych (czyli w $) spadek wartości w pierwszych kwartałach był równy około 0,1$, w drugich wzrost był przeciętnie równy 0,02$, w trzecich około 0,15$, a w czwartych spadek utrzymywał się na poziomie około 0,08$ w stosunku do poziomu przeciętnego z okresu 1995-1999 wynoszącego 0,44$. O Zadanie 10. Według danych działu socjalnego kopalni „Piast" liczba spóźnień do pracy przekraczających 30 minut w kolejnych półroczach lat 1992-1999 liczona w tys. przedstawiała się następująco: 80 Analiza dynamiki zjawisk ~"-~--~-^^^ Rok Półrocze -— 1992 1993 1994 1995 1996 1997 1998 1999 I 59 40 37 39 42 47 43 57 II 36 37 36 39 43 46 45 49 Źródło: dane umowne Ustalić prognozę liczby spóźnień na kolejne półrocze roku 2000 i 2001 uwzględniając sezonowość zjawiska i błąd prognozy. ri' Rozwiązanie. Prognozę wartości zjawiska opracowaną na podstawie wyznaczonej metody najmniejszych kwadratów linii trendu uzyskujemy przez podstawienie do linii teoretycznej bieżącego numeru momentu czasowego (oznaczamy je przez y^.). Należy dodatkowo uzupełnić prognozę o wielkość absolutnego poziomu wahań charakterystycznego dla momentu czasowego na który wyznaczana jest prognoza. Jednocześnie zakładając możliwość występowania wahań przypadkowych w szeregu czasowym dokonujemy ich eliminacji uwzględniając odchylenie standardowe reszt i błąd prognozy zależny od tego odchylenia standardowego. Zapisując kolejne etapy analizy symbolicznie otrzymujemy: • wyznaczamy wartości teoretyczne szeregu y* y; = a + b • wyznaczamy składniki resztowe dla poszczególnych podokresów z, = y,-y,'-git [60] • ustalamy wariancję resztową i na jej podstawie odchylenie standardowe reszt [61] wyznaczamy prognozę a podstawie linii trendu [62] • uzupełniamy prognozę błędami średnimi prognozy i absolutnym wskaźnikiem wahań sezonowych 1\2 [63] 81 Rozdział III lub i wtedy Jt — t J_ 3(2T-n-l)2 n n3 -n [64] W naszym przykładzie część obliczeń przedstawiamy w tablicy roboczej: t yt t2 ty, y[ & zl z. 1 59 1 59 38,382 2,093 18,525 344,175 2 36 4 72 39,139 -2,093 -1,046 1,094 3 40 9 120 39,897 2,093 -1,99 3,9601 4 37 16 148 40,654 -2,093 -1,561 2,4367 5 37 25 185 41,412 2,093 -6,505 42,3150 6 36 36 216 42,169 -2,093 -4,076 16,6137 7 39 49 273 42,926 2,093 -6,019 36,228 8 39 64 312 43,684 -2,093 -2,591 6,7133 9 42 81 378 44,441 2,093 -4,534 20,5572 10 43 100 430 45,199 -2,093 -0,106 0,0112 1 1 47 121 517 45,956 2,093 -1,049 1,1004 12 46 144 552 46,713 -2,093 1,38 1,9044 13 43 169 559 47,471 2,093 -6,564 43,087 14 45 196 630 48,228 -2,093 -1,135 1,2882 15 57 225 855 48,986 2,093 5,921 35,058 16 59 256 944 49,743 -2,093 11,35 128,825 136 705 1496 6250 X X X 684,365 t= 8,5 y = 44,0625 b = 44,0625 - 0,7574 ¦ 8,5 = 37,6246 16-6250-136-705 100000-95880 a = 16-1496-(l36y 23936-18496 yt = 0,7574 ¦ t + 37,6246 4120 5440 = 0,7574 Wskaźniki względne sezonowości wyznaczamy w oparciu o jednoimienne średnie podokresów.' 1 Sobczyk: Statystyka. Podstawy teoretyczne. Przykłady - zadania. Wyd. UMCS, Lublin 18, s. 325. 82 Analiza dynamiki zjawisk S, =¦ ¦ 2 _ 45,5 ¦ 2 ~ 86,875 = 1,0475 86,875 S, + S„ = 1,0475 + 0,9525 = 2 czyli wskaźniki S, i S„ nie wymagają korekty i na ich podstawie możemy wyznaczyć absolutne poziomu wahań g g, = y(S, - 4) = 44,0625(1,0475 - 1) = 2,0930 g„ = y(S„ - 4) = 44,0625(0,9525 - 1) = -2,0930 i dalej 684,365 16,2 = 48,883 S(zt) = 6,99 Sprawdzając współczynnik zmienności przypadkowej stwierdzamy, że odchylenia przypadkowe stanowią ok. 15,87% przeciętnego poziomu zaobserwowanej zmiennej. Prognozy liczby spóźnień na kolejne półrocze (z uwzględnieniem błędu średniego) będą równe odpowiednio: • I półrocze 2000 r. T= 17 yf7 a 0,7574 • 17 + 37,6246 + 2,093 ± Sf7 = 52,593 ± 7,893 gdzie: Sf7=6,99-1/l + ^ + - 340 = 6,99 • = 7,893 II półrocze 2000 r. T= 18 83 Rozdział III yfg =0,7574 -18 + 37,6246 -2,093 ±S,P8 = 53,350 ± 8,055 gdzie: ST,- • I półrocze 2001 r. T= 19 gdzie: yf9 = 54,108 ±8,231 II półrocze 2001 r. T = 20 =54,865 + 8,421 gdzie: 84 Zadania do samodzielnego rozwiązywania Zadanie 1. Maksymalny poziom wody na Wiśle pod Krakowem 1977-1987 przedstawia szereg czasowy: Rok 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 Max poziom (cm) 110 178 185 224 348 221 124 124 220 158 115 Źródło: dane umowne Obliczyć średni maksymalny poziom wody w Wiśle oraz jego zróżnicowania w latach 1977-1987. L> Zadanie 2. Wielkość produkcji wody mineralnej w wybranej rozlewni wód gazowanych przedstawia tablica. Rok 1991 1992 1993 1994 1995 Produkcja w tys. litrów 14,2 16,0 16,2 16,6 15,0 Źródło: dane umowne a) wykorzystując odpowiednie miary dynamiki ustalić jej poziom w kolejnych latach; b) o ile wzrasta produkcja wody mineralnej w 1995r. porównaniu z 1991, a o ile w porównaniu z 1993 r.? c) jakie było średnioroczne tempo wzrostu produkcji w wyróżnionym okresie 1991-1995, a jakie w okresie 1992-1995? d) Zakładając takie same tempo zmian, określić spodziewany poziom produkcji wody mineralnej w 1996 roku biorąc za podstawę odpowiednio okres 1991-1995 i 1992-1995. 85 Rozdział III Zadanie 3. Kolejno dla lat 1986-1990 liczba kin w Polsce przedstawiała się następująco: Lata 1986 1987 1988 1989 1990 Liczba kin 2 041 2010 1 878 I 792 1 589 Źródło: dane umowne Oblicz i skomentuj średnie roczne tempo spadku tego zjawiska w badanych latach. Zakładając niezmienniczy charakter tego zjawiska oblicz przewidywaną liczbę kin w Polsce w 1992 roku. L* Zadanie 4. Na podstawie danych z tabeli ustalić średnioookresowe tempo zmian liczby zarejestrowanych samochodów w latach 1986-1990. Lata 1986 1987 1988 1989 1990 Liczba samochodów 3900 4168 4452 4767 5186 Źródło: dane umowne Zakładając niezmienny poziom zjawiska w latach następnych obliczyć przewidywaną liczbą samochodów w roku 1993. L* Zadanie 5. Dynamika dostaw do sklepów w mieście X ekspresów do kawy w latach 1987-1990 mierzona indeksami jednopodstawowymi (rok 1986 = 100%) kształtowała się następująco: 104%, 117%, 135%, 154%. Obliczyć indeksy łańcuchowe dostaw oraz wyznaczyć średniookresowe tempo zmian sprzedaży ekspresów do kawy w badanym okresie. L> Zadanie 6. Średnioroczne tempo produkcji lodówek w pewnym zakładzie wynosiło w latach 1989-1991 4%. Wyznaczyć wielkość produkcji lodówek w roku 1992, jeżeli wiadomo, że w 1990 roku zakład produkował 10 tys. sztuk lodówek. Zadanie 7. Biuro turystyki promowej zaproponowało w ofercie świąteczno-noworocznej 2001 rejsy do Helsinek, Kopenhagi i Oslo. Zyski ze sprzedaży ofert za wyjazdy świąteczne wynosiły odpowiednio: do Oslo 20 tyś zł., do Kopenhagi 30 tys. zł a do Helsinek 40 tys. zł . Wyjazdy noworoczne przyniosły wzrost obrotów za wyjazd do Helsinek o 15% i do Oslo o 10% oraz spadek za wyjazdy do Kopenhagi o 8%. Jednocześnie ceny rejsów do Oslo pozostały bez zmian, do Kopenhagi wzrosły o 20% a do Helsinek zmalały o 10%. Jak możemy ocenić zyski za rejsy noworocz- 86 Zadania do samodzielnego rozwiązywania ne w porównaniu z rejsami świątecznymi i co w silniejszym stopniu wpływa na ich zmiany cena czy ilość sprzedanych wycieczek Zadanie 12. W 1989 roku sprzedano w pewnym mieście M jabłek za 120 min zł i gruszek za 60 min zł, a w 1991 roku sprzedano jabłek za 160 min zł oraz gruszek za 70 min zł. Wiadomo, że ceny jabłek wzrosły o 30%, a ceny gruszek spadły o 10% w roku 1991 w stosunku do roku 1989. Scharakteryzować średni ruch cen badanych owoców oraz zmiany masy fizycznej ich spożycia w mieście M, stosując do tego celu możliwie wszechstronnie formuły standaryzacyjne indeksów agreagatowych. 87 Rozdział III Który czynnik - cena czy ilość - silniej wpłynął na łączną dynamikę wartości sprzedaży tych owoców? Zadanie 13. Wartość produkcji i zmiany cen dwóch artykułów przedstawia tablica. Artykuły Wartość produkcyjni w tys. zł (ceny bieżące) Zmiany cen rowu 1971 do roku 1970 1971 1971 A B 200 400 190 450 spadek o 5% spadek o 10% Źródło: dane umowne Przeprowadzić możliwie najszerszą analizę indeksów cen, ilości i wartości. L* Zadanie 14. Badając dynamikę sprzedaży nowej hurtowni w I i II kwartale 1993r. ustalono, że indeks ilości formuły Paaschego wynosił 110% wartość sprzedaży w I kwartale 121 min zł, a pozostałe informacje były następujące: Artykuł loPn V A B C 25 55 ? 1,25 1,10 1,00 Jaki był wzrost wartości sprzedaży w II kwartale w porównaniu z I kwartałem oraz wpływ dynamiki ilości i cen na zmianę wartości sprzedaży? 4a Zadanie 15. Produkcja piwa w jednym z browarów kształtowała się w kolejnych kwartałach lat 1993-1995 następująco: Lata Kwartały I II III IV 1993 2 4 8 6 1994 3 5 I 1 7 1995 5 7 12 8 Źródło: dane umowne Na podstawie danych wyznaczyć linię trendu oraz zbadać sezonowość zjawiska. Zadanie 16. W zakładach przetwórstwa mięsno-wędliniarskiego prowadzono badanie po- 88 Zadania do samodzielnego rozwiązywania pytu na oferowane nowe gatunki wędlin. Badaniem objęto okres od 01.01.1993 do 31.12.1997 r. Okazało się, że popyt kształtował się zgodnie z równaniem: y = 0,85t + 1,27. Jednocześnie wyznaczono surowe wskaźniki sezonowości równe odpowiednio dla kolejnych kwartałów: c, = 0,76; c2 = 0,94; c3 = 1,20; c4 = 1,23. Wykorzystując te informacje określić spodziewany poziom popytu na wędliny III kwartale 1998 roku i w I kwartale 1999 roku. L¦ Zadanie 17. W zakładach przetwórstwa owocowo-warzywnego przeprowadzono badanie popytu na oferowane dżemy owocowe. Badaniem objęto okres od 01.01.1993 do 31.12.1997. Okazało się, że popyt kształtował się zgodnie z równaniem: y = 0,96t + 1,43. Jednocześnie wyznaczono surowe wskaźniki sezonowości równe odpowiednio dla kolejnych kwartałów: c, = 0,76; c2 = 0,94: c3 = 1,35; c4 = 1,11. Wykorzystując te informacje określić spodziewany poziom popytu na dżemy III kwartale 1998 i w I kwartale 1999 roku. Lj Zadanie 18. Dysponując danymi dotyczącymi całkowitych aktywów pewnego banku komercyjnego za osiem miesięcy ustalić na podstawie linii trendu prognozę ich poziomu na dwa kolejne miesiące i dokonać oceny jakości tej prognozy. Szereg empiryczny ma następującą postać: 276, 284, 334, 352, 386, 441, 386, 440. Zadanie 19. Spożycie masła w statystycznej 4-ro osobowej rodzinie konsumenckiej w ciągu wybranych 10 tygodni było równe: 2, 3, 4, 3, 2, 5, 3, 4, 6, 4. Wyznaczyć linię trendu spożycia masła w rodzinach czteroosobowych oraz ocenić dokładność oszacowania. Jaki poziom spożycia osiągnie rodzina za dwa następne tygodnie? Czy będzie on się różnił od spodziewanego poziomu wyznaczonego na podstawie dziewięciu ostatnich tygodni przeprowadzonego badania? iLj Zadanie 20. Poniższe dane opisują liczbę czytelników regionalnej gazety (w tys.) za okres ostatnich dwunastu lat: Rok 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 Liczba czyt. 53 65 74 85 92 105 120 128 144 158 179 195 Źródło: dane umowne. Przeprowadzić analizę trendu i wyznaczyć prognozę liczby czytelników na lata 2003 i 2004. 89 Rozdział III Który czynnik - cena czy ilość - silniej wpłynął na łączną dynamikę wartości sprzedaży tych owoców? L¦ Zadanie 13. Wartość produkcji i zmiany cen dwóch artykułów przedstawia tablica. Artykuły Wartość produkcyjni w tys. zł (ceny bieżące) Zmiany cen rowu 1971 do roku 1970 1971 1971 A B 200 400 190 450 spadek o 5% spadek o 10% Źródło: dane umowne Przeprowadzić możliwie najszerszą analizę indeksów cen, ilości i wartości. L> Zadanie 14. Badając dynamikę sprzedaży nowej hurtowni w I i II kwartale 1993r. ustalono, że indeks ilości formuły Paaschego wynosił 110% wartość sprzedaży w I kwartale 121 min zł, a pozostałe informacje były następujące: Artykuł <ŁP„ V A B C 25 55 ? 1,25 1,10 1,00 Jaki był wzrost wartości sprzedaży w II kwartale w porównaniu z I kwartałem oraz wpływ dynamiki ilości i cen na zmianę wartości sprzedaży? L> Zadanie 15. Produkcja piwa w jednym z browarów kształtowała się w kolejnych kwartałach lat 1993-1995 następująco: Lata Kwartały I II III IV 1993 2 4 8 6 1994 3 5 11 :,' 7 1995 5 7 12 8 Źródło: dane umowne Na podstawie danych wyznaczyć linię trendu oraz zbadać sezonowość zjawiska. Zadanie 16. W zakładach przetwórstwa mięsno-wędliniarskiego prowadzono badanie po- 88 Zadania do samodzielnego rozwiązywania pytu na oferowane nowe gatunki wędlin. Badaniem objęto okres od 01.01.1993 do 31.12.1997 r. Okazało się, że popyt kształtował się zgodnie z równaniem: y = 0,85t + 1,27, Jednocześnie wyznaczono surowe wskaźniki sezonowości równe odpowiednio dla kolejnych kwartałów: c, = 0,76; c2 = 0,94; c3 = 1,20; c, = 1,23. Wykorzystując te informacje określić spodziewany poziom popytu na wędliny III kwartale 1998 roku i w I kwartale 1999 roku. .19; /,/,, = 16,59; 17 yiii/9S = !-298 (0.96 ¦ 23 + 1,43) = 30,5159; y,"/99 = 0,7307 (0,96 • 25 + 1,43) =18,5817; 18. yt = 23,964t + 254,5367; cp2 = 0,1336; y\ - 470,2127; y;o = 494,1767. 91 Rozdział IV Wybrane zagadnienia statystyki matematycznej 0 Zadanie 1. Towarzystwo ubezpieczeniowe Al-Impo zamierza oszacować przeciętny wiek wychowawczyni w przedszkolach społecznych zainteresowanych nabyciem dodatkowej polisy ubezpieczeniowej OC zabezpieczające przed odpowiedzialnością za wypadki spowodowane przez dzieci grupy wiekowej 3-6 lat pozostawione pod ich opieką. Wybrano losowo 81 kobiet spełniających warunki pracy w przedszkolu 1 zainteresowanych nabyciem polisy i ustalono ich średni wiek 27 lat z odchyleniem standardowym 5 lat. Zakładając, że rozkład wieku jest normalny N(m,a) określić z prawdopodobieństwem 0,95 przedział ufności przeciętnego wieku wychowawczyni przedszkoli zainteresowanych dodatkową polisę OC. Czy ulegnie on zmianie, gdy zakładane prawdopodobieństwo zwiększymy do 0,98? Określić względny błąd oszacowania w każdym z przypadków. *r Rozwiązanie. Rozwiązanie zadania wymaga zastosowania metod obliczeniowych z zakresu teorii wnioskowania statystycznego, a dokładniej z zakresu teorii estymacji. Polega ono na wyznaczeniu z zakładanym prawdopodobieństwem przedziału do którego należy analizowany parametr. Konstrukcja takiego parametrów do szacowania przedziałów dla całej populacji i założeniu o normalności lub zbieżności do normalności rozkładów analizowanych parametrów. Jednocześnie dla potrzeb tego skryptu będziemy korzystać z założenia, że próba losowa wybrana z populacji ma liczebność n > 30 i uważana jest za tzw. „dużą próbę losową", co upoważnia do korzystania w rozważaniach z teorii wnioskowania z wartości dystrybuant rozkładu normalnego. Przedział ufności, który interesuje nas dla potrzeb tego zadania ma postać: 1 Szersze rozważania teoretyczne z zakresu rachunku prawdopodobieństwa pomijamy, odsyłając czytelnika np. do podręcznika M. Sobczyka. 92 Wybrane zagadnienia statystyki matematycznej [65] gdzie oznaczenia są następujące: x, S - wartość średnia i odchylenie standardowe wyznaczone z n-elementowej próby losowej wybranej z populacji; ua - wartość krytyczna (dokładniej dystrybuanta zmiennej losowej) wybrana z tablic rozkładu normalnego N(0,l) w naszym przypadku jedna z wartości; y - poziom ufności parametru, czyli założony poziom prawdopodobieństwa (np. 0,9; 0,95;, 0,98; 0,99); a = 1 - y - poziom istotności, czyli możliwość popełnienia błędu statystycznego I rodzaju w przypadku weryfikacji pewnych hipotez statystycznych; n - liczebność losowej próby statystycznej wybranej z populacji; m - nieznane (szacowane) wartość średnia. Odpowiednie wartości liczbowe niezbędne do ustalenia poszukiwanego przedziału ufności dla wieku są równe: x = 27; n = 81; a = 0,05; S = 5; y = 0,95; ua = 1,96. Stąd przedział ma postać 27 - 1,96-L < m < 27 + 1,9 V81 = 0,95 i dalej P{27 - 1,09 < m < 27 + 1,09} = 0,95 P {25,91 < m < 28,09} = 0,95 czyli interpretując powyższy wynik możemy stwierdzić, że z prawdopodobieństwem równym 0m95 nieznana wartość średnia wieku wychowawczyń przedszkoli zainteresowanych nabyciem dodatkowej polisy OC mieści się w przedziale (25,91; 28,09) lat. Zmiana zakładanego prawdopodobieństwa z 0,95 na 0,98 spowoduje zmiany granic przedziału ufności, gdyż ulegnie zmianie wartość krytyczna ua z 1,96 na 2,33. Nowa postać przedziału jest następująca: ?\ 27 - 2,3 3 -y= < m< 27 + 2,3 3 -p= 781 781 = 0,98 i dalej 93 Rozdział IV P{27 - 1,3 < m < 27 + 1,3} = 0,98 P{25,7 < m < 28,3} = 0,98 czyli z prawdopodobieństwem 0,98 nieznana wartość średnia wieku przedszkolanek należy do przedziału (25,7; 28,3) lat. Warto dodatkowo ustalić błąd szacunku, który jest ilorazem błędu absolutnego i wartości parametru. Oznaczamy go: ^4 xvn [66] lub inaczej B(x) = -^ x gdzie licznik nazywany jest błędem absolutnym oszacowań. W przypadku y = 0,05 błąd jest równy: oraz dla y = 0,98 100% = 0,040329 ¦ 100% = 4,03% B(x) = 2'33 ił 100% = 4,79% 27-78Y W obydwu przypadkach błąd względny nie przekracza 5%, co oznacza dobrą precyzję oszacowania. S Zadanie 2. Władze uczelni ekonomicznej rozważały zainteresowanie studentów możliwością podjęcia studiów na drugim kierunku, w ramach tej samej uczelni. Aby ocenić odsetek studentów zainteresowanych możliwością uzyskania drugiego dyplomu przeprowadzono badanie, w trakcie którego zapytano 300 losowo wybranych osób o zainteresowanie dodatkowymi studiami. 120 osób podało odpowiedź twierdzącą. Ocenić z prawdopodobieństwem 0,9 odsetek studentów pragnących studiować dwa kierunki w ramach jednej uczelni. Ocenić błąd względny oszacowania. 94 Wybrane zagadnienia statystyki matematycznej *r Rozwiązanie. Postać przedziału ufności, który mamy w poleceniu zadania oszacować jest inna niż w poprzednim przypadku, gdyż szacowanym parametrem jest nie wartość średnia, lecz wskaźnik struktury. Możemy ją zapisać następująco: m m( m n V n m -----u„ |mf m ni n = Y [67] gdzie odpowiednio: n - liczebność próby losowej; m - liczba jednostek statystycznych w próbie spełniającej żądany warunek; y - poziom ufności; ua - wartość krytyczna (jak w zadaniu poprzednim); p - nieznana wartość wskaźnika struktury. Błąd względny oblicza się zgodnie z wzorem B(p) = lub w wersji przekształconej mfl_m ni n m n ¦100% [68] B(p) = ua — •100%-u. m •100% W naszym przypadku otrzymujemy dla n = 300, m = 120 i y = 0,90 przedział postaci: 1120f 120 120 irJ300^ 300 J 120 -------1,641---------------- [69] gdzie odpowiednio: ua - wartość krytyczna; - wariancja; a S2 d - poziom dopuszczalnego błędu Zapisujemy to formalnie następująco- n> ¦ = 34,57 » 35 Zaokrąglenie do wartości całkowitej nodaip ci* du na cyfry znaczące po przecinku w^wTznaTzońtmT' ^f™™ bez ^ wyznaczonym ilorazie. Interpretując wynik 96 Wybrane zagadnienia statystyki matematycznej stwierdzimy, że aby ocenić średni wzrost noworodka płci żeńskiej z dokładnością do 1 cm przyjmując poziom ufności 0,95 wystarczy dysponować próbą losową złożoną z 35 dziewczynek. 0 Zadanie 4. Jak liczną próbę losową należy przyjąć w badaniu poparcie dla kandydata A w wyborach na członka Rady Osiedlowej, jeśli w prawyborach poparło go 35% mieszkańców osiedla. Zakładany przy tym poziom ufności jest równy 0,90 1 dopuszczalny błąd statystyczny to 3%. sr Rozwiązanie. Zależność określająca minimalną liczebność próby przy szacowaniu wskaźnika struktury jest następująca: n> [70] gdzie odpowiednio: p - zakładany na podstawie próby wstępnej poziom wskaźnika struktury; ua - wartość krytyczna; - dopuszczalny poziom błędu. Mamy zat. m liczebność próby równą: n> 1,642-0,35-0,65 = 679,87*680 osób czyli stwierdzamy, że próba powinna być dosyć liczna i liczyć 680 osób. O Zadanie 5. Ilu szóstoklasistów należy wylosować do próby, aby z błędem nie przekraczającym 10% oszacować odsetek dzieci, które zdadzą końcowy test egzaminacyjny w szkole podstawowej z wynikiem co najmniej dobrym (czyli uzyskają powyżej 75% ogólnej liczby punktów) przy założonym poziomie ufności 0,95). $" Rozwiązanie. Nie znamy wstępnej oceny wskaźnika struktury, zatem przy szacowaniu liczebności próby wykorzystujemy uproszczoną postać zależności podanej w zadaniu poprzednim zakładając, że wskaźnik p = — . Zależność ma postać: 4d2 [71] 97 Rozdział IV Dla naszych potrzeb, gdy ua = 1,96 i d = 0,1 mamy n> 1,962 3,8416 = 96,04 « 97 dzieci 4(0,l)2 4-0,01 oznacza to, że do próby należy wylosować 97 dzieci. O Zadanie 6. Wśród pacjentów leczonych na pewną chorobę wylosowano w sposób niezależny próbę 49 osób i ustalono ich średnie ciśnienie tętnicze krwi równe 135 mmHg przy odchyleniu standardowym równym 45 mmHg. Na poziomie istotności a = 0,05 zweryfikować hipotezy, że: a) pacjenci leczeni na określoną chorobę pochodzą z populacji osób o ciśnieniu tętniczym równym 120 mmHg, b) ciśnienie pacjentów leczonych na określoną chorobę nie przekracza 140 mmHg, c) ciśnienie pacjentów jest co najmniej równe 120 mmHg. W Rozwiązanie. Rozwiązanie zadania polega na zweryfikowaniu przy przyjętym poziomie istotności2 hipotezy parametrycznej o równej pewnemu założeniu poziomowi wartości wybranego parametru statystycznego (tutaj jest nim wartość średnia m). Formalnie weryfikacja hipotezy statystycznej polega na określeniu hipotezy zerowej Ho (zawsze zakładającej, że parametr przyjmuje określoną wartość) i hipotezy alternatywnej Hl - zakładającej przeciwnie do założeń w Ho zachowanie badanego parametru. Postać hipotezy H, określa się precyzyjnie w powiązaniu z treścią zadania. Niezbędna jest przy tym znajomość poziomu dopuszczalnego błędu statystycznego (poziomu istotności a) i związanego z nim obszaru krytycznego. W naszych uproszczonych rozważaniach obszar krytyczny będą wyznaczać dys-trybuanty zmiennej losowej o rozkładzie normalnym N (0,1) i wybrano na ich podstawie wartości krytyczne. Będą to przedziały postaci: (-oo, — ua)u(ua, + oo) lub (u2a, + c0) lub (rco,-u2a) • Do obszarów krytycznych będziemy odnosić (w pewnym sensie przymierzać) wartości tzw. statystyk empirycznych wyznaczonych dla potrzeb weryfikacji konkretnej hipotezy. Przynależność statystyki empirycznej tcm do obszaru krytycznego upoważnia do odrzucenia hipotezy zerowej Ho na korzyść hipotezy alternatywnej, natomiast sytuacja przeciwna - gdy temp jest poza obszarem krytycznym oznacza brak podstaw do odrzucenia Ho. W przypadku naszego zadania w kolejnych podpunktach mamy odpowiednio: a) hipoteza zerowa Ho zakłada, że średnie ciśnienie jest równa 135, czyli H() : m = m() = 120 przy alternatywnej H, : m * m0 = 120 SobczvkM. (1998). 98 Wybrane zagadnienia statystyki matematycznej obszar krytyczny dla a = 0,05 jest postaci (- oo, -1,96) u (1,96, + oo) a statystyka empiryczna wyznaczana jest zgodnie z wzorem t =------ emp s [72] gdzie odpowiednio: x, S - średnia i odchylenie wyznaczone z próby; m0 - sprawdzony poziom parametru; n - liczebność próby wstępnej. Zatem otrzymujemy statystykę empiryczną równą: emp 135-120 45 V49= — -7 = 2,33 45 Porównując wartość tem z obszarem krytycznym możemy stwierdzić, że 2,33 € (-oo,-l,96)u(l.96, + oo), czyli przyjmując poziom dopuszczalnego błędu statystycznego 5% (zakładając, że możemy pomylić się 5 razy na 100 wniosków odrzucamy hipotezę Ho zakładającą, że rozważana grupa chorych pochodzi z populacji osób o ciśnieniu tętniczym równym 120 mmHg. b) formułujemy odpowiednio hipotezy H(), H, obszar krytyczny i statystykę empiryczną oraz weryfikujemy hipotezę: Ho : m = 140, H, : m < 140 (gdyż pytanie w zadaniu dotyczyło poziomu parametru m mniejszego niż 140), obszar krytyczny (tzw. lewostronny przy H, z nierównością typu „<" ma postać (-oo,-u2a) = (-00,-1,64) a statystyka empiryczna jest równa 135-140 140 V49 = — • 7 = -0,7777 45 i nie należy do obszaru krytycznego, czyli nie mamy podstaw do odrzucenia hipotezy Ho. W odpowiedzi na pytanie zadania musimy stwierdzić, że średnie ciśnienie pacjentów nie przekracza 140 mmHg przy założonym poziomie istotności nie jest prawdziwe, c) Odpowiednio analogicznie jak poprzednio: Ho : m = 120, H, : m > 120 (prawostronny obszar krytyczny, bo pytanie w zadaniu możemy zapisać za pomocą nierówności „>"), obszar krytyczny (u2cc, + oo)=(l,64;+oo) i statystyka empiryczna 99 Rozdział IV Wniosek z obliczeń można sformułować następująco - odrzucając hipotezę Ho przy poziomie istotności 0,05 stwierdzamy, że pacjenci leczeni na określoną chorobę należą do populacji osób których ciśnienie tętnicze przekracza 120 mmHg. 3 Zadanie 7 Badając wiek czytelników wypożyczających książki w bibliotece miejskiej wysunięto hipotezę, że osoby w wieku ponad 50 lat stanowią ponad 40% ogółu czytelników. Dla zweryfikowania tej hipotezy wybrano próbę losową złożoną ze 150 osób i zasięgnięto informacji o ich wieku. Wyniki badania były następujące: Wiek w latach poniżej 15 lat 15-20 20-30 30-40 40-50 50-60 60-70 powyżej 70 lat Ilość czytelników 20 30 20 10 20 30 14 6 Źródto: dane umowne a) Na poziomie istotności a = 0,01 zweryfikować prawdziwość sformułowanej hipotezy, b) Zweryfikować hipotezę, że połowa osób nie przekroczyła 30 lat przyjmując poziom istotności a = 0,02, c) Czy myląc się nie więcej niż 5 razy na lOOwnioskówmożemystwierdzić, że dzieci i młodzież (poniżej 20 lat) stanowią mniej niż 1/3 ogółu czytelników? r Rozwiązanie. Zadanie wymaga zweryfikowania trzech odrębnych hipotez statystycznych dla wskaźnika struktury. W każdym przypadku hipoteza zerowa Ho przyjmować będzie postać równości, a hipotezy alternatywne H, nierówności typu większości lub mniejszości lub zaprzeczenia. Testowa statystyka empiryczna wyznaczana będzie zgodnie z równością 'emp m 7~Po V PoO-Po) [73] gdzie odpowiednio: p() - zakładany poziom wskaźnika; n - liczebność próby; m - liczba jednostek próby spełniających żądany warunek. Zależność statystyki empirycznej temp od obszaru krytycznego wpływa na odrzucenie lub przyjęcie hipotezy Ho a) z treści zadania wynika, że n = 150, m = 50, a = 0,01, p = 0,4. Zatem Ho : P = Po = 0,4; H, : p > 0,4 100 Wybrane zagadnienia statystyki matematycznej obszar krytyczny jest obszarem prawostronnym postaci (u2a, + oo)=(2,33; a statystyka testowa jest równa m -----Po -*-0,4 -i5O-------—1,666 statystyka testowa nie wpada do obszaru krytycznego, czyli stwierdzamy brak podstaw do odrzucenia hipotezy zerowej, zatem twierdzenie, że ponad 40% czytelników to osoby które przekroczyły 50 lat życia nie jest słuszna. b) Mamy dane informacje, że n = 150, m = 70, a = 0,02, p() = 0,5. Przeprowadzamy kolejne etapy wnioskowania statystycznego: Ho : p = Po = 0,5, H, :p*po = O,5, obszar krytyczny ma postać ^-oo,-ua/u(ua, + ooj, czyli (-oo,-2,33)u(-2,33, + °o) m ____n_ -Po 70 150 -0,5 Pofl-Po) = -0,816 t ^ do obszaru krytycznego, czyli stwierdzamy brak podstaw do odrzucenia hipotezy zerowej. Zatem przyjmując możliwość popełnienia 2% błędu statystycznego możemy twierdzić, że połowa czytelników nie przekroczyła 30 roku życia, c) Mamy odpowiednio: n = 150, m = 50, p() = 1/3, a = 0,05. Ho : p = 1/3, H, : p < 1/3, obszar lewostronny postaci (- °o, - ua) = (- co, -1,64}, statystyka empiryczna jest równa 50 1 150 Stwierdzamy, że t nie należy do obszaru krytycznego, czyli brak podstaw do odrzucenia hipotezy zerowej, więc stwierdzenie, że mniej niż 1/3 czytelników to dzieci i młodzież nie jest prawdziwe. 101 Zadania do samodzielnego rozwiązywania L3 Zadanie 1. W pewnym eksperymencie chemicznych bada się czas zakończenia pewnej reakcji. Dokonano 100 niezależnych prób i otrzymano na tej podstawie średnią czasu trwania eksperymentu = 50 sekund oraz odchylenie standardowe s = 15 sekund. Przyjmując współczynnik ufności 0,99 oszacować metodą przedziałową średni czas potrzebny w tym doświadczeniu na całkowite zakończenie reakcji. Ocenić precyzję oszacowania. Ls Zadanie 2. Dla wylosowanej próby 80 klientów sklepu mięsno-wędliniarskiego otrzymano następujący rozkład wg wartości dokonanych zakupów. Wartość zakupów 0-15 15-30 30-45 45-60 60-75 75-90 Ilość klientów 5 10 32 20 8 5 Źródło: dane umowne Ustalić metodą przedziałową średni poziom wydatków na artykuły mięsno-wędliniarskie w wybranym sklepie mięsno-wędliniarskim przyjmując poziom ufności 0,9. Ocenić precyzję oszacowania. L• Zadanie 3. Okresowe badania lekarskie przeprowadzone wśród dziennikarzy dwóch regionalnych gazet dotyczyły między innymi ilości wypalonych przez nich dziennie papierosów. Dla dziennikarzy gazety „G. W." dane przedstawia tablica: Ilość papierosów 0-10 10-20 20-30 30-40 40-50 Ilość dziennikarzy 15 35 70 20 10 Źródło: dane umowne 102 Zadania do samodzielnego rozwiązywania Natomiast dla 100 dziennikarzy gazety "W.Z." ustalono, że średnia liczba wypalonych przez nich papierosów wynosi 28 przy odchyleniu standardowym 7 sztuk. Ustalić przedziały ufności dla średniej liczby wypalonych dzienne papierosów przez dziennikarzy każdej z gazet odrębnie oraz przedział ufności dla średniej liczby wypalonych papierosów dla dziennikarzy obydwu gazet łącznie. Porównać uzyskane wyniki przyjmując w prowadzonych analizach poziom ufności 0,95. ;L> Zadanie 4. Spośród studentów akademii ekonomicznych wylosowano niezależne do próby 300 osób i zapytano ich, czy palą papierosy. Do systematycznego palenia papierosów przyznało się 228 osób. Na tej podstawie przyjmując poziom ufności 0,90 ocenić metodą przedziałową odsetek studentów uczelni ekonomicznych palących papierosy. /Li Zadanie 5. Spośród skrzynek magazynowanej broni strzeleckiej wylosowano do kontroli niezależnie 300 skrzynek. Po ich otwarciu okazało się, że 18 skrzynek zawiera broń z obecnością rdzy na sprzęcie. Przyjmując współczynnik ufności 0,99 oszacować odsetek magazynowanych skrzynek z bronią dotkniętą procesem korozyjnym. L• Zadanie 6. Należy oszacować odsetek zakładów produkcyjnych pewnego resortu, które w 2002 roku zapłaciły kary umowne za nieprzestrzeganie rygorów ochrony środowiska. W tym celu wylosowano 400 zakładów i okazało się, że 320 spośród nich zapłaciło w 2002 roku stosowane kary umowne za zanieczyszczanie środowiska. Na tej podstawie ocenić metodą przedziałową frakcję zakładów w analizowanym resorcie płacących stosowne kary umowne. L* Zadanie 7. W wyniku badania religijności Polaków przeprowadzonego przez GUS w 1991 roku na losowo wybranej próbie 5032 dorosłych osób, 2637 respondentów stwierdziło, że systematycznie uczestniczy w praktykach religijnych. Przyjmując poziom ufności 0,98 oszacować odsetek dorosłych Polaków uczestniczących w praktykach religijnych okazjonalnie (czyli niesystematycznie) lub nie uczestniczących w ogóle. Zbadać precyzję oszacowania. Ocenić przy poziomie ufności 0,95 odsetek dorosłych Polaków uczestniczących systematycznie w praktykach religijnych i podać błąd względny szacunku. Zadanie 8. Ile mieszkań na osiedlu "Zaspa" w Krakowie należy wylosować niezależnie do próby, aby oszacować średnie dobowe zużycie gazu ziemnego przypadające na jedno mieszkanie jeśli na podstawie 50 elementowej próby następnej wariancja 103 Zadania do samodzielnego rozwiązywania /L> Zadanie 1. W pewnym eksperymencie chemicznych bada się czas zakończenia pewnej reakcji. Dokonano 100 niezależnych prób i otrzymano na tej podstawie średnią czasu trwania eksperymentu = 50 sekund oraz odchylenie standardowe s = 15 sekund. Przyjmując współczynnik ufności 0,99 oszacować metodą przedziałową średni czas potrzebny w tym doświadczeniu na całkowite zakończenie reakcji. Ocenić precyzję oszacowania. & Zadanie 2. Dla wylosowanej próby 80 klientów sklepu mięsno-wędliniarskiego otrzymano następujący rozkład wg wartości dokonanych zakupów. Wartość zakupów 0-15 15-30 30-45 45-60 60-75 75-90 Ilość klientów 5 10 32 20 8 5 Źródło: dane umowne Ustalić metodą przedziałową średni poziom wydatków na artykuły mięsno-wędliniarskie w wybranym sklepie mięsno-wędliniarskim przyjmując poziom ufności 0,9. Ocenić precyzję oszacowania. L-1 Zadanie 3. Okresowe badania lekarskie przeprowadzone wśród dziennikarzy dwóch regionalnych gazet dotyczyły między innymi ilości wypalonych przez nich dziennie papierosów. Dla dziennikarzy gazety „G. W." dane przedstawia tablica: Ilość papierosów 0-10 10-20 20-30 30-40 40-50 Ilość dziennikarzy 15 35 70 20 10 Źródto: dane umowne 102 Zadania do samodzielnego rozwiązywania Natomiast dla 100 dziennikarzy gazety "W.Z." ustalono, że średnia liczba wypalonych przez nich papierosów wynosi 28 przy odchyleniu standardowym 7 sztuk. Ustalić przedziały ufności dla średniej liczby wypalonych dzienne papierosów przez dziennikarzy każdej z gazet odrębnie oraz przedział ufności dla średniej liczby wypalonych papierosów dla dziennikarzy obydwu gazet łącznie. Porównać uzyskane wyniki przyjmując w prowadzonych analizach poziom ufności 0,95. L¦ Zadanie 4. Spośród studentów akademii ekonomicznych wylosowano niezależne do próby 300 osób i zapytano ich, czy palą papierosy. Do systematycznego palenia papierosów przyznało się 228 osób. Na tej podstawie przyjmując poziom ufności 0,90 ocenić metodą przedziałową odsetek studentów uczelni ekonomicznych palących papierosy. L¦ Zadanie 5. Spośród skrzynek magazynowanej broni strzeleckiej wylosowano do kontroli niezależnie 300 skrzynek. Po ich otwarciu okazało się, że 18 skrzynek zawiera broń z obecnością rdzy na sprzęcie. Przyjmując współczynnik ufności 0,99 oszacować odsetek magazynowanych skrzynek z bronią dotkniętą procesem korozyjnym. &• Zadanie 6. Należy oszacować odsetek zakładów produkcyjnych pewnego resortu, które w 2002 roku zapłaciły kary umowne za nieprzestrzeganie rygorów ochrony środowiska. W tym celu wylosowano 400 zakładów i okazało się, że 320 spośród nich zapłaciło w 2002 roku stosowane kary umowne za zanieczyszczanie środowiska. Na tej podstawie ocenić metodą przedziałową frakcję zakładów w analizowanym resorcie płacących stosowne kary umowne. L* Zadanie 7. W wyniku badania religijności Polaków przeprowadzonego przez GUS w 1991 roku na losowo wybranej próbie 5032 dorosłych osób, 2637 respondentów stwierdziło, że systematycznie uczestniczy w praktykach religijnych. Przyjmując poziom ufności 0,98 oszacować odsetek dorosłych Polaków uczestniczących w praktykach religijnych okazjonalnie (czyli niesystematycznie) lub nie uczestniczących w ogóle. Zbadać precyzję oszacowania. Ocenić przy poziomie ufności 0,95 odsetek dorosłych Polaków uczestniczących systematycznie w praktykach religijnych i podać błąd względny szacunku. Li Zadanie 8. Ile mieszkań na osiedlu "Zaspa" w Krakowie należy wylosować niezależnie do próby, aby oszacować średnie dobowe zużycie gazu ziemnego przypadające na jedno mieszkanie jeśli na podstawie 50 elementowej próby następnej wariancja 103 Rozdział IV zużycie wynosi 0,49 (m3)2 a błąd szacunku nie może przekracza wartości 0,2 m3 przy poziomie ufności 0,98. L» Zadanie 9. Ile tabliczek czekolady należy wylosować niezależnie do próby, aby ocenić średnią wagę tabliczki czekolady z dokładnością do 5 gramów, jeśli średnia waga i odchylenie standardowe określone na podstawie 120 elementowej próby wstępnej wynosi odpowiednio x = 95 gram i S(x) = 10 gram. Zadanie 10. Ile osób należy wylosować do próby, aby oszacować średnie wynagrodzenie w przemyśle odzieżowym w 2002 roku jeśli próba wstępna licząca 70 osób dostarczyła informacji, że odchylenie standardowe wynagrodzenia było równe 155 PLN a dopuszczalny maksymalny błąd szacunku nie może przekroczyć 50 PLN. (poziom ufności 1 - a = 0,90). Jak zmieni się minimalna liczebność próby, gdy poziom ufności zwiększymy o 0,95 lub do 0,98. Zadanie 11. Badając w 2001 roku w pewnym dużym zakładzie włókienniczym absencję pracujących tam kobiet stwierdzono, że w wylosowanej próbie 100 osób przeciętna liczba dni w roku kiedy przebywają one na zwolnieniu lekarskim jest równa 35 dni przy odchyleniu standardowym S = 16 dni. Czy przyjmując poziom istotności 0,01 na podstawie tych danych można twierdzić, że przeciętny czas przybywania na zwolnieniach w ciągu roku przekracza miesiąc (umowne 31 dni). Zadanie 12. W celu oszacowania średniego wzrostu stających do poboru wojskowego młodych mężczyzn pochodzących ze wsi wylosowano niezależnie 1250 kart zdrowia i otrzymano następujące informacje: Wzrost w cm 160-162 162-164 164-166 166-168 168-170 170-172 172-174 174-176 X 178-180 180-182 182-184 Liczba poborowych 15 27 44 103 211 303 230 162 95 30 18 12 Źródło: dane umowne Na poziomie istotności 0,05 zweryfikować hipotezę, że średni wzrost poborowych jest równy 171 cm. L> Zadanie 17 Z raportu CBOS (strona internetowa www.cbos.org.pl/spiskom.pol/2000 wynika, że w styczniu 2000 108 osób na 675 ankietowanych nie było zdecydowanych na jaką partię będzie głosować. Zakładając poziom istotności a = 0,01 zweryfikować hipotezę, że mniej niż 20% Polaków nie było zdecydowanych co do swoich preferencji wyborczych. L1 Zadanie 18. W hurtowni owoców cytrusowych na 120 wylosowanych niezależnie skrzynek z cytrynami w 16 znaleziono zepsute cytryny. Na poziomie istotności a = 0,01 zweryfikować hipotezę, że przechowywana partia owoców zawiera ponad 5% zepsutych owoców. 105 Rozdział IV /L• Zadanie 19. W celu oszacowania struktury procentowej rodzaju kontraktacji w indywidualnych gospodarstwach rolnych pewnego powiatu, wylosowano niezależnie 360 gospodarstw wśród tych, które prowadzę kontraktację. Otrzymano następujące dane: Rodzaj kontraktacji Liczba gospodarstw Zboże i ziemniaki Buraki i rośliny przemysłowe Bydło Trzoda chlewna 21 123 50 166 Źródło: dane umowne Sprawdzić hipotezę, że 50% gospodarstw rolnych badanego powiatu prowadzi kontraktację trzody chlewnej. Przyjąć poziom istotności a = 0,02. ODPOWIEDZI DO ZADAŃ 1. Przedział ufności (46,13; 53,87) o długości 7,74 względna precyzja oszacowania B(X) = 0,0774 = 7,74%; 2. Przedział ufności (40,01; 46,61), długość przedziału 6,6, błąd precyzji B(X) = 7,62%; 3. „G.W." - przedział ufności (21,72; 24,94), długość 3,22; błąd względny B(X) = 6,9%. „W.Z." - przedział ufności (26,63; 29,37), długość 2,74; błąd względny B(X) = 4,9%. Obydwie gazety razem: przedział ufności (24,06; 26,34), długość 2,28; błąd względny B(X) = 4,53%; 4. Przedział ufności dla wskaźnika struktury (71,96%;80,04%); 5. Przedział ufności dla wskaźnika struktury (2,46%; 9,54%); 6. Przedział ufności dla wskaźnika struktury (75,34%; 84,66%); 7. Przedział ufności dla wskaźnika struktury (45,96%; 49,24%); precyzja oszacowania B(p) = 3,45% lub (51,03%; 53,77%); precyzja oszacowania B(p) = 2,62% ; 8. 67 mieszkań; 9. 16 tabliczek czekolady przy 1 - a = 0,95; 27 tabliczek czekolady przy 1 - a = 0,99; 10. Dla 1 - a = 0,9 26 osób; dla 1 - a = 0,95 37 osób; dla 1 - a = 0,98 53 osoby; 11. Odrzucamy Ho, czyli z prawdopodobieństwem 0,99 przeciętny czas przebywania na zwolnieniu lekarskim przekracza 1 miesiąc; 12. Odrzucamy HO, czyli średni wzrost poborowych nie jest równy 171 cm.; 13. Dla a = 0,05 odrzucamy Ho, czyli wydatki na żywność nie przekraczają 240 zł.; 14. Odrzucamy Ho, czyli ciśnienie tętnicze kobiet w wieku 40 lat w wybranej grupie chorobowej, nie jest zgodne z normą; 15. Brak podstaw do odrzucenia Ho, czyli nie jest prawdą, że ponad połowa osób mieszkała w sanatoriach lub pensjonatach. 106 Zadania do samodzielnego rozwiązywania 16. Brak podstaw do odrzucenia Ho, czyli myląc się 5 razy na 100 może twierdzić, że 25% osób sugeruje się reklamą radiową dokonując zakupów. 17. Odrzucamy hipotezę Ho na korzyść H,, czyli mniej niż 20% wyborców nie było zdecydowanych co do swoich preferencji wyborczych. 18. Odrzucamy hipotezę Ho na korzyść H,. 107 Przykładowe zadania testowe Zadanie 2. pkt odp Na podstawie badań przeprowadzonych na grupie 50 przedszkolaków ustalono, że średni wzrost dziecka jest równy 119 cm przy względnym poziomie zmienności 4,2%, a największa liczba dzieci to dzieci o wzroście równym 122 cm. Czy możliwe jest, że: a) polowa dzieci ma wzrost powyżej 120 cm 1 b) odchylenie standardowe wzrostu dzieci jest równe 10 cm 1 c) dzieci niższych niż wzrost średni jest więcej niż dzieci wyższych niż wzrost średni 1 d) asymetria rozkładu wzrostu jest ujemna 1 108 Przykładowe zadania testowe 4a Zadanie 3. pkt odp W zakładzie X 25% pracowników ma wynagrodzenie nie przekraczające 1200 zt, polowa pracowników nie przekraczające 1500 zt i 25% pracowników co najmniej równe 1750 zt . Czy prawdą jest, że: a) asymetria rozkładu ptac w tym przedsiębiorstwie jest lewostronna 1 b) odchylenie standardowe ptac jest równe 275 zt 1 c) średnia płaca przewyższa 1500 zt I d) ptaca średnia jest równa 1600 1 1 b) <10;16 > 1 c) < 12;18 > 1 d) < 7;13 > 1 Zadanie 6. pkt odp Mając dane Vz = 0,18, \ = 0,75, X = 100 ustal czy: a) D = 85 1 b) Me = 95,5 1 109 Przykładowe zadania testowe Zadanie 1. pkt odp Współczynnik asymetrii wagi noworodka jest równy - 0,65. Czy na tej podstawie można twierdzić, że: a) najczęściej rodzą się dzieci z wagą niższą niż średnia waga 1 b) liczba dzieci z wagą wyższą niż średnia jest większa niż liczba dzieci z wagą niższą niż średnia 1 c) najczęściej rodzą się dzieci z wagą równą średniej wadze 1 d) nie da się określić zależności pomiędzy wagą średnią i najczęstszą 1 L» Zadanie 2. pkt odp Na podstawie badań przeprowadzonych na grupie 50 przedszkolaków ustalono, że średni wzrost dziecka jest równy 1 19 cm przy względnym poziomie zmienności 4,2%, a największa liczba dzieci to dzieci o wzroście równym 122 cm. Czy możliwe jest, że: a) połowa dzieci ma wzrost powyżej 120 cm 1 b) odchylenie standardowe wzrostu dzieci jest równe 10 cm 1 c) dzieci niższych niż wzrost średni jest więcej niż dzieci wyższych niż wzrost średni 1 d) asymetria rozkładu wzrostu jest ujemna 1 108 Przykładowe zadania testowe L> Zadanie 3. pkt odp W zakładzie X 25% pracowników ma wynagrodzenie nie przekraczające 1200 zł, potowa pracowników nie przekraczające 1500 zł i 25% pracowników co najmniej równe 1750 zł . Czy prawdą jest, że: a) asymetria rozkładu płac w tym przedsiębiorstwie jest lewostronna 1 b) odchylenie standardowe płac jest równe 275 zł 1 c) średnia płaca przewyższa 1500 zł 1 d) płaca średnia jest równa 1600 1 «b Zadanie 4. pkt odp Współczynnik zmienności stażu pracy pewnej grupy pracowników mierzony zależnością pomiędzy odchyleniem standardowym i wartością średnią jest równy 0,25. Czy typowy przedział zmienności stażu pracy może mieć postać: a) < 9;15 > 1 b) <10;16 > 1 c) < 12;18 > 1 d) < 7;13 > 1 L• Zadanie 5. pkt odp Dysponując ciągiem obserwacji empirycznych określających liczbę błędów popełnianych przez studentów w teście egzaminacyjnym w postaci szeregu: 10, 12, 8, 7,4, 12, 11, 10, 10, 8 ustal czy: a)) połowa studentów popełnia co najmniej 10 błędów 1 b) najczęściej popełniano 12 błędów 1 c) względny poziom zmienności można ocenić na 10% 1 d)) średnia liczba popełnionych błędów równa jest 10 1 L• Zadanie 6. pkt odp Mając dane Vz = 0,18, As = 0,75, X = 100 ustal czy: a) D = 85 ! b) Me = 95,5 1 109 Rozdział V c) D = 113,5 I d) większa część jednostek statystycznych stanowiących analizowaną zbiorowość nie przekracza poziomu średniego I Zadanie 7. pkt odp Dysponując szeregiem przedstawiającym liczbę wypalanych dziennie papierosów przez pracowników szpitala miejskiego X 0-6 6-12 12-18 18-24 24-30 n. 10 12 18 8 2 ocenić czy prawdą jest, że a) średnia liczba wypalanych papierosów jest równa 15 1 b) największa liczba pracowników wypalała dziennie 15 papierosów 1 c) połowa pracowników wypala nie więcej niż 13 papierosów 1 d) 25% pracowników wypala nie więcej niż 7,5 papierosa 1 Zadanie 8. pkt odp W dwóch zakładach przeprowadzono ocenę skośności rozkładu premii kwartalnej przyznawanej pracownikom, ustalając m.in., że: średnie arytmetyczne są identyczne (600 zł) dominanty są różne i wynoszą odpowiednio 500 zł i 550 zł. współczynniki skośności są różne: + 0,50 i + 0,33. Czy: a) względne zróżnicowanie wysokości premii w pierwszym i drugim zakładzie wy-nosi:33% i 25% 1 b) odchylenie standardowe premii w pierwszym zakładzie przewyższa odchylenie standardowe premii w drugim zakładzie 1 c) mediany są równe 1 d) typowe obszary zmienności są takie same 1 Zadanie 9. pkt odp Dla 150 losowo wybranych spółek z o.o. w Polsce oszacowano kwartyle (pierwszy, drugi i trzeci) zysku netto na poziomach: 2,4%, 7,6% i 10,9%. Czy względna zmienność zysków netto w badanych bankach wynosi: a) 36,9% b) 102,3% c) 55,9% d) 12,4% a) względna zmienność zysków netto w badanych bankach wynosi 55,9% 1 b) przekracza 80% 1 110 Przykładowe zadania testowe c) asymetria rozkładu zysków netto jest lewostronna 1 d) dominanta zysków jest równa 7% 1 Zadanie 10. pkt odp Stosunkowo najczęściej widzimy na ulicach Katowic, młode kobiety o wzroście 168 cm. Kiedy jednak ustalono na losowej próbie średni wzrost kobiety okazało się, że wynosi on 164 cm, przy 5,0 procentowej względnej zmienności. Czy prawdą jest, że: a) współczynnik asymetrii wzrostu kobiet jest równy 0,5 1 b) odchylenie standardowe wzrostu wynosi około 8 cm 1 c) potowa kobiet nie przekracza wzrostu 165,3 cm 1 d) asymetria wzrostu kobiet ma lewostronny kierunek 1 Zadanie 11? pkt odp W losowo wybranej grupie lekkoatletów okazało się, że co czwarty skacze w dal bliżej niż 7,2 m, co czwarty skacze dalej niż 7,8 m, a mediana skoków w dal w badanej grupie wynosi 7,4 m. Ustalić, czy: a) D=7,5 m 1 b) asymetria rozkładu skoków jest dodatnia 1 c) względny poziom zmienności można określić na 25% 1 d) współczynnik skośności jest równy 0,33 1 Zadanie 17. pkt odp Badanie 20 par nowożeńców w chwili zawierania związku małżeńskiego ze względu na wiek (oddzielnie dla kobiet i dla mężczyzn) dostarczyło następujących informacji: Mężczyźni x = 29,55, D = 26, \ = 0,3; Kobiety x = 22, D = 24, Vz = 0,3. Ocenić czy: a) zbiorowość kobiet jest bardziej zróżnicowana ze względu na wiek w chwili zawierania związku małżeńskiego niż zbiorowość mężczyzn I bt średni wiek małżonka jest równy 26 lat 2 c) asymetria wieku kobiet i mężczyzn wstępujących w związek małżeński ma przeciwny kierunek I d) dominanta wieku małżonków to 25 lat I Zadanie 18. pkt odp W celu ustalenia przeciętnej płacy księgowych w prywatnych firmach wybrano losowo grupę 10 osób i zebrano informacje o ich przeciętnej rocznej ptacy (w tys. zł): 40. 50, 37, 52, 64, 75, 48, 62, 72, i 7O.Czy można na tej podstawie stwierdzić, że: al średnia płaca księgowego jest równa 56 tys. zł 1 bl płaca połowy badanych osób nie przekracza 64 tys. z) 2 ci rozkład płac jest symetryczny 1 dl względna dyspersja rozkładu jest równa 22,4% 1 113 Rozdziai V Zadanie 19. pkt odp Wiedząc, że współczynnik korelacji liniowej Pearsone'a jest równy 0,68 stwierdź czy prawdą jest, że: a) wzajemny wptyw zmiennych na siebie jest równy 68% 1 b) stopień niedopasowania wynosi 54% 1 c) korelacja ma dodatni kierunek 1 d) rozważanie teoretycznej linii regresji ma sens 1 Zadanie 20. pkt odp Dla zależności pomiędzy stopniem zaawansowania znajomości języka obcego (mierzoną liczbą błędów popełnianych w teście kontrolnym) i czasem poświęcanym na naukę języka ustalono współczynnik regresji równy -5,25. Czy prawdą jest, że czas poświęcany na naukę wpływa na poziom znajomości języka w: a) 52,5% 1 b) 47,5% 1 c) 27,5625% 1 d) nie da się tego stwierdzić jednoznacznie I Zadanie 21. pkt odp Celem ustalenia zależności pomiędzy liczbą braków a wielkością produkcji wybranego produktu zbadano losowo 6 zakładów produkcyjnych o takim samym zakresie produkcji i otrzymano następujące dane: Wielkość produkcji (w tys. szt.) - cecha X: 1; 4; 5; 6; 7; 9. Liczba braków (w sztukach) - cecha Y: 10; 30; 40; 50; 50; 60. Czy na tej podstawie można stwierdzić, że a) korelacji pomiędzy wielkością produkcji a liczbą braków jest duża i wynosi 0,9819 2 b) zmienność liczby braków jest w 96,4% wyjaśniona zmiennością wielkości produkcji 1 c) w zakładzie produkującym 10 tys. sztuk poziom braków będzie równy 70 sztuk 2 d) gdy produkcja wzrośnie w wybranym zakładzie o 1 tys. szt to poziom braków wzrośnie o 10 sztuk 1 114 Przykładowe zadania testowe Zadanie 22. pkt odp Które z zależności są prawdziwe: a) rw = 0,75, a, = -025 1 b) a = 0,40, b, = 3,5 2 c) a, = -0,4, b, = 2,4 1 d) rw = 0,60, b, = 2,5 1 ¦¦s. L¦ Zadanie 23. pkt odp Współczynniki regresji pomiędzy stażem pracy i wynagrodzeniem są odpowiednio równe a, = 0,45, b, = 1,8. Czy prawdą jest, że: a) współczynnik korelacji jest równy 0,9 1 b) wynagrodzenie w 70% zależ)' od stażu 1 c) współczynnik korelacji jest równy 0,81 1 d) w 19% wynagrodzenie zależv od innych czynników niż staż 1 Zadanie 33. pkt odp W badaniach nad zależnością między wielkością produkcji (w tys. szt.) a kosztami produkcji (w USD) uzyskano następujące wyniki: produkcja 25; 31; 40; 45; 52 i odpowiadające jej koszty 50; 40; 35; 30; 26. Czy na tej podstawie można twierdzić, że:: a) zależność pomiędzy cechami ma charakter liniowy 2 b) wzrost wielkości produkcji może oznaczać zmniejszenie kosztów jednostkowych 1 c) współczynnik determinacji liniowej przekracza 70% 1 d) przy produkcji równej 60 tys. sztuk koszty ulegną zmniejszeniu do 22 USD 2 118 Przykładowe zadania testowe Zadanie 34. pkt odp Wśród 500 absolwentów technikum przeprowadzono sondaż dotyczący zgodności wykonywanej pracy z wyuczonym zawodem i zadowolenia z wykonywanego zawodu. Uzyskano następujące informacje: wśród 150 osób pracujących zgodnie z wyuczonym zawodem 2/3 było zadowolonych z wykonywanej pracy a pozostała część osób nie. Natomiast z pozostałej części absolwentów technikum 150 osób stanowi-ty osoby niezadowolone z wykonywanej pracy. Ustal czy a) istnieje statystycznie istotna zależność pomiędzy zgodnością wykonywanej pracy z zawodem wyuczonym a stosunkiem do wykonywanej pracy. 1 b) Osoby niezadowolone z wykonywanej pracy stanowią połowę analizowanej grupy absolwentów 1 c) Współczynnik korelacji pomiędzy analizowanymi cechami jest mniejszy niż 0,5 1 d) Współczynnik korelacji pomiędzy analizowanymi cechami jest większy niż 0,5 1 L> Zadanie 35. pkt odp Średnioroczne tempo wzrostu spożycia wyrobów tytoniowych jest równe 2,5%.Jeśli dziś kupujemy 300 paczek papierosów to za trzy lata będziemy ich kupować: a) 307,5 paczek 1 b) 292,5 paczek 1 c) 323,1 paczek 1 d) 350,3 paczek 1 Zadanie 41. pkt odp Zużycie produktów higienicznych w kg/osobę w kolejnych latach 1996-2000 było odpowiednio równe: 8; 9; 10; 12; 12.czy prawdą jest, że: a) zużycie w 2000 roku przekroczyło o 50% poziom zużycia z roku 1996 2 b) pomiędzy rokiem 1997 a 1999 nastąpił wzrost zużycia środków kosmetycznych o 25% 2 c) średnio z roku na rok poziom zużycia środków kosmetycznych wzrastał o 10,6% 2 d) zachowując dotychczasowe tempo wzrostu zużycia kosmetyków w 2002 roku poziom zużycia powinien wynosić 14 kg/osobę. 2 Zadanie 42. pkt odp Na podstawie danych kwartalnych dotyczących produkcji mleka (w tys. litrów) w Okręgowej Spółdzielni Mleczarskiej w mieście A w latach 1997-2001 oszacowano liniowy trend produkcji w postaci: y = 2847,5 + 25,9t Na tej podstawie można twierdzić, że: a) z kwartału na kwartał produkcja mleka wzrastała przeciętnie o 25,9 tys. litrów 1 b) z kwartału na kwartał produkcja mleka wzrastała przeciętnie o 25,9% 1 c) z roku na rok produkcja mleka wzrastała o 25,9 tys. litrów 1 d) w ostatnim kwartale roku 1996 produkcja mleka w tej spółdzielni była równa 2847,5 tys. litrów 1 Zadanie 43. pkt odp Na podstawie informacji o rocznym poziomie spożycia artykułów wędliniarskich w rodzinie czteroosobowej oraz poziomie cen tych artykułów w latach 1999 i 2001 wyznaczono odpowiednie mierniki agregatowe: [L= 1,207; 1|!= 1,204; IJ- = 0,938; Pj = 0,935. Czy prawdą jest, że a) łączna wartość spożycia wymienionych artykułów wzrosła o 20,7% 1 b) nastąpił wzrost cen artykułów wędliniarskich o ok. 20,5% 1 c) spożycie wybranych artykułów wzrosło o ok. 7,2% 1 d) przy założeniu stałego poziomu spożycia z roku 1999 zmiana cen spowoduje wzrost wartości o 20,7% 1 121 Rozdział V Zadanie 44. pkt odp Dynamikę sprzedaży soków owocowych firmy HORTEX w latach 1990-1994 charakteryzował następujący ciąg indeksów łańcuchowych 120%, 180%, 230%, 190%. Czy z roku na rok. przeciętnie sprzedaż soków owocowych u tego producenta: a) rosła o 75,3%, 1 b) rosła o 175,3% 1 c) malała o 75,3% 1 d) pozostawała bez zmian. 1 Zadanie 45. pkt odp W zakładach przetwórstwa zbożowego prowadzono badanie popytu na oferowane nowe gatunki kaszy. Badaniem objęto okres od 01.01.1993-31.12.1997. Okazało się, że popyt kształtował się zgodnie z równaniem (model multiplikatywny): y = 0,83t + 1,07 . Jednocześnie wyznaczono wskaźniki sezonowości równe odpowiednio dla kolejnych kwartałów: c, = 0,76, c, = 0,94, c, = 1,25, c4 = 1,18 Wykorzystując te informacje określić czy: spodziewany poziom popytu na kaszę w III kwartale 1998 roku będzie równy: a) spodziewany poziom popytu na kaszę w III kwartale 1998 roku będzie równy ok. 25,2 2 b) z kwartału na kwartał popyt na kaszę wzrastał przeciętnie o 1,07 2 c) współczynnik korekty jest równy 0,9685 2 d) spodziewany poziom popytu na kaszę w 111 kwartale 1998 roku będzie równy ok 13,62 2 Zadanie 46. pkt odp Na podstawie danych ankietowych stwierdzono, że średnie spożycie owoców cytrusowych (w kg na jednego mieszkańca) w latach 1995-1999 było odpowiednio równe: 31,2; 28,9; 37,2; 40,7; 45,2. Czv prawdą jest, że: a) średnio z roku na rok spożycie wzrasta o około 10% 2 b) w 2001 roku powinno bvć równe 54,2 kg 2 c) w 1999 roku wzrost w stosunku do roku poprzedniego był silniejszy niż w 1997 w stosunku do 1996 2 d) przeciętny poziom spożycia owoców cytrusowych za cały okres był równy 36,25 kg 2 122 Przykładowe zadania testowe Zadanie 47. pkt odp W firmie Handlowej MARGO obroty ze sprzedaży wybranych artykułów przedstawiały się następująco: w marcu 2002 wartość sprzedanych wyr. tytoniowych wyniosła 200 tys. a w maju 2002 180 tys.zł; dla art. spożywczych odpowiednie kwoty były równe 400 i 450 tys. zł, a dla kosmetycznych 100 i 110 tys. zł. Firma wprowadziła promocyjne ceny na wymienione artykuły obniżając je o odpowiednio 3%, 2% i 6% w maju w stosunku do marca. a) czy obniżka cen spowodowała zwiększenie obrotów firmy 2 b) czy w ogólnym stopniu ceny artykułów spadły o 3% 2 c) czy wpływ zmiany cen był silniejszy na zmianę wartości obrotów niż wpływ zmiany wielkości sprzedaży 2 d) czy ogólnie obroty firmy MARGO spadły o 5% 1 Zadanie 48. pkt odp Względne wskaźniki sezonowości kwartalnej spożycia piwa są odpowiednio równe: S, = 0,797; S„ = 1,227; S,„ = 1,357; S|v = 0,625. Liniowa funkcja trendu wyznaczona na podstawie 5 lat obserwacji (od 1997-2001) ma postać: y = 4,68 + 0,04 (t-t), gdzie =-19,-17,-15,... 15, 17, 19. a) czy można twierdzić, że w trzecich kwartałach spożycie piwa przekracza poziom przeciętny o 35,7% 2 b) czy można twierdzić, że w trzecich kwartałach spożycie piwa przekracza poziom przeciętny o 35,5% 2 c) średnio spożycie piwa z kwartału na kwartał wzrasta o 0,08 litra na osobę. 2 d) w ostatnim kwartale roku 1996 spożycie piwa było równe 4,68 litra na osobę 2 Zadanie 49. pkt odp Dla trzech gmin woj. Śląskiego liczących odpowiednio 10 tys., 40 tys. i 25 tys. mieszkańców gęstość zaludnienia kształtuje się następująco: 40 os./ km2 20 os./ km2 i 50 os./ km2 a) średnia gęstość zaludnienia w tych trzech gminach łącznie wynosi 27,27 os./ km2 2 b) średnia gęstość zaludnienia w tych trzech gminach łącznie wynosi 33,33 os./ km2 2 c) łączna powierzchnia zajmowana przez te trzy gminy razem jest równa 2750 km2 2 d) łączna powierzchnia zajmowana przez te trzy gminy razem jest równa 75 tys. km2 2 123 Rozdział V Zadanie 50. pkt odp Na podstawie pięcioletniego okresu obserwacji (lata 1995-1999) ustalono wskaźniki sezonowości czasu pracy, przy czym utracone zostały dwie informacje. Zakładamy, że funkcja trendu badanego zjawiska ma postać y = 0,257t + 157,52 oraz dla kolejnych kwartałów wskaźniki względne i absolutne wahań są odpowiednio równe: Wsk. względne: 1,03; 0,956; ? ; 1,095 Wsk. absolutne: +31,4; ? ;-84,8; + 99,6 a) czy względny wskaźnik sezonowości dla trzeciego kwartału jest równy 0,919 2 b) czy absolutny wskaźnik sezonowości dla drugiego kwartału jest równy -50,5 2 c) czy spodziewana wartość czasu pracy dla drugiego kwartału roku 2000 jest równa 156 2 d) czy w drugich kwartałach czas pracy przekracza czas przeciętny o 46,6 godz. 2 ROZWIĄZANIA ZADAŃ TESTOWYCH Zadanie A B C D 1 N T N N 2 T N N T 3 T N N N 4 T N N N 5 T N N N 6 T T N T 7 N N T T 8 T T N N 9 T N T N 10 N T T T 11 N T N T 12 N T T N 13 N T N T 14 N T T N 15 N T N N 16 N N N T 17 N r T N 18 N N N T 19 N T T T 20 N N N T 21 T T T N 124 Przykładowe zadania testowe Zadanie A B C D 22 N N N T 23 T N N T 24 N N T N 25 T N T N 26 T N N T 27 T T N N 28 T N T N 29 N T N T 30 N T T N 31 T N N T 32 N N N T 34 T N T N 35 N N T N 36 N N N T 37 T — N — N — T »—¦ 38 N T N N 39 T T T N 40 T N N T 41 T N T N 42 T N N T 43 \ N \ T \ N -X T 44 T N N N 45 N N T T 46 T N N T 47 T T N N 48 N T N N 49 T N T N 50 T N N N 125 Bibliografia Amir d. Aczel, 2000: Statystyka w zarządzaniu. PWN. Warszawa. Domański Cz. (Red.), 1991: Zbiór zadań ze statystyki. Wydawnictwo U.Ł. Łódź. Kassyk-Rokicica H. (Red.), 1996: Statystyka. Zbiór zadań. PWE. Warszawa. Ostasiewicz S., Rusnak Z., Siedlecka U., 1995: Statystyka. Elementy teorii i zadania. Akademia Ekonomiczna. Wrocław. Paradysz }., 1996: Statystyka w przykładach i zadaniach. Akademia Ekonomiczna. Poznań. Sobczyk M., 2000: Statystyka. PWN. Warszawa. 126 Wydawnictwo wyższej Szkoły Ekonomii i Administracji ul. A. Frycza-fflodrzewskiego 1,41-907 Bytom te!., fax: 032 286 99 58 MARIAN CIEPAJ STOŁECZH0EK0N0M1CZNE ASPEKTY PRZEKSZTAŁCEŃ USTROJOWYCH W GOSPODARCE KRAJU I REGIONU PODSTAWY RACHUNKOWOŚCI zbiór ćwiczeń m ROLA MAŁYCH I ŚREDNICH PRZEDSIĘBIORSTW W ROZWOJU REGIONALNYM WPROWADZENIE DO EDYCJI TEKSTÓW READINGS IN BUSINESS ENGLISH FOR BEGINNERS ., mbusniiUEwMBMiiwaKnuuanTWiD I — 5"\ */ n pkl Dysponując ciągiem obserwacji empirycznych określających liczbę biędów popełnianych przez studentów w teście egzaminacyjnym w postaci szeregu : 10, 12, 8, 7, 4, 12, II, 10, 10, 8 ustal czy: a) ) polowa studentów popełnia co najmniej 10 biędów 1 ^___ł J i b) najczęściej popełniano 12 błędów 1 ~r i c) względny poziom zmienności można ocenić na 10 % 1 N d)) średnia liczba popełnionych błędów równa jest 10 1 M O U r ex ą W grupie 50 rodzin konsumenckich przeprowadzono badanie statystyczne dotyczące średnich miesięcznych wydatków na przybory szkolne i liczby dzieci w rodzinie. Ustalono, że kowariancja pomiędzy zmiennymi jest równa 1.3, wariancja wydatków jesi równa 4 i wariancja liczby dzieci w rodzinie równa 1. a wartości średnie wydatków na przybory szkolne( w umownych jednostkach pieniężnych ) i liczby dzieci są odpowiednio równe 10 i 2. Czy:_________ pkt otip I a) liniowa determinacja zmienności wydatków na artykuły szkolne względem zróżnicowania liczby dzieci jest równa 65.0 % 2 bj względny poziom zróżnicowania wydatków na przybory szkolne jest większy niż liczby dzieci w rodzinie V &,, 1 N c) korelacja pomiędzy wydatkami i liczbą dzieci ma dodatni kierunek ?* yw j 1 T T d) współczynnik regresji jest równy 0.52 Ca 4 f\ 2 r % C Średnioroczne tempo wzrostu spożycia wyrobów tytoniowych jest równe 2,5%.Jeś!i dziś kupujemy 300 ; paczek papierosów to za. trzy lata będziemy ich kupować:_________________________________________ pkl odp i a) 3C7.5 paczek b) 292,5 paczek c) 323,1 paczek d) 350,3 paczek T) T - 11 ! W LZ 5O5, :¦ ¦¦¦ \ .?f Vf \ ' _-ui LL?_.., pki oilp Prosta regres j i opisująca zależność wydatków na żywność przeciętnej rodziny czteroosobowej (Y w tyś. PLN ) i dochodu w tej rodzinie (X w tyś PLN ) ma postać y = 0.11 x + 0.708. Czy prawdą jesi. y.e: a) jeśli dochody wzrosną o I tyś. PLN. to wydatki na żywność wzrosną o 110 PLN b) jeśli dochody wzrosną o I tyś. PLN to wydatki wzrosną o 11%___________ c) przy dochodach równych 5 tyś PLN wydatki będą równe 1,258 tyś PLN j d) wydatki na żywność w I 1% zależą od dochodów w rodzinie A L a r_ łNa podstawie informacji o rocznym poziomie spożycia artykułów wędliniarskich w rodzinie czteroosobowej oraz poziomie cen tych artykułów w latach 1999 i 2001 wyznaczono odpowiednie mierniki aureuatowe: * =1.207;/,'' = 1,204;/* = 0,938;/,'' = 0,935 . Czy prawdąjest, że pkt c?) a) łączna wartość spożycia wymienionych artykułów wzrosła o 20,7% F^/ 1 1 b) nastąpił wzrost cen artykułów wędliniarskich o ok. 20.5% % 1 c) spożycie wybranych artykułów wzrosło o ok. 7 2 % 1 d) przy założeniu stałego poziomu spożycia z roku 1999 zmiana cen spowoduje wzrost wartości o 20.7°' 1 ZAD.7., : 4 -—"~ pkt odp Dysponując szeregiem przedstawiającym liczbę wypalanych dziennie papierosów przez pracowników szpitala miejskiego X 0-6 6-12 12-18 18-24 24-30 n,¦ . 10 i? 18 ____ 8 2 _.__,. ... v ocenić czy prawdą jest, że a) średnia liczba wypalanych papierosów jest równa 15 1 H b) największa liczba pracowników wypalała dziennie 15 papierosów Q 7 V\f 1 H. c) polowa pracowników wypala nie więcej niż 13 papierosów f (^ 1 r T d) 25% pracowników wypala nie więcej niż 7,5 papierosa % 1 r ZAD.S. M w pki odp Rozkład wieku 100 losowo wybranych posłów ostatniej kadencji przedstawiał się następująco: poniżej 20 lat miało 2 posłów, od 30 do 39 lat miało 20 posłów, od 40 do 49 to wiek 46 posłów, od 50 do 59 to 26 posłów i wiek 60 lat przekroczyło 6 posłów. Czy: a) średni wiek posła to 45 lat b) polowa posłów nie przekroczyła wieku 46 lat c) najliczniejszą grupę stanowią posłowie w wieku około 44 lat d) rozkład wieku posłów jest umiarkowanie lewostronnie asymetryczny ? ZAD.9. - =' ^ cl) W firmie Handlowej MARGO obroty ze sprzedaży wybranych artykułów przedstawiały się następująco: I w marcu 2002 wartość sprzedanych wyr. tytoniowych wyniosła 200 tyś. a w maju 2002 180 tyś.zł; dla art. Spożywczych odpowiednie kwoty były równe 400 i 450 tyś. zł. a dla kosmetycznych 100 i 110 tvs. zł. Firma wprowadziła promocyjne ceny na wymienione artykuły obniżając je o odpowiednio 3%. 2% i 6"!> w maju w stosunku do inarca. [ /'A/ j odp a) czy obniżka cen spowodowała zwiększę nie obrotów ilrmv i 2 f N ! bj czv w ogólnym stopniu ceny artvku!ów spadł v o 3/ó 1 7 r ! <:) czy wpływ zmiany cen był silniejszy sprzedaży na zmianę wartości obrotów niż wpływ zmiany wielkości j 2 i di czy ogólnie obroty firmy MARGO spadły o 5% H \fi i C :!) EGZAMIN TESTOWY ZE STATYSTYKI ZESTAW C ty- Nuzwisko i imię Cr. H-rtlz. \ih. ifa//Mnju -"*.'Odpowiedzi należy zaznaczyć w kolumnie „ofl^?. " symbolem T dla tak lub symbolem N dla nie. te'S&Hunktacja odpowiedzi: odpowiedź dobra 1 lub 2 lub 3 pkt, odpowiedź zla -0.5 lub -1 lub-1,5 pkt, brak odpowiedzi Opkt Celem ustalenia zależności pomiędzy liczbą braków a wielkością produkcji wybranego produktu zbadano losowo 6 zakładów produkcyjnych o takim samym zakresie produkcji i otrzymano następujące dane: Wielkość produkcji ( w tyś. szt)-cecha X :!; 4; 5; . 6; 7; 9; Liczba braków (w sztukach )-cecha Y : 10; 30; 40; 50; 50; 60; Czy na tej podstawie można stwierdzić, że______________________________________________________ pkt Otl, a) korelacji pomiędzy wielkością produkcji a liczbą braków jest duża i wynosi 0.9819 T ,b) zmienność liczby braków jest w 96,4% wyjaśniona zmiennością wielkości produkcji ' c) w zakładzie produkującym 10 tyś, sztuk poziom braków będzie równy 70 sztuk r ¦>• d) gdy produkcja wzrośnie w wybranym zakładzie o 1 tyś. $zt to poziom braków wzrośnie o 10 sztuk 1 . szt to poziom b A/ W :-?tl*':: W roku akademickim 1999/2000 na II roku Wydziału Zarządzania AE w Katowicach było 500 studentów w tym 220 mężczyzn. Letnią sesją egzaminacyjną w pierwszym terminie zaliczyło 280 osób w tym 100 mężczyzn. Czy:__________________________________; 'v-f: ' •_____________________________________ pkt odp zależność pomiędzy wynikiem sesji a płcią studenta jest statystycznie istotna b) zależność pomiędzy wynikiem sesji a pkią studenta jesr statystycznie nieistotna wspóJczynniK KOfeiacji pornietizy łmaiizowaiiy.m cccbaiiii jcsi rowcy 0.55 d) wynik sesji w 4% zależy od płci Jl ;ZAJD.3. VD pkt odp Indeksy łańcuchowe zakupu środków piorących są dla kolejnych tygodni odpowiednio równe : 105%. 110%, 108%, 107%.Czy: średnie tempo zmian zakupu środków piorących byio równe: a) średnie tempo zmian zakupu środków piorących było równe 7,48%iT? 2 W T V b) pomiędzy drugim a czwartym okresem nastąpił wzrost zakupu środków piorących o 3% 2 f *i c) pomiędzy trzecim a piątym okresem nastąpił spadek zakupów o 3%cz 2 | N f). ż jeśli w ostatnim okresie obserwacji zakupiono środki piorące za lOOzł to za dwa tygodnie zapłacimy za nie 115,52 zl. 2 f 0-l:^Wk^ pkt j odp Mając dane V. — 0.1 8, .4. = 0.75, x = 100 usta! czy: a) ¦ D=85 b) Me=95.5 ty. D* H3.5 d) ¦."' .większa część jednostek statystycznych stanowiących analizowaną zbiorowość nie przekracza pozioi średniego 1 1 FTTfi M X. 1 T" } EGZAMIN- STATYSTYKA 24.01.2003r ZAD 1. Dysponując ciągiem obserwacji empirycznej określającej liczbę błędów popełnianych przez studentów w teście egzaminacyjnym w postaci szeregu 10,12, 8,7,4,12,11, 10,10,8 ustal czy: . ¦¦ - f!ga) polowa studentów popełniła co najmniej 10 błędów ~< M.ł 1 ekt; ."-f eJ b) najczęściej popełniono 12 błędów * ¦ ^ .." :-lpkt ' c) względny poziom zmienności można ocenić na 10% lpkt ib łih błdó ó jt 10 * L. / ' ¦ "-C" T----j r---- — . - d) średnia liczba popełnionych błędów równa jest 10 lpkt ZAD 2. Mając dane Vz=0S, As=0,75, x=100 Ustal czy: «. 3 a) D=85 U* (M<€ t otl. Me b) Me=95,5 + &fc łrGM? «Um'ć c) D= 113,5 (,v-t" IM-t k^k* «> d) Większa część jednostek statystycznych stanowiących analizowaną zbiorowość nie przekracza poziomu średniego : i lpkt łdk, ^OK .f*m. ZAD 3. Dysponując szeregiem przedstawiającym liczbę wypalanych dziennie papierosów przez pracowników szpitala: X Ni 0-6 10 6-12 | 12 12-18 18 18-24 8 24-30 2 X Oceiuć czy prawdąjest: a) średnia liczba wypalanych papierosów równa jest 15 b) nąj większa liczba pracowników wypalała dziennie 15 papierosów c) połową praccu-ników wypalała nie •¦Aięcej niż 13 papierosów ( d) 25% pracowników wypalała nie więcej niż 7,5 papierosa lpkt uxe lpkt oj^€ IM \a\C lokt 4/51/, UtfC ZAD 4. Rozkład v.iełru 100 losowo wybranych pcsiów ostairiej kadencji przedstawia- iię iłastępującu: pcuiżcj 29 latnuało 2 posłów, od 30 do 39 iat miało 20 postów, od 40-49 lat to wiek 46 posłów, od 50-59 lat to 26 postów i wiek 60 lat r przekroczyło 6 posłów. Czy: _ k ' M \- a) średni wiek posła to 45 lat y' 2pkt tut oH ''' b) połowa posłów nie przekroczyła 46 lat /: 2pkt taki o«i. S c) najliczniejsza grupę stanowią posłowie w wieku ok.441aL 2pkt Mł^ ukifjd) rozkład wieku posłów jest umiarkowanie lewostronnie asymetryczny lokt &i ZAD 5. Celem ustalenia zależności pomiędzy liczbą braków a wielkością produkcji wybranego produktu zbadano losowo 6 zakładów produkcyjnych o takim samym zakresie produkcji i otrzymano dane: wielkość produkcji (w tys. szt) CechaX: 1,4, 5, 6, 7, 9 liczba braków (w szt.) Cecha Y: 10, 30,40,50, 50, 60 Czy na tej podstawie można stwierdzić: < <%j a) korelacja pomiędzy wielkością produkcji a liczbą barków jest duża i wynosi 0,9818 2pkt d b) zmienność liczby braków jest w 96,4% wyjaśniona zmiennością wielkości produkcji lpkt ,. to c) w zakładzie prod. 10 rys. sztuk poziom braków będzie równy 70 szt 2pkt ,uU d) gdy produkcji wzrośnie w wybranym zakładzie o ltys. szt to poziom braków wzrośnie o 10 szt lpkt łok, SqM. ZAD. 6. W grupie 50 rodzin konsumenckich przeprowadzono badanie statystyczne dotyczące średnich miesięcznych wydatków na przybory szkolne i liczby dzieci w rodzinie. Ustalono, że kowariancja pomiędzy zmiennymi jest równa 1,3 wariancja wydatków je<ś równa 4 i wariancja liczby dzieci w rodzinie-równa 1 a wartości średnie wydatków na przybory szkolne (w umownych jednostkach pieniężnych) i liczby dzieci są odpowiednio równe 10 i 2. Czy: Ol a) liniowa deteminancja zmienności wydatkówna artykuły szkolne względem zróżnicowania liczby dzieci jest równa 65,0% 2pki uJl ^J względny poziom zróżnicowania wydatków na przybory szkokie jest większy niż liczby dzieci w rodzinie 1 pkt WŁ korelacja porrjedzy wydatkami i liczba dzieci ma dodatni kierunek 1 pkt wspólcz\Tuuk regresji jest równy 0,52 2pkt ,,,aL b) ZAD 7. Prosta regresji opisująca zależność wydatkówna żywność przeciętnej rodziny czteroosobowej (Y w tys. PLN ) i dochodu w tej rodzinie X w rys. PLN) ma po:3ać y=0,l lx + 0,708 Czy prawdą jest te: stAOso a) jeśli dochód) ^zrosną o 1 tys. PLN, to wydatki na żywność wzrosną o 110 PLN 1 eta b) jeśli dochód) wzrosną o 1 rys. PLN. to wydatki wzrosną o 11% 1 r-jg Przy tirchodach rówaych 5 tys. PLN. Wydatki będą równe 1.258 tys. PLN. 2:kt Wydatki na r>vo 50 d) w l i % zależą cd dochodów w rodzinie ZAD 8. W roku Akademickim 1999/200 na II roku Wydziału Zarządzania AE w"Katowicach byio 500 studentów w tym 220 mężczyzn. Czy: — a) zależność pomiędzy wynikiem sesji a płcią studenta jest statystycznie istotna lpkt ^i.,-e" b) zależność pomiędzy wynikiem sesji a płcią studenta jest statystycznie nieistotna lpkt hjA/' wlw'/c) współczynnik korelacji pomiędzy analizowanymi cechami jest równy 0,55 2pkt y^Z V* d) uyn i k sesji w 4% zależy odpici ipkt 'rtJC % ZAD. 9. Średniowieczne tempo wzrostu spożycia wyrobów cytoniowych jest równe 2,5%. Jeśli dziś kupujemy 300 paczek papierosów to za 3 lata będziemy kupować ich: - k f Ł~* — \ J # h b) 292,55 paczek lpkt /T / , ) -—- ~? b) nastąpi! wzrost cen artykułów wędliniarskich o ok. 20.5% lpkt ł(jj/, rG/kl ' ^ spożycie wybranych artykułów wzrosło ok. 72% ipkt ^vL iyo<-? przy zaiożer.iu siałego poziomu spożycia w robi 1999 zmiana cen sowoduje wzrost wartości o 20.7% lpkt \(\/\ Z_\I 12. W tirmie Handlowej MARGO obroty ze sprzedaż wybranych artyl ułów przedstawiały się następująco: w marcu 21 k.)2 wartość sprzedanych wyrobów tytoniowych 200 tvs. w maju 2002 180 tys. zł dla art. Spożywczych odpowiednie kwot\ były równe 40O i 450 i\s. zł a dla kosmetycznych i00 i 110 tys. zi. Firma wprowadziła promocyjne ceny na wymienione art. obrażające je oiipowś ;_Irio ?%, 2% i 6%. w maju "v stosunku do marca a) czy obniż!;-'i jen spowodowała zwiększene obrotów jlnny V' 2okt -i b) czy w ogólnym stopniu ceny an. spadar. o j% / 2ri? c) czy wpływ zmianv ceny byl silniejszy na zmianę wartości obrotów niż wpływ zmiany wielkości sprzedaży 2okt d) czy ogólnie obroty firmy MARGO spadły o 5 % .....,._..„..,. ...... ................. Tokt -}' ~3v*~ . I K Ł ¦ — J1 ¦ ~Jf I ip o, Xi XO; I ' 4 O s Q i 1 -- z L?fe_ i ó tt ó 5 3 '5,5 X w r i. 9 05 _ % 6 Cr) - fll* //1/--UJ i ( *€- 6 50 i- > - - -Z, •6 01- 5 LlAA.i x 01 fu*. Jl- s, \ i - 4 _.---Ł J? NUU 10 zo C0< . * i, i x 5 o Ą® U> O C*/ 6 1/ t ! o, i /OD i „ .„„i..... c i ^° J zza T ^ 1 210 I M.O ioo . -r ^ = /„ ff 100 h{0l6) i\0 \a 230- 090• [\OQOX> JL^ 7 fjp€, 100.070 p 7 ? T V > -