U jednoj su anketi, provedenoj na uzorku od učenica u dobi od 15 godina, dobiveni sljedeći podatci o veličini ženskih cipela:
Što možemo zaključiti iz dobivenih podataka?
Koja je prosječna veličina ženskih cipela? Što uopće podrazumijeva riječ "prosječna"?
Je li to broj
Hoćete li reći da petnaestogodišnjakinje u "prosjeku" nose cipele broj
Pogledajmo frekvencije prikupljenih podataka o veličini cipela.
Veličina | Frekvencija |
---|---|
Većina ljudi neće računati aritmetičku sredinu, već će intuitivno zaključiti da djevojke u "prosjeku" nose cipele broj
jer je prirodnije promatrati veličinu cipela koja se najčešće pojavljuje, odnosno podatak s najvećom frekvencijom, broj
U svakodnevnim situacijama, promatrajući skup podataka, često pokušavamo odrediti podatak koji najbolje reprezentira taj skup. Obično tražimo srednju vrijednost oko koje se kreće najviše podataka u toj pojavi. Pritom, intuitivno koristimo termin „prosjek“ ili „prosječna vrijednost“. Primjerice, prosječan broj učenika u razrednom odjeljenju, prosječna plaća u graditeljstvu, prosječna visina itd. Pritom, većina ljudi misli na aritmetičku sredinu. No, kao što smo vidjeli u prethodnom primjeru, postoje srednje vrijednosti koje će nam u nekim slučajevima dati bolju informaciju o promatranom skupu podataka nego aritmetička sredina.
Brojčanu vrijednost koja opisuje sredinu uzorka, odnosno reprezentira skup podataka koji imaju tendenciju grupiranja oko neke vrijednosti, nazivamo mjera centralne tendencije ili mjera srednje vrijednosti.
Pogledajmo koje su mjere srednje vrijednosti i kako se određuju.
Mod ili dominantna vrijednost je vrijednost koja je u nizu podataka najčešće postignuta, odnosno ima najveću frekvenciju.
Primjer 1.
Sljedeća tablica prikazuje broj golova koje je hrvatska nogometna A-reprezentacija postigla na kvalifikacijskim utakmicama za svjetsko prvenstvo (SP) ili na utakmicama SP od 1996. do 2017. godine (uključujući obje godine).
Broj golova
po utakmiciBroj utakmica na kojima je
postignutOdredite mod ili dominantnu vrijednost prikazanih podataka. Što nam govori taj podatak?
Iz tablice se jasno vidi da je najveća frekvencija, odnosno mod jednak broju
Dakle, A reprezentacija najčešće postiže
gol na utakmicama vezanima uz SP.
Primjer 2.
Promotrite sljedeće skupove brojeva i odredite njihov mod.
Mod skupa brojeva je .
Za skup brojeva
mod je .
Za skup brojeva mod je .
Skup podataka može imati više od jednog moda. Primjerice, prema istraživanju o cijeni kave s mlijekom u nekom gradu najčešća cijena takve kave je ili U ovom se slučaju radi o dva podatka koji imaju istu frekvenciju, odnosno dva moda, pa još govorimo o bimodalnoj raspršenosti podataka.
Ako skup ima više od dva moda govorimo o multimodalnoj raspršenosti podataka.
Ne mora svaki skup podataka imati mod. Može se dogoditi da niti jedan podatak u skupu ne dominira, odnosno da se svi podatci pojavljuju isti broj puta.
Uočimo da se mod, ako postoji, uvijek nalazi unutar promatranog skupa podataka.
Pogledajmo sljedeću animaciju.
O pojmu aritmetičke sredine ili prosjeku konačnog skupa brojeva govorili smo već u Modulu 1 (1.6. Primjena).
U matematičkoj se statistici za aritmetičku sredinu koristi oznaka
ili
Ako su podatci zadani kao niz brojeva , aritmetička sredina računa se kao količnik zbroja članova toga niza i broja članova toga skupa, odnosno
Slično se računa i ako su podatci zadani pomoću frekvencija:
Broj |
... | ||||
Frekvencija | ... |
gdje je
Tada aritmetičku sredinu računamo
Kažemo da aritmetička sredina predstavlja ravnotežno mjesto skupa podataka.
Potražite obrazloženje u sljedećoj interakciji.
Ukupno odstupanje podataka koji su iznad aritmetičke sredine uvijek je ukupnom odstupanju podataka koji su ispod aritmetičke sredine. Na grafičkom je prikazu aritmetička sredina mjesto ravnoteže ili točka oko koje je zbroj svih pozitivnih i negativnih odstupanja jednak .
Odredite aritmetičku sredinu podataka o broju golova iz Primjera 1. Interpretirajte rezultat.
Broj je postignutih golova po utakmici u prosjeku veći od
i iznosi
Uočite da aritmetička sredina ne mora biti jedan od podataka iz promatranog uzorka. Ako njezina vrijednost nije cijeli broj, zapisujemo je u decimalnom obliku, čak i u slučaju da se radi o podatcima koji mogu imati samo cjelobrojnu vrijednost.
Obično se zaokružuje na jednu decimalu više nego što je imaju originalni podatci.
Primjer 3.
U tablici su 1. i 2. podatci o prosječnim mjesečnim neto plaćama zaposlenika u tvrtkama A i B. Koju biste tvrtku izabrali za zaposlenje? Koja mjera srednje vrijednosti najbolje opisuje dane podatke?
Sve su vrijednosti izražene u kunama.
Tablica 1. (Tvrtka A)
Tablica 2. (Tvrtka B)
Prema ovim bismo rezultatima trebali zaključiti da je isplativije biti zaposlenik tvrtke A.
No, je li to doista tako?
Uočimo da se u nizu podataka za tvrtku A pojavljuje ekstremna vrijednost, podatak koji znatno odstupa od ostalih. Taj podatak znatno utječe na aritmetičku sredinu. Stoga aritmetička sredina također nije dobra mjera srednje vrijednosti u slučaju tvrtke A.
Takve će podatke puno bolje opisati mjera srednje vrijednosti koju nazivamo medijan.
Medijan je vrijednost koja se u nizu podataka, poredanih po veličini, nalazi točno u sredini. Ako su u sredini dva broja, medijan se računa kao njihova aritmetička sredina.
Primjer 4.
Niz se podataka sastoji od brojeva poredanih po veličini. Odredimo medijan.
Primjer 5.
Niz se podataka sastoji od brojeva poredanih po veličini. Odredimo medijan.
Odredite medijan za podatke o plaćama u tvrtki A i tvrtki B iz Primjera 3. Koju biste sad tvrtku odabrali za zaposlenje?
Medijan za tvrtku A je a za tvrtku B je To znači da polovica svih zaposlenih u tvrtki B ima plaću iznad kuna. Povoljnije je zaposliti se u tvrtki B jer u tvrtki A samo četiri zaposlenika, ili ima plaću iznad te svote.
S obzirom da u tvrtki A jedna osoba ima ekstremno veliku plaću, kao mjeru srednje vrijednosti realnije je koristiti medijan, jer ekstremne vrijednosti nemaju utjecaj na središnju poziciju i vrijednost podatka koji se na njoj nalazi (medijan).
Medijan je vrijednost do koje se nalazi točno svih podataka iz promatranog uzorka, a ostalih se nalazi iza.
Niz podataka moramo uvijek poredati po veličini od najmanjeg prema najvećem kako bismo odredili medijan.
Postupak:
Poredak može biti i od najvećeg prema najmanjem.
Medijan je niza podataka i sam dio toga niza.
Postupak:
Medijan je dio skupa podataka u slučaju da niz ima neparan broj podataka.
Ako se neki niz podataka, poredanih po veličini, sastoji od
brojeva, medijan je
Ako se neki niz podataka, poredanih po veličini, sastoji od
brojeva, medijan je
Ako neki niz ima podataka, vrijednost izraza određuje središnju poziciju tog niza na kojoj se nalazi medijan (za neparan ) ili dvije središnje pozicije (za paran ) brojeva čija je aritmetička sredina medijan.
Sljedeći niz brojeva predstavlja redom mjesečne količine (u
) oborina u Puli za 2016. godinu:
Napišite podatke u redoslijedu pogodnom za određivanje medijana, a zatim odgovorite na pitanja koja slijede neposredno nakon toga.
Koji broj određuje poziciju u nizu na kojoj se nalazi medijan?
Pomoć:
Poziciju određuje broj
Medijan zadanog niza podataka je
Pomoć:
Polovica svih podataka u nizu ima vrijednost ispod medijana.
Na slučajnom uzorku od osoba izvršeno je istraživanje o broju pročitanih knjiga u siječnju. Dobiveni su sljedeći rezultati.
Broj pročitanih knjiga |
Broj osoba koje su ih pročitale (frekvencija) |
---|---|
|
|
Medijan se nalazi između Medijan je . Mod je . Aritmetička sredina je .
Pomoć:
Ako je medijan artmetička sredina 25. i 26. podatka, a na početku niza je
nula i
jedinica, što je ukupno
broja. Slijedi
dvojki, što znači da je medijan jedan od tih brojeva.
Kako bismo lakše odlučili koju od mjera srednje vrijednosti odabrati, dobro je znati njihove prednosti i nedostatke.
Grupirajte glavne prednosti i nedostatke za aritmetičku sredinu.
Grupirajte prednosti i nedostatke medijana.
Grupirajte prednosti i nedostatke moda.
Kupac sa sjevera kontinenta želi kupiti kuću s bazenom u Rovinju. Među kućama oglašenima za prodaju pronašao je kuća koje odgovaraju njegovim zahtjevima. Cijene tih kuća, izražene u eurima, dane su u sljedećoj tablici.
Koja mjera srednje vrijednosti najviše odgovara kupcu, a koja agentu nekretninama?
Mod je
Medijan je
Kupcu odgovara što niža cijena, pa će govoreći o cijenama kuća koristiti medijan, a agentu odgovara što viša cijena pa će koristiti aritmetičku sredinu.
Broj koncerata (događanja) tijekom 2017. godine u velikoj dvorani KD "Vatroslav Lisinski", dan je tablicom:
Mjesec | Broj koncerata (događanja) |
---|---|
Siječanj | |
Veljača | |
Ožujak | |
Travanj | |
Svibanj | |
Lipanj | |
Srpanj | |
Kolovoz | |
Rujan | |
Listopad | |
Studeni | |
Prosinac |
Uparite aritmetičku sredinu, medijan i mod s pripadajućim vrijednostima za dani skup podataka.
Mod
|
i |
Medijan
|
|
Aritmetička sredina
|
Prodiskutirajte svaku mjeru srednje vrijednosti iz prethodnog primjera.
Statistička je obrada podataka prisutna u svim područjima ljudskog života i koristi veliku količinu različitih podataka. Prikazivanje, razni izračuni i analiza tih podataka bilo bi jako sporo i neprecizno, gotovo nemoguće bez korištenja tehnologije. Postoji mnoštvo alata s proračunskim tablicama koji se mogu koristiti putem računala, pametnih telefona, ali i džepnih računala. Dovoljno je upisati prikupljene podatke u tablicu, a zatim odabirom željenog prikaza, analize ili samo neke od funkcija računalo u nekoliko sekundi prikaže sve što nam treba na ekranu.
Pogledajmo kako to izgleda u GeoGebrinoj interakciji.
Koristeći dani applet (ili bilo koje proračunske tablice ili grafičko računalo), upišite sljedeće podatke o postignutom broju bodova na godišnjoj provjeri znanja u jednoj gimnaziji.
Postignuti broj bodova (maksimum = 22) | Broj učenika |
---|---|
Pomoću ponuđenih alata odredite mod, aritmetičku sredinu i medijan. Interpretirajte dobivene rezultate, kao da pišete izvještaj o rezultatima godišnjeg ispita.
Razmislite i prodiskutirajte o situacijama u kojima ćete koristiti aritmetičku sredinu, medijan, odnosno mod, kao mjeru koja najbolje reprezentira podatke vezane?
Odaberite jednu od situacija o kojima ste diskutirali te prikupite potrebne podatke. Prikažite ih pogodnim dijagramom, grafom, a zatim odredite aritmetičku sredinu, mod i medijan.
Interpretirajte i obrazložite svaku od odabranih mjera srednje vrijednosti. Prezentirajte u razredu.
Uparite mjeru srednje vrijednosti s njezinim opisom.
Mode
|
Podatak s najvećom frekvencijom. |
Medijan
|
Središnji podatak u nizu poredanih podataka. |
Aritmetička sredina
|
Zbroj svih vrijednosti podataka podijeljen s ukupnim brojem podataka. |
Podatci s ekstremnim vrijednostima ne utječu na
Srednja vrijednost koja se uvijek nalazi među podatcima je
Odredite aritmetičku sredinu, mod i medijan skupa
Medijan | |
Aritmetička sredina | |
Mod |
Broj izlazaka | ||||||||
Broj učenika |
Aritmetička sredina skupa od
podataka iznosi
a mod je
Podatci su
gdje je
Tada je
U tablici su dani podatci o broju novorođenčadi po tjednima za razdoblje od godinu dana u jednoj lokalnoj bolnici.
Broj novorođenih | ||||||||
Broj tjedana |
Cijene rada u kunama po satu za sedam anketiranih studenata su:
Medijan je | |
Mod je |
Koja mjera srednje vrijednosti najbolje reprezentira tipičnu cijenu sata iz prethodnog zadatka?