Andrea je
dana mjerila za koliko minuta javnim prijevozom stigne u školu. Vremena zaokružena na minute prikazana su u tablici frekvencija.
Vrijeme u minutama
Frekvencija
Nakon toga je odlučila kretati
minuta ranije od kuće, jer je, navodno, manja gužva pa bi trebala brže stići u školu. Ponovno je
dana mjerila vrijeme i zabilježila sljedeća vremena.
Vrijeme u minutama
Frekvencija
Što pokazuju Andreina mjerenja?
Uspoređivanje podataka pomoću mjera srednje vrijednosti
Andrei je u prvih dvadeset dana mjerenja trebalo prosječno
minuta da stigne u školu, a kad je kretala
minuta ranije, trebalo joj je prosječno
minuta.
null
null
Iz toga možemo zaključiti da se prosječno vrijeme putovanja skratilo za
od
minute.
null
null
Medijan vremena putovanja u školu na početku mjerenja iznosi
minutu, a medijan vremena nakon što je ranije kretala u školu iznosi
minutu.
null
null
Uspoređujući medijane, zaključujemo da je vrijeme putovanja .
null
null
U oba slučaja mod podataka iznosi
.
null
null
Što biste odgovorili na pitanje je li se vrijeme putovanja skratilo ili nije?
Često smo u prilici podatke interpretirati ovisno o kontekstu problema ili ovisno kome ćemo ih prezentirati. Na ovome primjeru, ako nekome želimo pokazati da se isplati krenuti ranije, koristit ćemo srednju vrijednost. U suprotnome ćemo pomoću medijana ili moda dokazati da to nije točno.
Primjer 1.
Dva košarkaša Gordan i Filip u proteklih su
utakmica postigli sljedeći broj koševa:
Broj utakmice
Gordan
Filip
Koji je od ova dva košarkaša bolji strijelac?
Kako ćemo to odlučiti? Na temelju kojih podataka?
Izračunajmo aritmetičke sredine njihovih rezultata.
Vidimo da su iste. Prema tome su kriteriju oni jednako dobri strijelci.
Gledajući pak mod, rezultat koji je najčešći, za Gordana on iznosi
a za Filipa
zaključujemo da je Filip bolji strijelac.
Dakle, na temelju triju različitih mjera srednje vrijednosti došli smo do triju različitih zaključaka.
Tko je bolji strijelac? Razmislite i opišite situaciju kada ćemo koristiti koju mjeru srednje vrijednosti kao argument.
Ako želimo predvidjeti koliko će koji igrač dati koševa u sljedećoj utakmici, koristit ćemo se modom. Ako pogađamo broj najbliži broju koševa koje će igrači postići u sljedećoj utakmici, koristit ćemo se aritmetičkom sredinom. Ako gledamo koliko koševa trebamo dati u sljedećoj utakmici kako bi nam izgledi da budemo bolji bili veći od
taj broj je medijan, točnije medijan
U situaciji kada dva skupa istovrsnih podataka želimo prikazati dijagramom stablo - list, smjestit ćemo ih u obostrani dijagram stablo - list.
Pogledajmo u animaciji kako ćemo ga konstruirati.
Pogledajmo sljedeći primjer.
Zadatak 1.
Biolozi su istraživali populaciju kuna zlatica i kuna bjelica te su izmjerili duljine po 20 jedinki svake vrste. Sljedeći obostrani dijagram stablo - list prikazuje rezultate.
Ako duljine kuna uspoređujemo računajući aritmetičku sredinu podataka, zaključujemo da su kune
dulje. Ako duljine kuna uspoređujemo računajući medijan, zaključujemo da su kune
dulje.
null
null
Zadatak 2.
Paralelnim brkatim kutijama prikazana su mjesta koja su osvajale ekipe Hrvatske i Francuske na međunarodnim matematičkim olimpijadama od 1993. do 2017. godine.
Uspoređujući medijane podataka, vidimo da je Francuska općenito za
mjesta uspješnija od Hrvatske. Najbolji rezultat Hrvatske bilo je
. mjesto, a najbolji rezultat Francuske
. mjesto.
Najboljih
plasmana Hrvatske bolje je od
. mjesta, a
najboljih plasmana Francuske bolje
je
od
. mjesta.
null
null
Uspoređivanje podataka s pomoću standardne devijacije
Primjer 2.
U tvornici žarulja testira se vijek trajanja dviju vrsta žarulja, A i B. Provedeno je mjerenje na uzorku od
žarulja svake vrste i dobiveni su rezultati prikazani u tablici.
Vrijeme trajanja u satima
Frekvencija žarulja vrste A
Frekvencija žarulja vrste B
Koja je od ovih dviju vrsta žarulja pouzdanija?
Nacrtajmo poligone frekvencija za obje vrste žarulja.
Uočimo da su oba poligona približno simetrična pa će aritmetičke sredine biti negdje u sredini podataka. Izračunajmo ih.
Aritmetičke sredine i rasponi podataka gotovo su jednaki.
Izračunajmo standardne devijacije da vidimo koliko je srednje odstupanje podataka od aritmetičke sredine.
Žarulje vrste A imaju značajno manju standardnu devijaciju od žarulja vrste B. To znači da više žarulja vrste A ima vijek trajanja bliži aritmetičkoj sredini i da će manje žarulja vrste A pregorjeti u kraćem vremenu nego žarulja vrste B.
Žarulje vrste A pouzdanije su.
To se može potvrditi i na poligonu frekvencija: jedna žarulja vrste A pregorjela je za manje od
sati, a čak je šest žarulja vrste B pregorjelo za isto vrijeme.
Uspoređivanje podataka s pomoću srednje vrijednosti i standardne devijacije
U prošlome smo primjeru uspoređivali raspršenost podataka s pomoću standardne devijacije. Do istoga smo zaključka došli gledajući poligon frekvancija, dakle gledali smo očite razlike. Međutim, koristeći se srednjom vrijednosti u kombinaciji sa standardnom devijacijom možemo doći do detaljnije analize podataka.
Možemo odrediti koji se udio podataka nalazi u intervalu "aritmetička sredina
jedna standardna devijacija". Tako ćemo vidjeti raspršenost podataka oko aritmetičke sredine.
Primjer 3.
Učenici 1.e razreda pisali su test u kojemu je bilo maksimalno
bodova. Srednja vrijednost ostvarenih bodova u testu bila je
bodova, a standardna devijacija
bodova. Najmanji broj ostvarenih bodova jest
a najveći
Pregledom rezultata utvrđeno je da
učenika ima bodove u intervalu od
do
odnosno "aritmetička sredina
jedna standardna devijacija".
Otprilike mjesec dana poslije učenici su pisali sličan test s istim brojem maksimalnih bodova. Ovaj je put srednja vrijednost bila
bodova, raspon bodova od
do
a standardna devijacija ista kao i prvi put,
bodova. U intervalu od
do
bodova ("
") našlo se
učenika.
Što možemo zaključiti?
Srednja vrijednost postignutih bodova za
boda veća je na ponovljenom testu. Taj podatak nije pouzdan pokazatelj, test je možda bio jednostavniji. Raspon je bodova isti. Ako gledamo udio učenika s bodovima u intervalu
vidimo da u ponovljenu testu više učenika ima bodove bliže aritmetičkoj sredini nego u prvome testu.
Ovakva vrsta usporedbe podataka mogla bi se koristiti pri istraživanju tržišta za prodaju obuće ili odjeće. Razumno je očekivati da su u različitim dijelovima svijeta različite prosječne veličine koju populacija nosi. Bilo bi smisleno odrediti aritmetičku sredinu i udio stanovništva unutar intervala "aritmetička sredina
jedna standardna devijacija" za svako tržište.
...i na kraju
Ako se želite još malo pozabaviti statistikom, posjetite stranice Statističke olimpijade.
PROCIJENITE SVOJE ZNANJE
1
U tvornici za proizvodnju organskih gnojiva testirali su novi proizvod. Na jednoj su gredici uzgajali rajčice koje nisu ničim tretirali, a na drugoj su upotrijebili novo organsko gnojivo. Nasumično je izabrano po
biljaka i zabilježeno koliko je kilograma uroda bilo na svakoj od njih. Rezultati su prikazani u tablici.
kg rajčica bez gnojiva
kg rajčica s gnojivom
Što od navedenoga vrijedi za ove podatke?
null
null
2
Paralelne brkate kutije prikazuju rezultate (u minutama) dviju skupina učenika u utrci na
metara.
Najbržih
dječaka trči brže od
djevojaka. Najbržih
djevojaka trči brže od
dječaka.
null
null
3
U rodilištu su jedan dan izmjerene težine (u kg) desetero novorođenčadi:
Nakon
mjeseci njihove su se težine utrostručile. Izračunajte aritmetičku sredinu i standardnu devijaciju težina pri porodu i nakon godinu dana. Aritmetička sredina težina novorođenčadi nakon
mjeseci se u odnosu na dan rođenja , a standardna devijacija težina novorođenčadi nakon
mjeseci se u odnosu na dan rođenja .
null
null
4
Na sjednici je analiziran broj izostanaka učenika 3. i 4. razreda. Podatci su prikazani histogramima.
Što možete zaključiti iz oblika dijagrama?
null
null
5
U dva su grada mjerene temperature u
tijekom
dana. Grad A:
Grad B:
Standardna devijacija temperatura u gradu A iznosi