Andrea je
20 dana mjerila za koliko minuta javnim prijevozom stigne u školu. Vremena zaokružena na minute prikazana su u tablici frekvencija.
Vrijeme u minutama
38
39
40
41
42
43
44
Frekvencija
1
1
2
8
2
3
3
Nakon toga je odlučila kretati
10 minuta ranije od kuće, jer je, navodno, manja gužva pa bi trebala brže stići u školu. Ponovno je
20 dana mjerila vrijeme i zabilježila sljedeća vremena.
Vrijeme u minutama
38
39
40
41
42
43
45
Frekvencija
5
3
1
7
2
1
1
Što pokazuju Andreina mjerenja?
Uspoređivanje podataka pomoću mjera srednje vrijednosti
Andrei je u prvih dvadeset dana mjerenja trebalo prosječno
minuta da stigne u školu, a kad je kretala
10 minuta ranije, trebalo joj je prosječno
minuta.
null
null
Iz toga možemo zaključiti da se prosječno vrijeme putovanja skratilo za
od
1 minute.
null
null
Medijan vremena putovanja u školu na početku mjerenja iznosi
minutu, a medijan vremena nakon što je ranije kretala u školu iznosi
minutu.
null
null
Uspoređujući medijane, zaključujemo da je vrijeme putovanja .
null
null
U oba slučaja mod podataka iznosi
.
null
null
Što biste odgovorili na pitanje je li se vrijeme putovanja skratilo ili nije?
Često smo u prilici podatke interpretirati ovisno o kontekstu problema ili ovisno kome ćemo ih prezentirati. Na ovome primjeru, ako nekome želimo pokazati da se isplati krenuti ranije, koristit ćemo srednju vrijednost. U suprotnome ćemo pomoću medijana ili moda dokazati da to nije točno.
Primjer 1.
Dva košarkaša Gordan i Filip u proteklih su
5 utakmica postigli sljedeći broj koševa:
Broj utakmice
Gordan
Filip
1.
13
11
2.
0
14
3.
15
10
4.
27
9
5.
0
11
Koji je od ova dva košarkaša bolji strijelac?
Kako ćemo to odlučiti? Na temelju kojih podataka?
Izračunajmo aritmetičke sredine njihovih rezultata.
ˉxG=13+0+15+27+05=11
ˉxF=11+14+10+9+115=11
Vidimo da su iste. Prema tome su kriteriju oni jednako dobri strijelci.
Izračunajmo medijane podataka.
Nakon što smo podatke poredali
Gordanovi rezultati:
0,0,13,15,27
Filipovi rezultati:
9,10,11,11,14
uočimo da medijan za Gordana iznosi
13, a za Filipa
11.
Po tome je kriteriju Gordan bolji strijelac.
Gledajući pak mod, rezultat koji je najčešći, za Gordana on iznosi
0, a za Filipa
11, zaključujemo da je Filip bolji strijelac.
Dakle, na temelju triju različitih mjera srednje vrijednosti došli smo do triju različitih zaključaka.
Tko je bolji strijelac? Razmislite i opišite situaciju kada ćemo koristiti koju mjeru srednje vrijednosti kao argument.
Ako želimo predvidjeti koliko će koji igrač dati koševa u sljedećoj utakmici, koristit ćemo se modom. Ako pogađamo broj najbliži broju koševa koje će igrači postići u sljedećoj utakmici, koristit ćemo se aritmetičkom sredinom. Ako gledamo koliko koševa trebamo dati u sljedećoj utakmici kako bi nam izgledi da budemo bolji bili veći od 50%, taj broj je medijan, točnije medijan+1.
U situaciji kada dva skupa istovrsnih podataka želimo prikazati dijagramom stablo - list, smjestit ćemo ih u obostrani dijagram stablo - list.
Pogledajmo u animaciji kako ćemo ga konstruirati.
Pogledajmo sljedeći primjer.
Zadatak 1.
Kuna zlatica
Biolozi su istraživali populaciju kuna zlatica i kuna bjelica te su izmjerili duljine po 20 jedinki svake vrste. Sljedeći obostrani dijagram stablo - list prikazuje rezultate.
Ako duljine kuna uspoređujemo računajući aritmetičku sredinu podataka, zaključujemo da su kune
dulje. Ako duljine kuna uspoređujemo računajući medijan, zaključujemo da su kune
dulje.
null
null
Zadatak 2.
Paralelnim brkatim kutijama prikazana su mjesta koja su osvajale ekipe Hrvatske i Francuske na međunarodnim matematičkim olimpijadama od 1993. do 2017. godine.
Uspoređujući medijane podataka, vidimo da je Francuska općenito za
mjesta uspješnija od Hrvatske. Najbolji rezultat Hrvatske bilo je
. mjesto, a najbolji rezultat Francuske
. mjesto.
Najboljih
50% plasmana Hrvatske bolje je od
. mjesta, a
50% najboljih plasmana Francuske bolje
je
od
. mjesta.
null
null
Uspoređivanje podataka s pomoću standardne devijacije
Primjer 2.
U tvornici žarulja testira se vijek trajanja dviju vrsta žarulja, A i B. Provedeno je mjerenje na uzorku od
50 žarulja svake vrste i dobiveni su rezultati prikazani u tablici.
Vrijeme trajanja u satima
Frekvencija žarulja vrste A
Frekvencija žarulja vrste B
50
1
2
150
1
6
200
8
9
300
14
8
450
14
9
500
10
7
650
1
6
750
1
3
Koja je od ovih dviju vrsta žarulja pouzdanija?
Nacrtajmo poligone frekvencija za obje vrste žarulja.
Uočimo da su oba poligona približno simetrična pa će aritmetičke sredine biti negdje u sredini podataka. Izračunajmo ih.
Aritmetičke sredine i rasponi podataka gotovo su jednaki.
Izračunajmo standardne devijacije da vidimo koliko je srednje odstupanje podataka od aritmetičke sredine.
sA=136.47,sB=193.43
Žarulje vrste A imaju značajno manju standardnu devijaciju od žarulja vrste B. To znači da više žarulja vrste A ima vijek trajanja bliži aritmetičkoj sredini i da će manje žarulja vrste A pregorjeti u kraćem vremenu nego žarulja vrste B.
Žarulje vrste A pouzdanije su.
To se može potvrditi i na poligonu frekvencija: jedna žarulja vrste A pregorjela je za manje od
150 sati, a čak je šest žarulja vrste B pregorjelo za isto vrijeme.
Uspoređivanje podataka s pomoću srednje vrijednosti i standardne devijacije
U prošlome smo primjeru uspoređivali raspršenost podataka s pomoću standardne devijacije. Do istoga smo zaključka došli gledajući poligon frekvancija, dakle gledali smo očite razlike. Međutim, koristeći se srednjom vrijednosti u kombinaciji sa standardnom devijacijom možemo doći do detaljnije analize podataka.
Možemo odrediti koji se udio podataka nalazi u intervalu "aritmetička sredina
± jedna standardna devijacija". Tako ćemo vidjeti raspršenost podataka oko aritmetičke sredine.
Primjer 3.
Učenici 1.e razreda pisali su test u kojemu je bilo maksimalno
20 bodova. Srednja vrijednost ostvarenih bodova u testu bila je
ˉx=13.4 bodova, a standardna devijacija
s=3.6 bodova. Najmanji broj ostvarenih bodova jest
5, a najveći
20. Pregledom rezultata utvrđeno je da
64% učenika ima bodove u intervalu od
10 do
17, odnosno "aritmetička sredina
± jedna standardna devijacija".
Otprilike mjesec dana poslije učenici su pisali sličan test s istim brojem maksimalnih bodova. Ovaj je put srednja vrijednost bila
ˉx=14.6 bodova, raspon bodova od
5 do
20, a standardna devijacija ista kao i prvi put,
s=3.6 bodova. U intervalu od
11 do
18 bodova ("
ˉx±1s") našlo se
75% učenika.
Što možemo zaključiti?
Srednja vrijednost postignutih bodova za
1.2 boda veća je na ponovljenom testu. Taj podatak nije pouzdan pokazatelj, test je možda bio jednostavniji. Raspon je bodova isti. Ako gledamo udio učenika s bodovima u intervalu
ˉx±1s, vidimo da u ponovljenu testu više učenika ima bodove bliže aritmetičkoj sredini nego u prvome testu.
Ovakva vrsta usporedbe podataka mogla bi se koristiti pri istraživanju tržišta za prodaju obuće ili odjeće. Razumno je očekivati da su u različitim dijelovima svijeta različite prosječne veličine koju populacija nosi. Bilo bi smisleno odrediti aritmetičku sredinu i udio stanovništva unutar intervala "aritmetička sredina
± jedna standardna devijacija" za svako tržište.
...i na kraju
Ako se želite još malo pozabaviti statistikom, posjetite stranice Statističke olimpijade.
PROCIJENITE SVOJE ZNANJE
1
U tvornici za proizvodnju organskih gnojiva testirali su novi proizvod. Na jednoj su gredici uzgajali rajčice koje nisu ničim tretirali, a na drugoj su upotrijebili novo organsko gnojivo. Nasumično je izabrano po
10 biljaka i zabilježeno koliko je kilograma uroda bilo na svakoj od njih. Rezultati su prikazani u tablici.
kg rajčica bez gnojiva
8
7
8
9
5
8
9
8
9
5
kg rajčica s gnojivom
11
10
6
6
7
10
7
8
6
9
Što od navedenoga vrijedi za ove podatke?
null
null
2
Paralelne brkate kutije prikazuju rezultate (u minutama) dviju skupina učenika u utrci na
1500 metara.
Najbržih
25% dječaka trči brže od
% djevojaka. Najbržih
50% djevojaka trči brže od
% dječaka.
null
null
3
U rodilištu su jedan dan izmjerene težine (u kg) desetero novorođenčadi:
2.3,2.6,3.8,3.4,4.2,3.4,3.1,2.9,3.1,3.8. Nakon
12 mjeseci njihove su se težine utrostručile. Izračunajte aritmetičku sredinu i standardnu devijaciju težina pri porodu i nakon godinu dana. Aritmetička sredina težina novorođenčadi nakon
12 mjeseci se u odnosu na dan rođenja , a standardna devijacija težina novorođenčadi nakon
12 mjeseci se u odnosu na dan rođenja .
null
null
4
Na sjednici je analiziran broj izostanaka učenika 3. i 4. razreda. Podatci su prikazani histogramima.
Što možete zaključiti iz oblika dijagrama?
null
null
5
U dva su grada mjerene temperature u
° tijekom
dana. Grad A:
Grad B:
Standardna devijacija temperatura u gradu A iznosi