x
Učitavanje

10.5 Uspoređivanje i Interpretacija podataka

Europska unija, Zajedno do fondova EU
Sadržaj jedinice
Povećanje slova
Smanjenje slova
Početna veličina slova Početna veličina slova
Visoki kontrast
a Promjena slova
  • Verdana
  • Georgia
  • Dyslexic
  • Početni
Upute za korištenje

Na početku...

tramvaj

Andrea je 20 dana mjerila za koliko minuta javnim prijevozom stigne u školu. Vremena zaokružena na minute prikazana su u tablici frekvencija.

Vrijeme u minutama
38 39 40 41 42 43 44
Frekvencija 1 1 2 8 2 3 3

Nakon toga je odlučila kretati 10 minuta ranije od kuće, jer je, navodno, manja gužva pa bi trebala brže stići u školu. Ponovno je 20 dana mjerila vrijeme i zabilježila sljedeća vremena.

Vrijeme u minutama 38 39 40 41 42 43 45
Frekvencija 5 3 1 7 2 1 1

Što pokazuju Andreina mjerenja?

Uspoređivanje podataka pomoću mjera srednje vrijednosti

Andrei je u prvih dvadeset dana mjerenja trebalo prosječno minuta da stigne u školu, a kad je kretala 10 minuta ranije, trebalo joj je prosječno  minuta.
null
null

Iz toga možemo zaključiti da se prosječno vrijeme putovanja skratilo za od 1 minute.

null
null
Medijan vremena putovanja u školu na početku mjerenja iznosi minutu, a medijan vremena nakon što je ranije kretala u školu iznosi minutu.
null
null

Uspoređujući medijane, zaključujemo da je vrijeme putovanja .

null
null
U oba slučaja mod podataka iznosi .
null
null

Što biste odgovorili na pitanje je li se vrijeme putovanja skratilo ili nije?

Često smo u prilici podatke interpretirati ovisno o kontekstu problema ili ovisno kome ćemo ih prezentirati. Na ovome primjeru, ako nekome želimo pokazati da se isplati krenuti ranije, koristit ćemo srednju vrijednost. U suprotnome ćemo pomoću medijana ili moda dokazati da to nije točno.

Primjer 1.

Dva košarkaša Gordan i Filip u proteklih su  5 utakmica postigli sljedeći broj koševa:

Broj utakmice
Gordan Filip
1 . 13 11
2 . 0 14
3 . 15 10
4 . 27 9
5 . 0 11

Koji je od ova dva košarkaša bolji strijelac?

Kako ćemo to odlučiti? Na temelju kojih podataka?

Izračunajmo aritmetičke sredine njihovih rezultata.

x ¯ G = 13 + 0 + 15 + 27 + 0 5 = 11

x ¯ F = 11 + 14 + 10 + 9 + 11 5 = 11

Vidimo da su iste. Prema tome su kriteriju oni jednako dobri strijelci.

Izračunajmo medijane podataka.

Nakon što smo podatke poredali

Gordanovi rezultati: 0 , 0 , 13 , 15 , 27

Filipovi rezultati: 9 , 10 , 11 , 11 , 14

uočimo da medijan za Gordana iznosi 13 , a za Filipa 11 .

Po tome je kriteriju Gordan bolji strijelac.

Gledajući pak mod, rezultat koji je najčešći, za Gordana on iznosi 0 , a za Filipa 11,  zaključujemo da je Filip bolji strijelac.

Dakle, na temelju triju različitih mjera srednje vrijednosti došli smo do triju različitih zaključaka.

Tko je bolji strijelac? Razmislite i opišite situaciju kada ćemo koristiti koju mjeru srednje vrijednosti kao argument.

Ako želimo predvidjeti koliko će koji igrač dati koševa u sljedećoj utakmici, koristit ćemo se modom. Ako pogađamo broj najbliži broju koševa koje će igrači postići u sljedećoj utakmici, koristit ćemo se aritmetičkom sredinom. Ako gledamo koliko koševa trebamo dati u sljedećoj utakmici kako bi nam izgledi da budemo bolji bili veći od 50 % , taj broj je medijan, točnije medijan + 1 .


U situaciji kada dva skupa istovrsnih podataka želimo prikazati dijagramom stablo - list, smjestit ćemo ih u obostrani dijagram stablo - list.

Pogledajmo u animaciji kako ćemo ga konstruirati.

Pogledajmo sljedeći primjer.

Zadatak 1.

Kuna
Kuna zlatica

Biolozi su istraživali populaciju kuna zlatica i kuna bjelica te su izmjerili duljine po 20 jedinki svake vrste. Sljedeći obostrani dijagram stablo - list prikazuje rezultate.

Obostrani dijagram stablo-list
Ako duljine kuna uspoređujemo računajući aritmetičku sredinu podataka, zaključujemo da su kune  dulje. Ako duljine kuna uspoređujemo računajući medijan, zaključujemo da su kune  dulje.

null
null

Zadatak 2.

Paralelnim brkatim kutijama prikazana su mjesta koja su osvajale ekipe Hrvatske i Francuske na međunarodnim matematičkim olimpijadama od 1993. do 2017. godine.
Paralelne brkate kutije
Uspoređujući medijane podataka, vidimo da je Francuska općenito za mjesta uspješnija od Hrvatske. Najbolji rezultat Hrvatske bilo je  . mjesto, a najbolji rezultat Francuske  . mjesto.
Najboljih 50 % plasmana Hrvatske bolje je od . mjesta, a 50 % najboljih plasmana Francuske bolje je od  . mjesta.
null
null

Uspoređivanje podataka s pomoću standardne devijacije

Primjer 2.

Žarulja

U tvornici žarulja testira se vijek trajanja dviju vrsta žarulja, A i B. Provedeno je mjerenje na uzorku od 50 žarulja svake vrste i dobiveni su rezultati prikazani u tablici.

Vrijeme trajanja u satima Frekvencija žarulja vrste A Frekvencija žarulja vrste B
50 1 2
150 1 6
200 8 9
300 14 8
450 14 9
500 10 7
650 1 6
750 1 3

Koja je od ovih dviju vrsta žarulja pouzdanija​?

Poligon frekvencija

Nacrtajmo poligone frekvencija za obje vrste žarulja.

Uočimo da su oba poligona približno simetrična pa će aritmetičke sredine biti negdje u sredini podataka. Izračunajmo ih.

x ¯ A = 50 + 150 + 8 · 200 + 14 · 300 + 14 · 450 + 10 · 500 + 650 + 750 50 = 374

x ¯ B = 2 · 50 + 6 · 150 + 9 · 200 + 8 · 300 + 9 · 450 + 7 · 500 + 6 · 650 + 3 · 750 50 = 378

Aritmetičke sredine i rasponi podataka gotovo su jednaki.

Izračunajmo standardne devijacije da vidimo koliko je srednje odstupanje podataka od aritmetičke sredine.

s A = 136.47 , s B = 193.43

Žarulje vrste A imaju značajno manju standardnu devijaciju od žarulja vrste B. To znači da više žarulja vrste A ima vijek trajanja bliži aritmetičkoj sredini i da će manje žarulja vrste A pregorjeti u kraćem vremenu nego žarulja vrste B.

Žarulje vrste A pouzdanije su.

To se može potvrditi i na poligonu frekvencija: jedna žarulja vrste A pregorjela je za manje od 150 sati, a čak je šest žarulja vrste B pregorjelo za isto vrijeme.

Uspoređivanje podataka s pomoću srednje vrijednosti i standardne devijacije

U prošlome smo primjeru uspoređivali raspršenost podataka s pomoću standardne devijacije. Do istoga smo zaključka došli gledajući poligon frekvancija, dakle gledali smo očite razlike. Međutim, koristeći se srednjom vrijednosti u kombinaciji sa standardnom devijacijom možemo doći do detaljnije analize podataka.

Možemo odrediti koji se udio podataka nalazi u intervalu "aritmetička sredina ± jedna standardna devijacija". Tako ćemo vidjeti raspršenost podataka oko aritmetičke sredine.

Primjer 3.

Učenici 1.e razreda pisali su test u kojemu je bilo maksimalno 20 bodova. Srednja vrijednost ostvarenih bodova u testu bila je x ¯ = 13.4 bodova, a standardna devijacija s = 3.6 bodova. Najmanji broj ostvarenih bodova jest  5 , a najveći 20 . Pregledom rezultata utvrđeno je da 64 % učenika ima bodove u intervalu od 10 do 17 , odnosno "aritmetička sredina ± jedna standardna devijacija".

Otprilike mjesec dana poslije učenici su pisali sličan test s istim brojem maksimalnih bodova. Ovaj je put srednja vrijednost bila x ¯ = 14.6 bodova, raspon bodova od 5 do 20 , a standardna devijacija ista kao i prvi put, s = 3.6 bodova. U intervalu od 11 do 18 bodova (" x ¯ ± 1 s ") našlo se 75 % učenika.

Što možemo zaključiti?

Srednja vrijednost postignutih bodova za 1.2 boda veća je na ponovljenom testu. Taj podatak nije pouzdan pokazatelj, test je možda bio jednostavniji. Raspon je bodova isti. Ako gledamo udio učenika s bodovima u intervalu x ¯ ± 1 s, vidimo da u ponovljenu testu više učenika ima bodove bliže aritmetičkoj sredini nego u prvome testu.

Različite veličine cipela

Ovakva vrsta usporedbe podataka mogla bi se koristiti pri istraživanju tržišta za prodaju obuće ili odjeće. Razumno je očekivati da su u različitim dijelovima svijeta različite prosječne veličine koju populacija nosi. Bilo bi smisleno odrediti aritmetičku sredinu i udio stanovništva unutar intervala "aritmetička sredina ± jedna standardna devijacija" za svako tržište.

...i na kraju

Ako se želite još malo pozabaviti statistikom, posjetite stranice Statističke olimpijade.

PROCIJENITE SVOJE ZNANJE

1

U tvornici za proizvodnju organskih gnojiva testirali su novi proizvod. Na jednoj su gredici uzgajali rajčice koje nisu ničim tretirali, a na drugoj su upotrijebili novo organsko gnojivo. Nasumično je izabrano po 10 biljaka i zabilježeno koliko je kilograma uroda bilo na svakoj od njih. Rezultati su prikazani u tablici.

kg rajčica bez gnojiva 8 7 8 9 5 8 9 8 9 5
kg rajčica s gnojivom 11 10 6 6 7 10 7 8 6 9

Što od navedenoga vrijedi za ove podatke?

null
null
2
Paralelne brkate kutije prikazuju rezultate (u minutama) dviju skupina učenika u utrci na  1 500 metara.
Paralelna brkata kutija

Najbržih 25 % dječaka trči brže od    % djevojaka. Najbržih 50 % djevojaka trči brže od % dječaka.
null
null
3

U rodilištu su jedan dan izmjerene težine (u kg) desetero novorođenčadi: 2.3 , 2.6 , 3.8 , 3.4 , 4.2 , 3.4 , 3.1 , 2.9 , 3.1 , 3.8 .
Nakon 12 mjeseci njihove su se težine utrostručile. Izračunajte aritmetičku sredinu i standardnu devijaciju težina pri porodu i nakon godinu dana.
Aritmetička sredina težina novorođenčadi nakon 12 mjeseci se u odnosu na dan rođenja , a standardna devijacija težina novorođenčadi nakon 12 mjeseci se u odnosu na dan rođenja .

null
null
4

Na sjednici je analiziran broj izostanaka učenika 3. i 4. razreda. Podatci su prikazani histogramima.

Histogram izostanak 4. razreda
Histogram izostanak 3. razreda

Što možete zaključiti ​iz oblika dijagrama?

null
null
5

U dva su grada mjerene temperature u ° C tijekom 10 dana.
Grad A: 19 , 21 , 22 , 22 , 23 , 23 , 24 , 25 , 25 , 26
Grad B: 20 , 25 , 26 , 18 , 23 , 13 , 16 , 26 , 18 , 15 .
Standardna devijacija temperatura u gradu A iznosi

 
° C , a u gradu B iznosi
 
° C .
Temperature su stabilnije u gradu
 
nego u gradu
 
.  

4.52
A
B
2

null
null
ZAVRŠITE PROCJENU