Kumpi auto on parempi

Julkaistu  01.04.2015    Kirjoittanut     Tilaa RSS

Käytännön ongelman ratkaiseminen Six Sigman avulla


Johdanto

4-vuotias Joonas on saanut uuden autoradan, jossa on silmukka ja kaksi autoa. Hän haluaa tietää kumpi autoista, punainen vai vihreä on parempi. Joonas ei vielä ole opiskellut tilastotiedettä, mutta Joonas tietää isän puheiden perusteella, että Six Sigmassa käytännön ongelma "käännetään" tilastomatemaattiseksi ongelmaksi ja vastaavasti tilastomatemaattinen ongelman ratkaisu käytännön ongelman ratkaisuksi (Kuva 1)/5/.

Ratkaisustrategia.jpg
Kuva 1
. Six Sigman ongelmanratkaisusrategia/5/.

Joonas tietää isänsä opiskelleen tilastomatematiikkaa ja Six Sigmaa. Joonas päättääkin kysyä isältään, miten hän voisi ongelmansa ratkaista. Isä ja Joonas miettivät yhdessä, millainen auto on parempi. Joonaksen mielestä auto, joka kulkee pidemmän matkan autoradan jälkeen, on parempi. Tämän perusteella Joonas ja isä suunnittelevat testin ja analysoivat testin perusteella saatavaa dataa, saadakseen käytännön ongelman ratkaistua.

Datan keruu

Saadakseen dataa isän analyysejä varten Joonas "ampuu" kummankin auton 20 kertaa autoradalle ja mittaa auton radan jälkeen kulkeman matkan. Näiden matkadatojen perusteella on mahdollista selvittää autojen välinen paremmuus. Datankeruuprosessi on esitetty alla olevassa videossa.

Teoriaa

Edellä kuvatulla tavalla saatu aineisto muodostaa kaksi toisistaan riippumatonta otosta ja ovat kvantitatiivisia mittauksia kahdesta osapopulaatiosta, joita halutaan verrata toisiinsa. Tällaisessa tilanteessa vertailuun voidaan käyttää kahden otoksen t-testiä./7/

Kahden otoksen t-testi olettaa, että verrattavat otokset ovat normaalijakautuneita (Walpole, Myers, Myers ja Ye 2002; Grönroos 2003). Otosten normaalijakautuneisuus voidaan helposti testata käyttämällä esimerkiksi Anderson-Darling normaalisuustestiä. Anderson-Darling -testi kertoo, miten hyvin data noudattaa jotakin määriteltyä jakaumaa/1/.

proplot.jpg
Kuva 2
. Autodatojen normaalijakautuneisuuden testaaminen.

Kuvasta 2 huomataan, että autodatojen Anderson-Darling –testin p-arvot ovat isot (>0,05), joten datojen voidaan olettaa noudattavan normaalijakaumaa.

Kahden otoksen t-testi olettaa myös, että vertailtavien datojen varianssien on oltava yhtäsuuret. Varianssien yhtäsuuruuden testaamiseen voidaan käyttää esimerkiksi Bartlettin- testiä tai Levenen –testiä./4/ Bartlettin –testi olettaa, että verrattavat datat ovat normaalijakautuneita/2/. Levenen –testi ei oleta datojen normaalijakautuneisuutta datojen on ainoastaan oltava jatkuvia/6/. Bartlettin –testin ja Levenen –testin hypoteesit voidaan kirjoittaa seuraavalla tavalla/3/ /7/.

H0: σ12 = σ22
H112 ≠ σ22

varianssitesti.jpg
Kuva 3
. Autodatojen varianssien yhtäsuuruuden testaaminen.

Kuvasta 3 huomataan, että autodatojen Bartlettin –testin (Multiple Comparisons) ja Levenen –testin p-arvot ovat isot (>0,05). Testattu data tukee siis hypoteesia, joten datojen hajonnat voidaan olettaa yhtä suuriksi.

Oletukset kahden otoksen t-testin suorittamiselle täytyvät edellisten analyysien perusteella, joten autodatojen ero voidaan nyt testata tilastollisesti. Kahden otoksen t-testin avulla voidaan testata, eroavatko tässä tapauksessa eri autojen kulkemien matkojen keskiarvot toisistaan. Tämä testi nähdään kuvassa 4. Testattavat hypoteesit voidaan kirjoittaa seuraavasti./3/ /7/

H0: μ1 = μ2
H11 ≠ μ2

t-testi.jpg
Kuva 4.
 Autodatojen kahden otoksen t-testin tulokset

Kahden otoksen t-testin (Kuva 4) perusteella huomataan, että testin p-arvo on pieni (<0,05), joten voidaan päätellä, että aineisto tukee hypoteesia, että autojen kulkeman matkan välillä on eroa. Keskiarvoja tutkimalla (Kuva 4) voidaan edelleen päätellä, että punaisen auton kulkeman matkan keskiarvo on vihreän auton kulkeman matkan keskiarvoa suurempi. Vastaus Joonaksen ongelmaan on, punainen auto on parempi, koska se kulkee keskimäärin pidemmän matkan.

Yhteenveto

Tässä julkaisussa on pyritty esimerkin avulla selittämään Six Sigman olennaista ajatusta siitä, että käytännön ongelma on mahdollista saada ratkaistua muuntamalla se tilastomatemaattiseksi ongelmaksi. Vastaavasti Six Sigman ajatuksen perusteella tilastomatemaattista ratkaisu on mahdollista kääntää käytännön ongelman ratkaisuksi. Tässä kahden otoksen t-testin avulla saatiin ratkaistua Joonasta askarruttanut ongelma punaisen auton ja vihreän auton välisestä paremmuudesta.

 

Jarno_pieni.jpg
TkT Jarno Kankaanranta

 

Lähteet

  1. Anderson, T. W. & Darling, D. A., 1952. Asymptotic theory of certain "goodness-of-fit" criteria based on stochastic processes. Annals of Mathematical Statistics. 23, pp.193-212.
  2. Bartlett, M. S., 1937. Properties of sufficiency and statistical tests. Proceedings of the Royal Statistical Society, Series A. 160, pp. 268-282
  3. Chase, W. & Brow, F., 2000. General Statistics. 4. Painos, John Wiley & Sons, Inc.
  4. Grönroos, M., 2003. Johdatus Tilastotieteeseen Kuvailu, mallit ja päättely. 1. Painos, Finn Lectura
  5. Lean Six Sigma Black Belt -koulutuksen materiaali, kevät 2015. Quality Knowhow Karjalainen Oy
  6. Walpole, R. E., Myers, R. H., Myers, S. L. & Ye, K., 2002. Probability & Statistics for Engineers & Scientist. 7. Painos, Prentice Hall

Kommentoi

(Sähköpostiosoitettasi ei näytetä)
Syötä kuvassa näkyvät kirjaimet ja numerot.
Captcha koodi

Klikkaa kuvaa nähdäksesi uuden captchan.

    Kannattaa tutustua

    Kirjallisuutta ja uusia ideoita

    Siirry
    verkkokauppaan www.laatutieto.fi

    Meidät löydät