Kuidas tuvastada kõrvalekaldeid: 10 sammu (piltidega)

Sisukord:

Kuidas tuvastada kõrvalekaldeid: 10 sammu (piltidega)
Kuidas tuvastada kõrvalekaldeid: 10 sammu (piltidega)

Video: Kuidas tuvastada kõrvalekaldeid: 10 sammu (piltidega)

Video: Kuidas tuvastada kõrvalekaldeid: 10 sammu (piltidega)
Video: Москва слезам не верит, 1 серия (FullHD, драма, реж. Владимир Меньшов, 1979 г.) 2024, Mai
Anonim

Statistikas on kõrvalekalle või „kõrvalekalle” nullpunkt, mis erineb valimi või tugipunktide komplekti kõigist teistest nullpunktidest väga kaugele (nullpunktide kogumit nimetatakse andmeteks). Sageli võib nullpunktide kogumi kõrvalekalle olla statistikule hoiatuseks tehtud mõõtmiste ebanormaalsuse või katsevea eest, mis võib viia statistiku kõrvalekalde eemaldamiseni nullpunktide hulgast. Kui statistik eemaldab kõrvalekalded nullpunktide hulgast, võivad uuringust tehtud järeldused olla väga erinevad. Seetõttu on statistiliste nullkogumite õige mõistmise tagamiseks väga oluline teadmine, kuidas kõrvalekaldeid arvutada ja analüüsida.

Samm

Väljundite arvutamine 1. samm
Väljundite arvutamine 1. samm

Samm 1. Siit saate teada, kuidas tuvastada potentsiaalselt kõrvalekaldeid

Enne kui otsustame, kas eemaldada ebaühtlased nullpunktid nullpunktide hulgast või mitte, peame muidugi kindlaks tegema, millised tugipunktid võivad muutuda kõrvalekalleteks. Üldiselt on kõrvalekalle nullpunkt, mis erineb ühe nullkogumi teistest tugipunktidest väga kaugel - teisisõnu on kõrvalekalle teistest tugipunktidest väljaspool. Andmetabelis või (eriti) graafikus on tavaliselt kõrvalekaldeid lihtne tuvastada. Kui ühte tugipunktide komplekti kirjeldatakse graafiliselt visuaalselt, näib väljapoole jääv nullpunkt teistest tugipunktidest "väga kaugel". Kui näiteks enamik tugipunkti nullpunkte moodustavad sirgjoone, ei tõlgendata kõrvalekaldeid mõistlikult selle joone moodustamisena.

Vaatame tugipunkte, mis esindavad ruumis 12 erineva objekti temperatuuri. Kui 11 objekti temperatuur on umbes 70 Fahrenheiti (21 kraadi Celsiuse järgi), kuid 12. objekti, ahju, temperatuur on 300 Fahrenheiti (150 kraadi), on kohe näha, et ahju temperatuur on tõenäoliselt kõrvaline

Väljundite arvutamine 2. samm
Väljundite arvutamine 2. samm

Samm 2. Korraldage nullpunktid nullpunktide komplektis madalaimast kõrgeimani

Esimene samm nullpunktide hulga kõrvalekallete arvutamiseks on leida selle tugikomplekti mediaan (keskmine väärtus). See ülesanne muutub väga lihtsaks, kui tugipunktide kogumi tugipunktid on paigutatud väikseimast suurimaks. Niisiis, enne jätkamist korraldage tugipunktid ühte sellisesse nullpunkti komplekti.

Jätkame ülaltoodud näidet. See on meie lähtepunktide kogum, mis tähistab ruumis mitme objekti temperatuuri: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Kui korraldame tugipunktid madalaimast kõrgeimani, saab tugipunktide järjekorraks: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}

Väljundite arvutamine 3. samm
Väljundite arvutamine 3. samm

Samm 3. Arvutage tugipunkti mediaan

Nullpunkti hulga mediaan on tugipunkt, mille teine pool tugipunktist on sellest nullpunktist kõrgemal ja ülejäänud pool sellest allpool - põhimõtteliselt on see nullpunkt nullikomplekti keskel. Kui nullpunktide arv tugipunktis on paaritu, on seda väga lihtne leida - mediaan on tugipunkt, mille üla- ja alaosas on sama number. Kui aga tugipunktide hulga nullpunktide arv on paaris, siis kuna ükski nullpunkt ei mahu keskele, arvutatakse mediaani leidmiseks keskelt saadud 2 tugipunkti. Tuleb märkida, et kõrvalekallete arvutamisel omistatakse mediaanile tavaliselt muutuja Q2-ni, kuna Q2 asub Q1 ja Q3 vahel, alumine ja ülemine kvartiil, mida käsitleme hiljem.

  • Seda ei tohi segi ajada nullikomplektiga, mille nullapunktide arv on paaris-kahe keskmise nullpunkti keskmine tagastab sageli numbri, mida nullpunktis ei ole-see on okei. Kui aga 2 keskmist tugipunkti on sama arv, on keskmine muidugi sama number, mis on samuti hea.
  • Ülaltoodud näites on meil 12 tugipunkti. 2 keskmist nullpunkti on vastavalt kuues ja seitsmes tugipunkt-vastavalt 70 ja 71. Niisiis, meie tugipunktide kogumi mediaan on nende kahe numbri keskmine: ((70 + 71) / 2), = 70.5.
Väljundite arvutamine 4. samm
Väljundite arvutamine 4. samm

Samm 4. Arvutage alumine kvartiil

See väärtus, mille anname muutujale Q1, on lähtepunkt, mis moodustab 25 protsenti (või veerandi) lähtepunktidest. Teisisõnu, see tugipunkt jagab keskpunktist allpool olevad tugipunktid pooleks. Kui mediaanist allpool asuvate tugipunktide arv on paaris, peate Q1 leidmiseks keskmistama uuesti 2 keskpunkti, täpselt nagu mediaani enda leidmiseks.

Meie näites on 6 tugipunkti, mis asuvad mediaani kohal, ja 6 tugipunkti, mis asuvad mediaani all. See tähendab, et alumise kvartiili leidmiseks peame keskmistama 2 tugipunkti, mis asuvad mediaani all oleva kuue tugipunkti keskel. Kolmandat ja neljandat nullpunkti, mis on 6 nullpunktist allpool mediaani, on mõlemad 70. Seega on keskmine ((70 + 70) / 2), = 70. 70st saab meie esimene kv.

Võõrväärtuste arvutamine 5. samm
Võõrväärtuste arvutamine 5. samm

Samm 5. Arvutage ülemine kvartiil

See väärtus, mille me anname muutujale Q3, on tugipunkt, millel on 25 protsenti nullikomplekti nullpunktidest. Q3 leidmine on peaaegu sama, mis Q1 leidmine, välja arvatud see, et sel juhul vaatame me mediaani kohal, mitte alla mediaani.

Jätkates ülaltoodud näidet, on mediaani kohal olevate kuue tugipunkti keskel asuvad kaks tugipunkti 71 ja 72. Nende kahe tugipunkti keskmine on ((71 + 72)/2), = 71, 5. 71, 5 on meie Q3.

Väljundite arvutamine 6. samm
Väljundite arvutamine 6. samm

Samm 6. Leidke kvartiilidevaheline kaugus

Nüüd, kui oleme leidnud Q1 ja Q3, peame arvutama nende kahe muutuja vahelise kauguse. Kaugus Q1 kuni Q3 leitakse, lahutades Q1 Q3 -st. Kvartalitevaheliste vahemaade jaoks saadud väärtused on väga olulised, et määratleda oma nullpunktide hulga mitteväliste tugipunktide piire.

  • Meie näites on meie Q1 ja Q3 väärtused 70 ja 71, 5. Kvartalitevahelise kauguse leidmiseks lahutame Q3 - Q1 = 71,5 - 70 = 1, 5.
  • Tuleb märkida, et see kehtib ka siis, kui Q1, Q3 või mõlemad on negatiivsed arvud. Näiteks kui meie Q1 väärtus oli -70, oleks meie õige kvartiilidevaheline kaugus 71,5 -(-70) = 141, 5.
Väljundite arvutamine Samm 7
Väljundite arvutamine Samm 7

Samm 7. Leidke nullpunktide komplektist sisemine piirdeaed

Kõrvalekalded leitakse, kontrollides, kas nullpunkt jääb arvude piiridesse, mida nimetatakse „sisemiseks piirdeaiaks” ja „väliseks piirdeaiaks”. Nullpunkti, mis jääb nullikomplekti sisemisest piirdeaiast välja, nimetatakse "väiksemaks kõrvalekaldeks", samas kui välimisest piirkonnast väljapoole jäävat nulli nimetatakse "suureks kõrvalekaldeks". Nullpunkti sisemise tara leidmiseks korrutage esmalt kvartiilidevaheline kaugus 1, 5. Seejärel lisage tulemus Q3 -ga ja lahutage see ka Q1 -st. Kaks saadud väärtust on teie tugipunkti sisemised piirdeaiad.

  • Meie näites on kvartalitevaheline kaugus (71,5–70) või 1,5. Korrutage 1,5 ja 1,5, mille tulemuseks on 2,25. Lisame selle numbri Q3 -le ja lahutame selle numbriga Q1, et leida sisemise tara piirid järgmiselt:

    • 71, 5 + 2, 25 = 73, 75
    • 70 - 2, 25 = 67, 75
    • Niisiis, meie sisemise tara piirid on 67, 75 ja 73, 75.
  • Meie nullpunktide kogumis on ainult ahju temperatuur, 300 Fahrenheiti, väljaspool neid piire ja seega on see nullpunkt väike kõrvalekalle. Kuid me ei ole ikka veel arvutanud, kas see temperatuur on oluline kõrvalekalle, nii et ärge tehke järeldusi enne, kui oleme oma arvutused teinud.

    Võõrväärtuste arvutamine Samm 7 Bullet2
    Võõrväärtuste arvutamine Samm 7 Bullet2
Väljundite arvutamine 8. samm
Väljundite arvutamine 8. samm

Samm 8. Leidke nullpunktide komplektist välimine piirdeaed

Seda tehakse samamoodi nagu sisemise piirdeaia leidmisega, ainult et kvartalitevaheline kaugus korrutatakse 1,5 asemel 3. Seejärel lisatakse tulemus Q3 -le ja lahutatakse Q1 -st, et leida välise aia ülemine ja alumine piir.

  • Meie näites korrutatakse kvartalitevaheline kaugus 3 -ga (1, 5 x 3) või 4, 5. Leiame välise aia piirid samamoodi nagu varem:

    • 71, 5 + 4, 5 = 76
    • 70 - 4, 5 = 65, 5
    • Välise aia piirid on 65,5 ja 76.
  • Nullpunkte, mis asuvad väljaspool välise tara piiri, nimetatakse peamiseks kõrvalekaldeks. Selles näites on ahju temperatuur, 300 Fahrenheiti, selgelt väljaspool välist tara, nii et see nullpunkt on "kindlasti" suur kõrvalekalle.

    Võõrväärtuste arvutamine 8. samm. Bullet2
    Võõrväärtuste arvutamine 8. samm. Bullet2
Võõrväärtuste arvutamine 9. samm
Võõrväärtuste arvutamine 9. samm

Etapp 9. Kasutage kvalitatiivset hinnangut, et teha kindlaks, kas kõrvalekaldunud nullpunkt „ära visata” või mitte

Ülalkirjeldatud meetodit kasutades saab kindlaks teha, kas nullpunkt on väike, peamine või ei ole üldse väljund. Kuid ärge eksige - kui tugipunkt leitakse kõrvalekaldena, see tähistab ainult seda nullpunkti kui „kandidaati”, mis tuleb nullikomplektist eemaldada, mitte nullpunktina, mis „tuleks” ära visata. "Põhjus", mille tõttu kõrvalekalle tugipunktist erineb nullikomplekti teistest lähtepunktidest, on väga oluline selle määramiseks, kas see kõrvale jätta või mitte. Üldiselt võib kõrvale jätta näiteks kõrvalekaldumised, mis on põhjustatud näiteks mõõtmis-, salvestus- või katseplaneerimise veast. Teisest küljest jäetakse kõrvalekalded, mis ei ole põhjustatud veast ja mis näitavad uut teavet või suundumusi, mida varem ei ennustatud.

  • Teine kriteerium, mida tuleb kaaluda, on see, kas kõrvalekalletel on suur mõju nullikomplekti keskväärtusele, st kas kõrvalekalle ajab selle segadusse või muudab selle valeks. Seda on väga oluline kaaluda, kui kavatsete teha järeldusi oma andmekogumi keskmisest.
  • Uurime oma näidet. Selles näites, kuna tundub "väga" ebatõenäoline, et ahi jõudis ettearvamatute loodusjõudude kaudu 300 Fahrenheiti kraadini, võime peaaegu kindlalt järeldada, et ahi jäeti kogemata sisse, mille tulemuseks oli kõrge temperatuuri nullpunkt. Samuti, kui me kõrvalekaldeid ei eemalda, on meie nullikomplekti keskmine (69 + 69 + 70 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 71 + 72 + 73 + 300)/12 = 89,67 Fahrenheiti (32 kraadi Celsiuse järgi)), samas kui kõrvalekallete eemaldamise keskmine on (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 71 + 72 + 73)/11 = 70,55 Fahrenheiti (21 kraadi).

    Kuna need kõrvalekalded on põhjustatud inimlikust eksitusest ja kuna oleks vale öelda, et keskmine toatemperatuur jõuab peaaegu 90 Fahrenheiti (32 kraadi Celsiuse järgi), on meil parem oma kõrvalekalded ära visata

Väljundite arvutamine 10. samm
Väljundite arvutamine 10. samm

Samm 10. Teadke (mõnikord) kõrvalekallete säilitamise tähtsust

Kuigi mõned kõrvalekalded tuleks nullikomplektist eemaldada, kuna need põhjustavad vigu ja/või muudavad tulemused ebatäpseks või ekslikuks, tuleks mõned kõrvalekalded säilitada. Kui näiteks kõrvalekalle näib olevat loomulik (st mitte vea tulemus) ja/või annab uuritavale nähtusele uue vaatenurga, ei tohiks kõrvalekaldeid nullpunktide hulgast eemaldada. Teaduslikud uuringud on tavaliselt väga tundlik olukord, kui tegemist on kõrvalekalletega - kõrvalekallete ebaõige eemaldamine võib tähendada uut suundumust või avastust viitava teabe ärajätmist.

Oletame näiteks, et kavandame uut ravimit, et suurendada kala suurust kalatiigis. Kasutame oma vanu tugipunkte ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}), välja arvatud see, et seekord tähistab iga lähtepunkt kala kaalu (grammides) pärast sünnist erineva eksperimentaalse ravimi manustamist. Teisisõnu, esimene ravim põhjustab ühe kala kaal 71 grammi, teine ravim 70 grammi jne. Sel juhul on 300 "endiselt" suur kõrvalekalle, kuid me ei tohiks seda nullpunkti tagasi lükata, sest eeldades, et see saadi ilma veata, tähendab see uuringu edukust. Ravim, mis võib kala kaaluda 300 grammi, toimib paremini kui kõik teised ravimid, seega on see nullpunkt tegelikult meie lähtekoosseisus kõige olulisem, mitte kõige vähem oluline

Soovitan: