Skirtumas tarp T-TEST ir ANOVA

T-TESTAS prieš ANOVĄ

Statistinių duomenų rinkimas ir apskaičiavimas norint gauti vidurkį dažnai yra ilgas ir varginantis procesas. T-testas ir vienpusė dispersijos analizė (ANOVA) yra du dažniausiai šiam tikslui naudojami testai.

T-testas yra statistinis hipotezės testas, kai testo statistika atitinka Studento t pasiskirstymą, jei nepagrįsta hipotezė. Šis bandymas atliekamas, kai bandymo statistika atitinka normalų pasiskirstymą, o bandymo statistikoje yra žinoma mastelio reikšmė. Jei mastelio keitimas nežinomas, jis pakeičiamas įverčiu, pagrįstu turimais duomenimis. Testo statistika atitiks mokinio t pasiskirstymą.

1908 m. William Sealy Gosset pristatė „t“ statistiką. Gosset buvo „Guinness“ alaus daryklos chemikas Dubline, Airijoje. „Guinness“ alaus darykla laikėsi principo įdarbinti geriausius absolventus iš Oksfordo ir Kembridžo, atrenkant iš tų, kurie galėtų pateikti biochemijos ir statistikos duomenis įmonės nusistovėjusiems pramonės procesams. Vienas tokių studijų absolventų buvo William Sealy Gosset. Proceso metu William Sealy Gosset sugalvojo t-testą, kuris iš pradžių buvo numatytas kaip būdas ekonomiškai įvertinti stouto (alaus daryklos gaminamo tamsaus alaus) kokybę. „Gosset“ paskelbė testą, pažymėtą rašikliu „Studentas“ „Biometrikoje“, maždaug 1908 m. Rašiklio vardo priežastis buvo Guinnesso atkaklumas, nes įmonė norėjo išlaikyti savo statistikos naudojimo kaip savo „komercinių paslapčių“ politiką..

T-testo statistika paprastai būna tokia kaip T = Z / s, kur Z ir s yra duomenų funkcijos. Z kintamasis yra sukurtas taip, kad būtų jautrus alternatyviai hipotezei; iš tikrųjų Z kintamojo dydis yra didesnis, kai alternatyvi hipotezė yra teisinga. Tuo tarpu „s“ yra mastelio parametras, leidžiantis nustatyti T pasiskirstymą. T-testo prielaidos yra šios: a) Z pagal standartinę hipotezę seka normalų normalųjį pasiskirstymą; b) ps2 seka Ï ‡ 2 pasiskirstymą su p laisvės laipsniais pagal nulinę hipotezę (kur p yra teigiama konstanta); ir c) Z vertė ir s vertė yra nepriklausomos. Atliekant konkretaus tipo t testą, šios sąlygos yra tiriamos populiacijos padariniai, taip pat duomenų atrankos būdas..

Kita vertus, dispersijos analizė (ANOVA) yra statistinių modelių rinkinys. Nors ANOVA principus ilgą laiką naudojo tyrinėtojai ir statistikai, tik 1918 m. Seras Ronaldas Fisheris pasiūlė įforminti dispersijos analizę straipsnyje, pavadintame „Mendelių paveldėjimo atitikimo priklausomybių santykis“. . Nuo to laiko ANOVA taikymo sritis ir taikymo sritis buvo išplėsta. ANOVA iš tikrųjų yra klaidinga, nes ji nėra kildinama iš dispersijų skirtumų, o veikiau iš skirtumų tarp grupių vidurkių. Tai apima susijusias procedūras, kai stebimas tam tikro kintamojo dispersija yra padalijama į komponentus, priskirtinus skirtingiems variacijos šaltiniams.

Iš esmės ANOVA pateikia statistinį testą, skirtą nustatyti, ar kelių grupių vidurkiai yra lygūs, ir todėl apibendrina t-testą daugiau nei dviem grupėms. ANOVA gali būti naudingesnis nei dviejų pavyzdžių t-testas, nes jis turi mažesnę tikimybę padaryti I tipo klaidą. Pavyzdžiui, jei turėtumėte kelis dviejų imčių „t“ testus, būtų didesnė tikimybė padaryti klaidą nei tų pačių kintamųjų ANOVA, norint gauti vidurkį. Modelis yra tas pats, o bandymo statistika yra F santykis. Paprasčiau tariant, t-testai yra tik ypatingas ANOVA atvejis: atlikus ANOVA, tas pats kelių t-testų rezultatas bus tas pats. Yra trys ANOVA modelių klasės: a) fiksuotų efektų modeliai, kurie remiasi duomenimis, kad duomenys gaunami iš įprastų populiacijų, skiriasi tik priemonėmis; b) Atsitiktinių efektų modeliai, darant prielaidą, kad duomenys apibūdina skirtingų populiacijų, kurių skirtumus riboja hierarchija, hierarchiją; ir c) mišrių efektų modeliai, kai yra tiek fiksuotas, tiek atsitiktinis efektas.

Santrauka:

  1.  T-testas naudojamas nustatant, ar du vidurkiai ar vidurkis yra vienodi ar skirtingi. ANOVA teikiama pirmenybė lyginant tris ar daugiau vidurkių ar vidurkių.
  2.  „T-testas“ turi daugiau šansų padaryti klaidą, nes naudojama daugiau priemonių, todėl ANOVA naudojama lyginant dvi ar daugiau priemonių.