Žodis duomenys reiškia informaciją, kuri renkama ir įrašoma. Tai gali būti skaičių, žodžių, matavimų ir dar daugiau.
Yra du duomenų tipai: tai yra kokybiniai ir kiekybiniai duomenys. Skirtumas tarp dviejų tipų duomenų yra tas, kad kiekybiniai duomenys naudojami skaitinei informacijai apibūdinti. Pavyzdžiui, temperatūros matavimas nepatektų į tokio pobūdžio duomenis.
Kita vertus, kokybiniai duomenys naudojami apibūdinti informaciją žodžiais. Surinkus duomenis, juos reikia sutvarkyti, todėl reikia atskirti sugrupuotus duomenis nuo nesugrupuotų duomenų. Abi yra naudingos duomenų formos, tačiau skirtumas tarp jų yra tas, kad negrupuoti duomenys yra pirminiai duomenys. Tai reiškia, kad jis ką tik buvo surinktas, bet nebuvo suskirstytas į jokią grupę ar klases. Kita vertus, sugrupuoti duomenys yra duomenys, kurie pagal neapdorotus duomenis yra suskirstyti į grupes.
Kaip minėta pirmiau, sugrupuoti duomenys yra duomenų rūšis, kurie surinkti yra suskirstyti į grupes. Neapdoroti duomenys suskirstomi į įvairias grupes ir sudaroma lentelė. Pagrindinis lentelės tikslas yra parodyti kiekvienoje grupėje esančius duomenų taškus. Pavyzdžiui, kai atliekamas testas, rezultatai yra šio scenarijaus duomenys ir yra daugybė būdų šiuos duomenis sugrupuoti. Pvz., Gali būti užrašytas studentų skaičius, kuris surinko daugiau nei 20 balų.
Taip pat gali būti naudojami pažymiai. Pvz., 90-100 iki F 0-59 kiekvienoje kategorijoje rodo, kiek mokinių yra kiekvienoje kategorijoje. Histogramos ir dažnių lentelė yra geriausiai naudojami sugrupuotiems duomenims parodyti ir interpretuoti. Štai pavyzdys
Duomenų grupavimas turi šiuos privalumus:
Nesuderinti duomenys, dar vadinami pirminiais duomenimis, yra duomenys, kurie po surinkimo nebuvo įtraukti į jokią grupę ar kategoriją. Duomenys yra suskirstyti į skaičius arba požymius, todėl duomenys, kurie nebuvo priskirti nė vienai iš kategorijų, yra nesugrupuoti. Pavyzdžiui, atlikdami surašymą ir norite išanalizuoti, kiek moterų, vyresnių nei 45 metų, yra tam tikroje srityje, pirmiausia turite žinoti, kiek žmonių gyvena toje srityje.
Asmenų, gyvenančių toje srityje, skaičius yra nesugrupuotas arba neapdorota informacija, nes niekas nebuvo klasifikuojamas. Todėl galime daryti išvadą, kad negrupuoti duomenys yra duomenys, naudojami informacijai apie atskirą imties ar populiacijos narį parodyti.
Kai kurie nesugrupuotų duomenų pranašumai yra šie;
Grupuoti duomenys yra duomenys, kurie buvo surinkti klasėse po jų analizės. Pavyzdžiai: kiek lietaus sezono metu surinktų kukurūzų maišų buvo blogai. Kita vertus, negrupuoti duomenys yra duomenys, kurie nepriklauso jokiai grupei. Tai vis dar neapdoroti duomenys.
Renkant duomenis, pirmenybė teikiama nesugrupuotiems duomenims, nes informacija vis dar yra originalios formos. Jis nebuvo sugadintas nei klasifikuojant, nei padalinus. Vis dėlto analizuojant ir brėžant grafikus pirmenybė teikiama sugrupuotiems duomenims, nes juos lengva interpretuoti.
Skaičiuojant sugrupuotų ir nesugrupuotų duomenų vidurkius, bus skirtumų. Pirmenybė teikiama sugrupuotų duomenų vidurkiui, nes jis yra tikslesnis, palyginti su nesugrupuotų duomenų vidurkiu. Nesugrupuotų duomenų vidurkis gali klaidingai manipuliuoti mediana, todėl daugeliu atvejų jis laikomas neveiksmingu.
Dažnio lentelės naudojamos parodyti sugrupuotų duomenų informacijai, tuo tarpu, kai duomenys nėra sugrupuoti, informacija pasirodo kaip didelis skaičių sąrašas. Taip yra dėl to, kad informacija vis dar yra neapdorota.
Sugrupuoti duomenys yra duomenys, suskirstyti į dažnio pasiskirstymą, tuo tarpu negrupuoti duomenys niekaip nebuvo apibendrinti.