Indeksi disperzije v statistiki

Čas Branja ~4 Min.
Indeksi disperzije so pomembni, ker opisujejo variabilnost, ugotovljeno v dani populaciji ali vzorcu. Tukaj je opisano, kako jih uporabiti.

Pri porazdelitvi podatkov igrajo disperzijski indeksi zelo pomembno vlogo. Te meritve dopolnjujejo meritve tako imenovanega osrednjega položaja z opredelitvijo variabilnosti podatkov.

The disperzijski indeksi dopolnjujejo tiste osrednje težnje. Bistveni so tudi pri distribuciji podatkov. To je zato, ker označujejo njegovo spremenljivost. Njihov pomen pri statističnem usposabljanju sta poudarila Wild in Pfannkuch (1999).

Zaznavanje variabilnosti podatkov je ena od osnovnih komponent statističnega razmišljanja, saj nam posreduje informacije o razpršenosti podatkov glede na povprečje.

Razlaga povprečja

The aritmetična sredina v praksi se pogosto uporablja, vendar ga je pogosto mogoče napačno razlagati. To se zgodi, ko so vrednosti spremenljivk zelo redke. V teh primerih je treba priložiti povprečne disperzijske indekse (2).

Indeksi disperzije imajo tri pomembne komponente, povezane z naključno spremenljivostjo (2):

  • Dojemanje njegove vseprisotnosti v svetu okoli nas.
  • Tekmovanje za njeno razlago.
  • Sposobnost kvantificiranja (kar pomeni razumevanje in znanje uporabe koncepta disperzije).

Za kaj se uporabljajo disperzijski indeksi?

Kdaj je treba posplošiti podatke vzorca populacije disperzijski indeksi so zelo pomembni, saj neposredno vplivajo na napako, s katero delamo . Več razpršitve kot zberemo v vzorcu, večjo velikost potrebujemo za delo z isto napako.

Po drugi strani pa nam ti indeksi pomagajo ugotoviti, ali so naši podatki daleč od osrednje vrednosti. Povedo nam, ali je ta osrednja vrednost primerna za predstavitev študijske populacije. To je zelo uporabno za primerjavo distribucij in razumeti tveganja v procesu odločanja (1).

Ta razmerja so zelo uporabna za primerjavo porazdelitev in razumevanje tveganj pri odločanju. Večja kot je disperzija, manj reprezentativna je osrednja vrednost .

Najbolj uporabljeni so:

Funkcije disperzijskih indeksov

Razpon

Uporaba ranga je za primarno primerjavo. Na ta način upošteva samo dve skrajni ugotovitvi . Zato se priporoča le za majhne vzorce (1). Definirana je kot razlika med zadnjo vrednostjo spremenljivke in prvo (3).

Statistično odstopanje

Povprečni odklon kaže, kje bi bili podatki koncentrirani, če bi bili vsi enako oddaljeni od aritmetične sredine (1). Za odstopanje vrednosti spremenljivke štejemo razliko v absolutni vrednosti med vrednostjo te spremenljivke in aritmetično sredino serije. Zato se upošteva kot aritmetična sredina odstopanj (3).

Varianca

Varianca je algebraična funkcija vseh vrednosti primerno za sklepne statistične naloge (1). Lahko ga definiramo kot kvadratno odstopanje (3).

Standardno ali tipično odstopanje

Za vzorce, vzete iz iste populacije, je standardni odklon eden najpogosteje uporabljenih (1). Je kvadratni koren variance (3).

Koeficient variacije

Je mera, ki se uporablja predvsem za primerjavo spremembe med dvema nizoma podatkov, izmerjenih v različnih enotah in. Na primer višina in teža študentov v vzorcu. Uporablja se za določitev, v kateri porazdelitvi so podatki najbolj združeni in je povprečje najbolj reprezentativno (1).

Koeficient variacije je bolj reprezentativen disperzijski indeks od prejšnjih, saj je abstraktno število. Z drugimi besedami je neodvisen po enotah, v katerih se pojavljajo vrednosti spremenljivke. Na splošno je ta koeficient variacije izražen v odstotkih (3).

Sklepi o indeksih disperzije

Indeksi razpršenosti kažejo na eni strani stopnjo variabilnosti vzorca. Po drugi strani pa reprezentativnost osrednje vrednote ker če dobite nizko vrednost, to pomeni, da so vrednosti koncentrirane okoli tega središča. To bi pomenilo, da je v podatkih malo variabilnosti in center vse dobro predstavlja.

Nasprotno, če dobite visoko vrednost, to pomeni, da vrednosti niso koncentrirane, ampak razpršene. To pomeni, da je veliko variabilnosti in središče ne bo zelo reprezentativno. Po drugi strani pa bomo pri sklepanju potrebovali večji vzorec, če želimo zmanjšati napako povečala prav zaradi povečanja variabilnosti.

Priljubljene Objave