ESTATISTIKA
DESKRIBATZAILEA
­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
Koerlazioa, erregresioa eta
datu anizkoitzen analisia
­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
2. argitarapena
Karmele Fernandez Agirre
© Karmele Fernandez Agirre
© Udako Euskal Unibertsitatea
I.S.B.N.: 84-86967-53-8
Lege-gordailua: BI-1832-93
Inprimategia: BOAN S.A. Padre Larramendi 2. BILBO
Azalaren diseinua: Julio Pardo
Banatzaileak: UEU. General Concha 25, 6. BILBO
Zabaltzen: Igarabide, 88. DONOSTIA
AURKIBIDEA
HITZAURREA .......................................................................... XI
I. EZAUGARRI ESTATISTIKO BAKUNAK,
BANAKETAK, TAULAK, ADIERAZPIDE GRAFIKOAK
I.1. ESTATISTIKAREN HISTORIA LABURRA.
ESTATISTIKA ETA PROBABILITATEA ............................. 3
I.2. OROKORTASUNAK .......................................................... 5
I.2.1. Populazioa eta lagina .............................................. 5
I.2.2. Unitate estatistiko edo indibiduoak .......................... 6
I.3. EZAUGARRI ESTATISTIKOAK ........................................ 6
I.3.1. Ezaugarri estatistiko bakunak ................................ 6
I.3.1.1. Ezaugarri kuantitatiboak ........................... 7
I.3.1.2. Ezaugarri kualitatiboak ............................ 7
I.4. MAIZTASUN-BANAKETA BAKUNAK ............................. 8
I.4.1. Maiztasun-banaketak (absolutuak, erlatiboak,
eta metatuak) ......................................................... 8
I.4.2. Taulak ....................................................................... 9
I.5. MAIZTASUN-BANAKETA BAKUNEN
ADIERAZPIDE GRAFIKOAK .......................................... 13
I.5.1. Barra-diagramak ..................................................... 13
I.5.2. Histogramak ............................................................. 15
I.5.3. Maiztasun-poligonoak ............................................ 17
I.5.4. Diagrama linealak ................................................. 18
I.5.5. Beste adierazpide grafikoak ................................... 18
II. EZAUGARRI BAKUNEN BALIO TIPIKOAK
II.1. MOMENTUAK .................................................................... 23
II.1.1. Momentu arruntak edo jatorriarekikoak ................. 23
II.1.2. Momentu zentralak edo batezbestekoarekikoak ...... 24
II.2. MAIZTASUN-BANAKETA BAKUNEN BALIO
TIPIKO EDO ESTATISTIKOAK ........................................ 26
II.2.1. Zentru-joeraren balio tipikoak .......................... 26
II.2.1.1. Batezbesteko aritmetikoa ........................ 27
II.2.1.2. Batezbesteko geometrikoa......................... 30
II.2.1.3. Batezbesteko harmonikoa ........................ 31
II.2.1.4. Moda ........................................................ 31
II.2.1.5. Mediana .................................................. 34
II.2.2.Sakabanatzearen balio tipikoak ............................... 36
II.2.2.1. Bariantza ................................................. 37
II.2.2.2. Batezbesteko desbidazioa ........................ 38
II.2.2.3. Ibiltartea ................................................. 39
II.2.3. Itxuraren balio tipikoak ......................................... 40
II.2.3.1. Asimetri koefizientea .............................. 40
II.2.3.2. Kurtosi-koefizientea edo
zapaltasun/zorroztasun-koefizientea ......... 41
II.3. KONTZENTRAZIO-NEURKETAK ....................................... 43
II.3.1. LORENZ-en kurba ................................................... 43
II.3.2. GINI-ren indizea .................................................... 46
III. ZENBAKI INDIZEAK
III.1. INDIZE SINPLEAK .......................................................... 51
III.2. PONDERAZIO GABEKO INDIZE KONPLEXUAK ....... 52
III.2.1. Batezbesteko aritmetikoa sinplearen metodoa ...... 52
III.2.2. Batezbesteko agregatu sinplearen metodoa ........... 52
III.3. INDIZE KONPLEXU PONDERATUAK ............................ 58
III.3.1. Balioen, prezioen eta kopuruen indizeak ................ 58
III.3.1.1. LASPEYRES-en indizeak ....................... 61
III.3.1.2. PAASCHE-ren indizeak ......................... 63
III.3.1.3. FISHER-en indizeak ............................ 65
III.3.1.4. Propietate eta erlazio batzu: Batera-
garritasuna eta alderantzizkotasuna........ 65
III.3.1.5. Kalkulaketa ........................................................ 66
III.4. INDIZE KONPLEXUEN ERAIKETAN SORTZEN
DIREN ZENBAIT ERAGOZPEN ...................................... 68
VI ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
III.4.1. Aldagaien hautapena ............................................ 68
III.4.2. Somatutako leku eta denboraren hautapena ........... 68
III.4.3. Talde eta azpitaldeen hautapena ........................... 68
III.4.4. Oinarri-denboraren hautapena ............................. 68
III.4.5. Formula eta ponderazioen hautapena .................... 69
III.4.6. Indizearen esangura eta zabaldura ......................... 69
III.5. ERAGOZPEN BEREZI BATZU ........................................ 70
III.5.1. Oinarri-aldaketa indize sinpleetan ........................ 70
III.5.2. Berriztapen eta loturak indize konplexuetan .......... 70
III.6. ZENBAKI-INDIZEEN APLIKAPENAK .............................. 72
III.6.1. Kontsumo-prezioen indizeak ............................... 72
IV. EZAUGARRI ESTATISTIKO BIKOITZAK,
BANAKETAK, TAULAK, ADIERAZPIDE GRAFIKOAK
IV.1. EZAUGARRI ESTATISTIKO BIKOITZAK ........................... 77
IV.2. MAIZTASUN-BANAKETA BIKOITZAK .............................. 77
IV.2.1. Maiztasun-banaketak bikoitzak eta
bazter-maiztasunak ............................................... 77
IV.2.2. Maiztasun-banaketa bikoitzak: Taulak .................. 79
IV.3. MAIZTASUN-BANAKETA BIKOITZEN
ADIERAZPIDE GRAFIKOAK ......................................... 81
IV.3.1. Sakabanatze-diagrama edo puntu-hodeia .............. 81
IV.4. MAIZTASUN-BANAKETA BALDINTZATUAK .................. 83
IV.5. TAULA BATEN DEPENDENTZIA EDO
INDEPENDENTZIA ......................................................... 86
IV.6. KONTINGENTZI TAULA BATEN ERRENKADA
ETA ZUTABEEN BATEZBESTEKO SOSLAIAK ................ 88
V. EZAUGARRI BIKOITZEN BALIO TIPIKOAK
V.1. MOMENTUAK ...................................................................... 91
V.1.1. Momentu arruntak edo jatorriarekikoak .................. 91
V.1.2. Momentu zentralak edo batezbestekoarekikoak ...... 92
Estatistika deskribatzailea­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­VII
V.2. MAIZTASUN-BANAKETA BIKOITZEN BALIO
TIPIKO EDO ESTATISTIKOAK ........................................ 93
V.2.1. Kobariantza: Sxy .................................................... 93
V.2.2. Koerlazio-koefizientea: rxy ..................................... 94
V.3. ALDAGAIEN ALDAKETAK ................................................ 96
V.3.1. Aldagai zentratua ................................................... 99
V.3.2. Aldagai tipifikatua edo standardizatua .................. 100
V.4. ALDAGAI KOERLAZIO GABEEN BI PROPIETATE ........... 101
V.5. SAKABANATZE ETA KOERLAZIO-MATRIZEAK ................ 102
V.6. OROKORPENA .................................................................... 102
VI. KOERLAZIOA ETA ERREGRESIOA RRRR2-n
VI.1. KOERLAZIOA ETA ERREGRESIOA ................................. 107
VI.2. ERREGRESIO-TEORIA ...................................................... 107
VI.2.1. Batezbestekoaren erregresioa ................................. 108
VI.2.2. Karratu txikienen erregresioa ................................ 109
VI.2.2.1. Karratu txikienen erregresio lineala ...... 110
VI.2.2.2. Karratu txikienen erregresio parabolikoa. 117
VII. ALDAGAI ESTATISTIKO n-KOITZEN
MATRIZE-ESTATISTIKOAK
VII.1. DATU-MATRIZEAK .......................................................... 123
VII.2. BATEZBESTEKO-BEKTOREA: PROPIETATEAK............. 124
VII.3. KOBARIANTZ MATRIZEA ................................................. 125
VII.3.1. Kobariantz matrizearen propietateak .................. 126
VII.4. KOERLAZIO-MATRIZEA ................................................ 127
VII.4.1. Koerlazio-matrizearen propietateak .................... 129
VIII. ERREGRESIO ANIZKOITZA
VIII.1. SARRERA ......................................................................... 133
VIII.2. ERREGRESIO-PLANOA R3-n ........................................ 134
VIII ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
VIII.3. ERREGRESIO-HIPERPLANOA Rn-n ........................... 137
VIII.3.1. Karratu txikienen erregresioaren propietateak .. 138
VIII.3.2. Mugatze-koefizientea eta koerlazio-koefiziente
anizkoitza .............................................................. 142
VIII.4. "BETA" ERREGRESIO-KOEFIZIENTE
STANDARDIZATUAK ....................................................... 143
IX. KOERLAZIO PARTZIALA
IX. 1. SARRERA .......................................................................... 147
IX.2. KOERLAZIO PARTZIALA: KONTZEPTU
MATEMATIKOA .............................................................. 150
IX.3. ERREPIKAPEN-FORMULA ............................................ 154
IX.4. KOERLAZIO-KOEFIZIENTE PARTZIALA
ETA "" KOEFIZIENTEAK ........................................... 155
X. DESKRIBAPEN ESTATISTIKOAREN
ADIERAZPIDE GEOMETRIKOAK
X.1. OROKORTASUNAK ............................................................ 159
X.2. X DATU-MATRIZEAREN BI ADIERAZPIDE
GEOMETRIKO ..................................................................... 159
X.3. BI ALDAGAI ETA BI OHARPEN ........................................ 160
X.4. BI ALDAGAI ETA HIRU OHARPEN ................................... 167
X.5. ERREGRESIO BAKUNA ALDAGAI ESTATISTIKOEN
BALIO-MULTZOEN ESPAZIOAN ....................................... 173
XI. ERREGRESIO ORTOGONALA ETA
KOBARIANTZ MATRIZEAREN AUTODIREKZIOAK
XI.1. ELKARREN MENPEKO ANALISIA ................................. 179
XI.2. ERREGRESIO-ZUZEN ORTOGONALA ETA
HONDAR-BARIANTZA ................................................... 179
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ IX
XI.3. BATERAKO BARIANTZAREN DESKONPOSAKETA
ERREGRESIO ORTOGONALEAN ................................. 188
XI.4. ERREGRESIO ORTOGONALAREN PROPIETATEAK ..... 190
XII. DATU ANIZKOITZEN ANALISIA
XII.1. SARRERA .......................................................................... 195
XII.2. ANALISI OROKORRA ..................................................... 196
XII.2.1. Rn espazioaren Rq azpiespazio baten bidez
egindako doikuntza ............................................... 197
XII.2.2. Rm espazioaren Rq azpiespazio baten bidez
egindako doikuntza .............................................. 200
XII.2.3. Rn eta Rm espazioen arteko erlazioa .............. 201
XII.2.4 X datu-taularen berreraketa ............................... 203
XII.3. OSAGAI NAGUSIZKO ANALISIA .................................. 205
XII.3.1. Rn espazioan egindako analisia ......................... 206
XII.3.2. Rm espazioan egindako analisia ........................ 207
XII.3.3. Baterako aurkezpen grafikoak ............................ 211
XII.3.4. Adibidea ............................................................... 213
XII.4. KORRESPONDENTZI ANALISI FAKTORIALA ............. 221
XII.4.1. Hodeiak, masak eta distantziak ............................ 224
XII.4.2. Rn espazioan egindako analisia ........................ 227
XII.4.3. Rm espazioan egindako analisia ....................... 228
XII.4.4. Rn eta Rm espazioen arteko erlazioa ................. 229
XII.4.5. Maiztasun-taularen berreraketa ........................... 231
XII.4.6. Interpretaziorako laguntzak .............................. 232
XII.4.7. Korrespondentzia Anitzeko Analisi Faktoriala ...... 234
XII.5. ELEMENTU GEHIGARRIAK ............................................ 237
XII.6. SAILKAPEN-METODOAK .............................................. 238
XII.6.1. Goranzko Sailkapen Hierarkikoa ........................ 238
XII.6.1.1. Bariantzaren metodoa ......................... 239
XII.6.2. Adibidea ............................................................. 241
X ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
LEHENENGO ARGITARAPENEKO HITZAURREA
Duela 6 urte, 1983. urtean alegia, Estatistikaren Hastapenak izenaz lehen
apunte-liburua argitaratu genuen Ekonomi eta Enpresa-Zientzien Fakultateko
"Estatistikarako Sarrera" asignaturaren testuliburu gisa.
Une honetan, eskuartean daukazun Estatistika Deskribatzailea. Koerlazioa,
Erregresioa eta Datu Anizkoitzen Analisia asignatura berberaren testuliburua
izango da, baina aurrekoarekin parekatuz koalitatezko saltoa suposatzen du. Alde
batetik, Estatistikaren Hastapenak hark biltzen zituen gaiak zuzenduak eta osatuak
izan dira, eta bestaldetik hiru ikasgai berriren bitartez Datu Anizkoitzen Analisia
ikasgaira iristen gara, non eskola frantsesaren Datu-Analisiaren metodologiaren
gunea azaltzen dugun.
Esan beharra daukagu, aurkezpen geometrikoen eta erregresio ortogonalaren
bitartez metodo faktorialera iristea guztiz originala dela "Estatistikarako Sarrera"
asignatura batetan. Era honetan, datuen eta estatistikoen zentzu bektoriala eta
grafikoa ikasleari ikustaraziz bide tinkoa jorratzen dugu Datu Anizkoitzen
Analisiraino.
Guzti hau, egunez egun asignaturaren programan egindako talde-lana izan da
eta meritua ez da gurea bakarrik, hein handi batetan hainbat urtetan lankide
daukagun J.M. Piris-ena baizik. Aipamen berezia merezi du berak, bai eta edizio
honetan hainbeste lagundu diguten UEUko Alfontso Mujikak eta Mari Karmen
Menikak ere, hain zuzen. Mila esker guztiei.
Egileak
Sarriko, 1989.eko Urria
BIGARREN ARGITARAPENEKO HITZAURREA
Lau urte pasatu dira, liburu honen lehenengo argitarapena egin zenetik. Tarte
horretan pauso asko eman dira irakaskuntzan, Euskararen Erabilera Normaltzeko
Plangintzaren arabera.
Plangintza hori, Euskal Herriko Unibertsitateko Fakultate eta Eskoletako
Euskara Batzordeek eta hauen bidez sortu zen Unibertsitateko Euskara Batzordeak
bultzaturik, Gobernu-Juntak onartu zuen 1990.eko Irailaren 14ean.
Nahiz eta arazo asko gainditu behar izan, ikastegi batzutan beste batzutan
baino gehiago bada ere, orokorki oinarrizko asignatura asko gaur egun Euskaraz
irakasten direla esan beharra dago, horrela, Estatistikaren irakaskuntza ikastegi
gehienetara zabaldu da eta honen ondoren Ekonometria asignatura, Ekonomi eta
Enpresa-Zientzien Fakultatean.
Aspaldidanik UZEIko "Matematika Hiztegia" eta Euskal Gobernuak
argitaratutako "Termino Estatistikoen Hiztegia" lagungarri izan ditugu eta une
honetan UZEIko "Euskalterm" terminologi bankua ere badaukagu. Hemendik
aurrera Estatistikaren irakaskuntza eta erabilera egokitzen dugun bitartean,
Ekonometria, Denborazko Serien Teoria eta beste gai aurreratuetan ihardungo
dugu, gai horietan lan egiten duten beste irakasle euskaldunekin batera.
Bukatzeko, bigarren argitarapen honetan gaiek berean segitzen badute ere,
zuzendu eta egokitu egin ditugu horietariko batzu.
Egileak
Sarriko, 1993.eko Iraila
XII ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
I. EZAUGARRI ESTATISTIKO BAKUNAK,
BANAKETAK, TAULAK,
ADIERAZPIDE GRAFIKOAK
I.1. ESTATISTIKAREN HISTORIA LABURRA.
ESTATISTIKA ETA PROBABILITATEA
I.2. OROKORTASUNAK
I.2.1. Populazioa eta lagina
I.2.2. Unitate estatistiko edo indibiduoak
I.3. EZAUGARRI ESTATISTIKOAK
I.3.1. Ezaugarri estatistiko bakunak
I.3.1.1. Ezaugarri kuantitatiboak
I.3.1.2. Ezaugarri kualitatiboak
I.4. MAIZTASUN-BANAKETA BAKUNAK
I.4.1. Maiztasun-banaketak (absolutuak,
erlatiboak, eta metatuak)
I.4.2. Taulak
I.5. MAIZTASUN-BANAKETA BAKUNEN
ADIERAZPIDE GRAFIKOAK
I.5.1. Barra-diagramak
I.5.2. Histogramak
I.5.3. Maiztasun-poligonoak
I.5.4. Diagrama linealak
. I.5.5. Beste adierazpide grafikoak
I.1. ESTATISTIKAREN HISTORIA LABURRA.
ESTATISTIKA ETA PROBABILITATEA
Estatistika hitza gutxienez hiru zentzu desberdinetan erabil daiteke.
Esan ohi da:
- "estatistika batzu" izen arrunta bezala erabiliz edo
- "..... txosten estatistiko bat....." adjetibotzat hartuz edo.
- ".... Estatistika ikastea.... " izen propioa bezala azkenik.
Hitz honen adierazpen orokor, zahar eta ez-espezializatua hauxe da:
MULTZO HANDIEN "Ikasketa" edo "erabilera", MULTZO ZENTZUAN
HARTURIK.
Honela, hasieran Estatistika artea eta teknika izan zen.
Mundu neolitikoan herriak eta salerosketak gero eta ugariagoak egin zirenez,
estatistikaren beharra sortu zen.
Gizartearen hasiera historikotik praktikatu zen beraz. Israeldar, Erromatar,
Txinatar eta Inken aparteko inperioarenak, adibide eder batzu besterik ez dira.
Baina "cinquecento" italiarrean (XVI. mendean) izena eta bere buruaren
kontzientzia hartzen hasi zela dirudi, kontabilitatearekin nahiko lotuta hasi ere.
XVIII. mendetik aurrera argiago eta garbiago agertzen da, beharbada. Estatu-
zientziaren alboan hasi zen, gehienbat, Alemaniak sortutako bultzada zela medio.
Etapa honetan, oraindik Estatistika ez da zientzia, eta gertaera aleatorioetatik
eta probabilitate-teoriatik urrun zegoen artea zen.
Baina geroztik "estatistikariei" problemak agertzen hasi zitzaizkien:
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 3
- estatistiketatik ondorio zientifikoak nola lortu?
- kolektibo aldakor edo zentsatzeko zail direnetatik informazio fidagarriak nola
lortu?
Britaniar giroan XIX. mendearen amaieran eta XX.aren hasieran, oztopo
hauetatik irteten zen heinean, Estatistika zientzia bilakatu zen.
Estatistika probabilitate-teoriarekin esentziazko harremanetan dagoen zientzia
da orain.
Honela, hurrengo galderetan ikusiko dugun maiztasun kontzeptutik
probabilitate kontzeptura pasatu zen.
Eskematikoki ikusiz:
Fenomenoetatik bere kausetarainoko bidea egiten duen ezagupide honi,
INDUKZIOA deritzo Estatistikaren alorrean eta, hementxe, INFERENTZIA
ESTATISTIKOA.
Estatistika zientziaren oinarri trinkoan bermatutako estimazioak egiten dira
gaur egun, beraien fidagarritasuna ere neurtzen delarik.
Hau dena INFERENTZIA ESTATISTIKOARI dagokio.
Apunte-liburu honetan ikusten diren gaiak Estatistika Deskribatzaileari
dagozkio, hau da, oinarrizko Estatistika ikusiko dugu edo Estatistikaren
hastapenak, halaber, Estatistika Deskribatzaile anizkoitza edo Datu-Analisia
ikusiko dugu XII. gaian.
4 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
MAIZTASUNAK PROBABILITATEAK
(joerak,gertagarritasunak)(gertapenen arloa)
KOLEKTIBO
KONKRETUAK
KOLEKTIBO
ABSTRAKTUAK
} {
Dakusagun, bada, gaian sartu aurretik, ESTATISTIKA
DESKRIBATZAILEAREN definizio bat.
ESTATISTIKA DESKRIBATZAILEA, datu-multzo HANDIAK aurkez
ditzakeen teknika bat da, multzo hau eskurakoi bihurtuz, beraren egitura
gardenduz eta beraren barne-harremanak neurtuz.
I.2. OROKORTASUNAK
I.2.1. Populazioa eta lagina
Ikerketa estatistiko bakoitzean objektu nagusi diren pertsona, ondasun,
saioaren emaitza (adibidez: datuaren aurpegia) probintzia baten herri,
hauteskundearen alderdi politiko, edota fabrikazio-unitateek osatzen duten
multzoari POPULAZIO edo UNIBERTSO deritzogu.
Populazioa ondo definitzeko edozein elementu partikular populaziokoa den
ala ez jakin ahal izatea, beharrezkoa zaigu.
Populazioak bukaezinak (adb: boltsa batetako erauzketak) ala bukakorrak
(eskualde batetako enpresa kooperatiboak) izan daitezke.
LAGINA: Lagina azpipopulazio errepresentagarri bat besterik ez da;
populazio batez konklusio fidagarriak atera nahi baditugu, ahal dugun
azpipopulazio errepresentagarriena aukeratu beharko dugu lagintzat.
LAGIN errepresentagarri hau erauzi egiten duen prozesuari zorizko
laginketa deritzo.
Lagina erauztean populazioaren elementu guztiei posibilitate berdina ematen
badiegu, zorizko lagin sinplea deritzogu honela aukeratutako laginari.
Lagina erauzteko beste era eta jokabide asko daude, geruzatuz, mordoketaz,...
baina hau LAGINKETA-TEORIAri dagokio.
Lagina osatzen duten elementuen kopuruari laginaren tamainua deritzo.
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 5
Sinbolikoki:
= Populazioa
' = Lagina
N = Laginaren tamainua.
I.2.2. Unitate estatistiko edo indibiduoak
Populazioa edo lagina osatzen duen elementu bakoitzari unitate estatistiko
edo indibiduo deritzogu.
Indibiduo izena, estatistika deskribatzailearen jatorri demografikoari zor
diogu.
I.3. EZAUGARRI ESTATISTIKOAK
Ikerketa estatistiko batetan helburua ez dugu populazioa edo lagina
eshaustiboki ikertzea, baizik eta beraren ezaugarri batetara edo batzutara
mugatuko gara.
Ikertu nahi dugun ezaugarria bakarra bada, ezaugarri estatistiko bakuna
deritzo.
Populazioaren bi edo ezaugarri gehiago batera ikertu nahi baditugu,
ezaugarri estatistiko anizkoitza deritzo.
Ezaugarri estatistikoek (bakun ala anizkoitzek) populazio edo laginen
multzoko indibiduo bakoitzean balio indibidual bat har dezakete.
Lagineko indibiduo-multzoari, ezaugarriaren balio-multzo bat dagokio.
Sinbolikoki:
= { 1, 2, ....... } { x1, x2, ......... , xn }
= { 1, 2, ....... } {(x1 y1), (x2 y2) ..... (xn yn) }
I.3.1. Ezaugarri estatistiko bakunak
Ezaugarri estatistiko bakunen sailkapena bere balio multzo desberdinen
arabera:
6 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
'= 1,2 ,...N{ }
I.3.1.1. Ezaugarri kuantitatiboak
Ezaugarriaren balio indibidualak populazioan edo laginean zenbakiak baldin
badira, edota balio-multzoa zenbakizkoa bada, ezaugarri kuantitatiboa deritzo.
Ezaugarriari dagokion balio-multzoa, multzo diskretua denean, ezaugarri
diskretua deritzo.1
Balio biren artean edozein balio har dezakenean ezaugarri jarraia deritzo.
I.3.1.2. Ezaugarri kualitatiboak
Ezaugarriak har ditzakeen balio indibidualak kategoria edo atributuak
direnean, edota balio-multzoa kategoria edo atributuek osatzen dutenean
(diskretuak beraz), ezaugarri kualitatiboa deritzo.
Ondo klasifikatu ahal izateko, ezaugarri kualitatiboak hiru baldintza hauek
bete behar ditu:
- Ondo definitua, hau da, kategoria edo atributu bakoitzak zer ulertarazten
duen argiro azaldu behar du.
- Esklusibotasuna, hau da, indibiduo bat ezin liteke bi kategoriatan egon.
- Eshaustibotasuna, hau da, indibiduo guztiek nonbait klasifikatuak egon
behar dute.
ADIBIDEAK: Eskualde bateko enpresa kooperatiboen lagin bat aztertzean:
- Langile-kopurua, ezaugarri kuantitatibo diskretua da;
- Produkzioa, ezaugarri kuantitatibo jarraia da;
- Lekutasuna, ezaugarri kualitatiboa da.
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 7
_______________
1. balio-multzoko elementuak, puntu isolatuak direnean, balio-multzo diskretu bat dugu.
EZAUGARRI
ESTATISTIKO
BAKUNAK
KUANTITATIBOAK
JARRAIAK
DISKRETUAK



KUALITATIBOAK
EDOATRIBUTIBOAK






I.4. MAIZTASUN-BANAKETA BAKUNAK
I.4.1. Maiztasun-banaketak (absolutuak, erlatiboak, eta metatuak)
Ezaugarri diskretuetan:
Suposa dezagun N indibiduoz osatutako lagin bat, non ezaugarri bakun batek
"m" balio edo kategoria desberdin hartzen baititu.
Hots:
{ 1, 2, .... } { x1, x2, ......... , xj ....... xm }
{ 1, 2, .... } {,, .... , J, .... M }
xj Balioaren MAIZTASUN ABSOLUTUA, sinbolikoki nj ikurraz
adieraziko dugu, eta laginean xj balioa hartzen duten indibiduoen kopurua da.
Non:
xj Balioaren MAIZTASUN ERLATIBOA, sinbolikoki fj ikurraz
adieraziko dugu, non:
hau da, laginean xj balioa hartzen duten indibiduoen kopurua erlatiboki kontutan
hartuz lortzen den proportzioa da.
Maiztasun erlatiboak portzentaiatan ere adierazten dira, batzutan nahiko
komenigarria baita horrela egitea.
Orduan:
8 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
Pj
= % fj
. 100
j = 1
m
pj
= 100
fj
=
N
nj

j = 1
m
fj
= 1

j = 1
m
nj
= N
Laginari dagokion balio-multzoa ordenatu ahal badugu (ezaugarria
kuantitatiboa bada, beti; bestela ez beti), txikitik handira ordenatuko dugu.
Hots:
x1 x2 ...... xj ...... xm
Kasu honetan, xj balioaren MAIZTASUN ABSOLUTU METATUA,
sinbolikoki Nj , honela definituko dugu:
hau da, laginean xj balioa eta txikiagoak hartzen dituzten indibiduoen kopurua da.
Eta: xj balioaren MAIZTASUN ERLATIBO METATUA, sinbolikoki Fj,
honela definituko dugu:
hau da, xj balioa eta txikiagoak hartzen dituzten indibiduoen kopurua N
indibiduo guztiekiko kontsideratutako proportzioa (batekotan).
Edozein maiztasun erlatibo bezala, portzentaiatan ere adierazten dira.
I.4.2. Taulak
Datu edo balioen ordenaketa eta elkarketari TABULAZIOA deritzo, eta,
azkeneko datu-disposizioari, TAULA ESTATISTIKOA.
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 9
Fj
=
N
n1
+ n2
+ .... + nj
=
N
Nj
= f1
+ .... + fj
Fm
=
j = 1
m
fj
= 1
Kasu honetan, Fm
=
j = 1
m
pj
= 100
Nj
= n1
+ n2
+ .... + nj
Nm
=
j = 1
m
nj
= N
Lagin bati dagokion maiztasun-banaketen taula (ezaugarri bakun eta
diskretua izanik) ondokoa da.
Ezaugarri jarraietan
Nahiz eta teorikoki ezaugarria etengabea izan eta fenomeno askok ezaugarri-
mota honi erantzun, praktikan zehaztasun gehiago edo gutxiago duten tresnez
neurtzen direnez gero, diskretu bukaezinak gertatzen zaizkigu.
Hots:
baina praktikan:
Lehen urratsean: Ezaugarriari dagokion balio-multzoa mailatan zatituko
dugu, mailen muturrak ondo definituz.
non:
a a0 a1 a2 .... an-1 an b
10 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
Lagina Balio-
-multzoa
MAIZTASUN-BANAKETA
M. absolutuak M. absolutu
metatuak
M. erlatiboak M. erlatibo
metatuak
x A n N f
x B n N f
.. .. .. .. ..
x J n N f
.. .. .. .. ..
x M n N f
1 1 1 1 1 1
2 2 2 2 2 2
jjjjjj
mN m m
1
,2
,...,N{ } x
I= (a,b) R
1
,2
,...,N{ } x
x1
,x2
,...,xN{ } (a,b) R
I = a0,a1( ) a1,a2( ) ... an-1,an( )
Mailen kopurua, tamainu desberdinekoak hartu ala ez ...... azterketa
bakoitzean erabaki beharreko gauzak dira, baina beti ere mailaketak hiru baldintza
hauek bete beharko ditu:
- Ondo definituak.
- Esklusibotasuna
- Eshaustibotasuna
Bigarren urratsean: Maila bakoitza balio batetara mugatuko dugu, klase-
-ordezkari deritzoguna.
Normalki ordezkaria, maila tartearen erdiko puntua da, baina goi ala beheko
muturrean ere izan liteke.
Honela bada, balio-multzoko maila bakoitza, balio batetara mugatzen dugu
(ordezkariaren baliora) eta laburpen honetaz informazio estatistikoa galdu arren,
hasieran ezaugarri jarraia zena, ezaugarri diskretu bukakor bihurtzen dugu, eta
dagokion maiztasun-banaketa kalkulatu ondoren, ondoan dagoen taula bezalako
batetan adieraz liteke.
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 11
2
1



..
..
(a0,a1)
(a1,a2)
.. ..
(aj-1,aj)
.. ..
(am-1,am)
x1
x2
..
xj
..
xm
M. erlatibo
metatuakM. erlatiboak
M. absolutu
metatuak
M. absolutuakMailak edo
klaseak
Lagina
F1
F2
Fj
1
f1
f2
..
fj
..
fm
N1
N2
Nj
N
n1
n2
..
nj
..
nm
Klase-
-ordezkariak
N
nj = N
m
fj = 1
n

ADIBIDEAK
a) X ezaugarri kualitatiboa da.
Eskualde batetako populazioaren banaketa produkzio-sektoreen arabera:
(kasu honetan, sektore-kategoria bakoitzari dagozkien maiztasun erlatiboak
portzentaietan bakarrik jarri ditugu).
b) X ezaugarria kuantitatiboa da.
b-1) Diskretu-taldekatua
Enpresen banaketa, langile-kopuruaren arabera herri batetako enpresetatik
lortutako lagin batetan.
(kasu honetan, laginean langile-kopuru ezaugarriari zegozkion balio
desberdinak asko zirenez gero, taldekatu egin ditugu mailaka edo klaseka).
12 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
Langileen kopurua
Enpresen kopurua
m. absolutuak m. abs. metatuak
0-tik
10-tik
50-tik
100-tik
500-tik
1.000-tik
5.000-tik
10.000-tik
N = 8.500
9-ra
49-ra
99-ra
499-ra
999-ra
4.999-ra
9.999-ra
aurrera
3.876
2.028
976
689
320
304
295
12
3.876
5.904
6.880
7.569
7.889
8.193
8.488
8.500
70
95
100
70
25
5
Nekazaritza
Industrigintza
Zerbitzuak
Sektoreak Portzentaiak Portzentaia
metatuak
b-2) Ezaugarri jarraia
Soldaduzkara urte batetan doazen gazteen banaketa, beren altueraren arabera:
(Kasu honetan, mailaketan, maila guztiek tamainu berdina dute, aurrenekoa
eta azkenekoa kenduz).
I.5. MAIZTASUN-BANAKETA BAKUNEN ADIERAZPIDE
GRAFIKOAK
Nahiz eta maiztasun-banaketen taulak informazio guztia hartu (balioak
mailetan laburtuak ez badira izan behintzat), grafikoki adierazteak asko laguntzen
du ikusarazten eta ulertzen.
Adierazpide grafiko asko erabili izan arren, batzu bakarrik ikusiko ditugu.
I.5.1. Barra-diagramak
Oso baliagarriak zaizkigu ezaugarriak diskretuak ditugunean (kuantitatiboak
zein kualitatiboak).
Abzisa-ardatzean balio edo kategoria desberdinak (ahal bada ordenaturik),
ezarriko ditugu, eta ordenatu-ardatzean berriz laginari dagozkion maiztasunak
(absolutuak, erlatiboak ala metatuak).
ADIBIDEAK
a) Ezaugarri kualitatibo diskretua.
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 13
1
8
20
38
68
88
98
100
1
7
12
18
30
20
10
2
1'525
1'575
1'625
1'675
1'725
1'775
1'5 b. gutxiago
1'5-tik 1'55-ra
1'55 1'60
1'60 1'65
1'65 1'70
1'70 1'75
1'75 1'80
1'80 b. gehiago
Portzentaia
Metatuak
Portzentaiak
Klase-
-ordezkariak
Klaseak
(altuera m.)
Enpresen banaketa bere kokapenaren arabera:
b) Ezaugarri kuantitatibo diskretua.
Loteen banaketa, beren baitan dituzten pieza akastunen kopuruaren arabera:
Maiztasun erlatiboen barra-diagrama
14 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
10
15
23
37
1 2 3 4 5
Txarren
kopurua:
Maiztasun-
erlatiboa:
(portzentaietan)
Maiztasunerlatiboa:
Portzentaia
metatuak
1 15 15
2 10 25
3 23 48
4 37 85
5 15 100
A B C D E
kokapena
Enpresen
kopurua
A arloa
B arloa
C arloa
D arloa
E arloa
301
400
503
670
102
1.976
670
503
400
301
102
barra-diagrama
Maiztasun metatuen diagrama
I.5.2. Histogramak
Oso baliagarriak zaizkigu ezaugarriak jarraiak direnean.
Ezaugarriaren balio-multzoa mailetan zatitu ondoren eta maila edo klase
bakoitza oinarritzat harturik, dagokion maiztasunaren (nahiz absolutua, erlatiboa
edo metatua) araberako azalera duen laukizuzen bat eraikitzen da.
Klase guztiak zabalera berdinekoak baldin badira, klase bakoitzari dagokion
laukizuzenaren altuera, bere maiztasun absolutu edo erlatiboa da. Honela, soilik,
laukizuzenen oinarriak berdinak izatean, azalerak altueren menpe daude.
Ondoan b-2) adibideari dagozkion histogramak eta maiztasun-poligonoak
ditugu (Ikus b-2) 13. orrialdean).
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 15
15
25
48
85
100
1 2 3 4 5
1'50 1'55 1'60 1'65 1'70 1'75 1'80 (altuera)
Histogramak eta maiztasun-poligonoak
Klaseen zabalerak, ordea, desberdinak baldin badira, laukizuzenen altuerak,
maiztasun absolutuak edo erlatiboak zabaleraz zatituz, kalkulatuko ditugu.
hi, ni eta ci , i . klasearen altuera, maiztasuna eta zabalera, hurrenez hurren,
izanik:
hi altuera di bezala ere izendatzen da eta maiztasun-dentsitate bezala ezagutzen.
Adibidea:
Bi goi-mailako ikastetxetan, ikasleen adinak honela banatzen dira:
16 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
hi
=
ci
ni
, orduan Si
azalera: Si
= ci ci
ni
= ni
Urteak (mailak) M.E. Ikastetxea E.F. Ikastetxea
17 - 19 400 750
20 - 25 400 2.000
26 - 37 200 250
Adibidearen histogramak egin ditugu a) kasuan maiztasun absolutuak
kontsideratuz eta b) kasuan, berriz, maiztasun erlatiboak portzentaietan.
Dakusagunez, maiztasun erlatiboak (ehunekotan edo ez) adieraztean totalaren
ikusketa, N-rena hain zuzen, galtzen da, baina ordea bi banaketak konparagarriago
bihurtzen dira.
I.5.3. Maiztasun-poligonoak
Maiztasun-poligonoa laukizuzenen goiko oinarriko erdiko puntuak marra
batez lotuz eraikitzen da.
Honela egin dugu 16. orrialdeko histograman.
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 17
N = % 100N = % 100
N = 1000 N = 3000
M.E. E.F.
I.5.4. Diagrama linealak
Oso erabilgarriak izan ohi dira, balioen aldaketetan denborak izan lezakeen
eragina aztertzeko.
Adibidez: Energi produkzioa 1.950-tik, 1.960 urterarte:
I.5.5. Beste adierazpide grafikoak
Beste batzuren artean, ikus ditzagun, azkenez, bi hauek:
- POPULAZIO-PIRAMIDEAK.
Histograma bikoitzak dira, eta honela eraikitzen dira: ordenatu-ardatzean
adin-taldeak adierazten dira eta abzisa-ardatzean, ezkerrerantz eta eskuinerantz
gizonezko eta emakumezkoen maiztasun erlatiboak populazio totalarekiko
adierazten dira, dagozkien laukizuzenak eraikiz.
Maiztasun erlatiboak populazio totalarekiko kontsideratzean, gizonezkoen eta
emakumezkoen laukizuzenak konpara daitezke adin-talde bakoitzerako.
Halaber, maiztasun erlatiboak kontsideratzean, eskala berdinean eraikiz gero,
tamainuaren aldetik oso desberdinak diren populazioak konpara daitezke.
18 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
1.950 1.952 1.954 1.956 1.958 1.960
INDAR
TERMIKOA
UR-INDARRA
GUZTIRA
- SEKTORE GRAFIKOAK
Grafiko hauek honela eraikitzen dira: zirkunferentziako 360 graduetatik,
aldagaien balio ala kategoria bakoitzaren maiztasunari proportzionalki zati bat
dagokio.
Euskararen ezaguera Sarrikoko Fakultatean 1979. urtean.
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 19
50 40 30 20 10 10 20 30 40 50
75
70
65
60
55
50
45
40
35
30
25
20
15
10
5
0
Populazioa milatan
Adina urte betetan
Bizkaiko Populazio-Piramidea 1.975. urtean
% 74.50
% 9.9
% 15.60
Ez dakite
Betidanik dakite
Euskaldunberriak
II. EZAUGARRI BAKUNEN BALIO TIPIKOAK
II.1. MOMENTUAK
II.1.1. Momentu arruntak edo jatorriarekikoak
II.1.2. Momentu zentralak edo
batezbestekoarekikoak
II.2. MAIZTASUN-BANAKETA BAKUNEN
BALIO TIPIKO EDO ESTATISTIKOAK
II.2.1. Zentru-joeraren balio tipikoak
II.2.1.1. Batezbesteko aritmetikoa
II.2.1.2. Batezbesteko geometrikoa
II.2.1.3. Batezbesteko harmonikoa
II.2.1.4. Moda
II.2.1.5. Mediana
II.2.2. Sakabanatzearen balio tipikoak
II.2.2.1. Bariantza
II.2.2.2. Batezbesteko desbidazioa
II.2.2.3. Ibiltartea
II.2.3. Itxuraren balio tipikoak
II.2.3.1. Asimetri koefizientea
II.2.3.1. Kurtosi-koefizientea edo
zapaltasun/zorroztasun-koefizientea
II.3. KONTZENTRAZIO-NEURKETAK
II.3.1. LORENZ-en kurba
II.3.2. GINI-ren indizea
II.1. MOMENTUAK
Datuek berekin duten informazioa, balio tipiko edo estatistikoen bidez
sintetizatzea komeni da.
Noski, laburketa guztiei informazio-galtze bat dagokie; errakuntzarako motibo
hau, bada, kontuan izan beharko dugu estatistiko bakoitza aztertzerakoan.
Baina, estatistiko edo balio tipikoak aurkeztu baino lehen, momentuak ikusi
behar ditugu, balio tipikoak momentuak bait dira edo momentuen bidez definitzen.
Momentuak bi motatakoak izan daitezke:
- arruntak edo jatorriarekikoak.
- zentralak edo batezbestekoarekikoak.
II.1.1. Momentu arruntak edo jatorriarekikoak
Maiztasun-banaketa bakun baten h-ordenako momentu arrunta edo
jatorriarekikoa, sinbolikoki ah ikurraz adieraziko da eta honela definituko:
non:
N = Laginaren edo Populazioaren indibiduoen kopurua
xi = Ezaugarriaren i. balioa.
m = Ezaugarriak hartzen dituen balio desberdinak; m N izango da.
Momentu arrunten bi berezitasun ikusiko ditugu:
1) O-ordenako momentuak 1 balioa hartzen du:
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 23
ah
=
N

i = 1
N
(xi
)
h
=
N

i = 1
m
(xi
)
h
ni
Hots:
2) 1- ordenako edo lehenengo ordenako momentua batezbesteko aritmetikoa da:
Hots:
eta normalki x­ ikurraz adierazten da.
Ikusten ari garen momentu arruntek nahiz ondoren ikusiko ditugunek, ez dute
berekiko esangurarik, bidebatez balio tipiko direnean izan ezik, adibidez,
batezbesteko aritmetikoa, bariantza, e.a.
Halere, Estatistikan eragile matematiko bezala sartzen dira, teoriaren
garapenean oso erabilgarriak baitira.
II.1.2. Momentu zentralak edo batezbestekoarekikoak
Maiztasun-banaketa bakun baten h-ordenako momentu zentrala edo
batezbestekoarekikoa, sinbolikoki mh ikurraz adieraziko da eta honela definituko:
Eragiketak eginez, ikus dezagun nola kalkulatzen diren momentu zentralak
momentu arrunten bidez:
24 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
mh
=
N

i = 1
N
(xi
- x)
h
=
N

i = 1
m
(xi
- x)
h
ni
a1
=
N

i = 1
m
xi
ni
= x
a0
=
N

i = 1
m
(xi
)
0
ni
= 1
Hortik:
Momentu hauen artean bigarren ordenakoa (m2), BARIANTZA delakoa da
garrantzitsuena.
Eta azkenez, momentuak edozein punturekiko izan daitezke:
x0 = 0 baldin bada, momentu arruntak izango dira.
eta x0 = x­ bada, zentralak.
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 25
mh
=
N
1

m
(xi
- x)
h
ni
=
=
N
1

m
((0
h
) xi
h
- (1
h
) xi
h-1
x + (2
h
) xi
h-2
x
2
- ...... +
+ (-1)
h-1
(h-1
h
) xi
x
h-1
+ (-1)
h
(h
h
) x
h
) ni
=
= (0
h
) ah
- (1
h
) ah-1
x + (2
h
) ah-2
x
2
- .... + (-1)
h-1
hx
h
+ (-1)
h
x
h
m2
= a2
- x
2
m3
= a3
- 3a2
x + 2x
3
m4
= a4
- 4a3
x + 6a2
x
2
- 3x
4
m2 x pon( ) =
(x1 -x)2
ni
N
=a2 -x2
ah
, x0
=
N

N
(xi
- x0
)
h
=
N

m
(xi
- x0
)
h
ni
II.2. MAIZTASUN-BANAKETA BAKUNEN BALIO TIPIKO EDO
ESTATISTIKOAK
Organigrama batetan azalduko ditugu banaketa bakunetan erabili ahal diren
estatistiko edo balio tipikoak; gero erabilienak banaka ikusiz joango gara.
II.2.1. Zentru-joeraren edo Posizioaren balio tipikoak
Lagin batetan ezaugarri bati dagozkion balioak ordenatzen baditugu, zentruan
kokatzen diren balioak erabiltzen dira datu guztiak errepresentatzeko. Posizio-
-neurriak dira.
Balio batetan datu-multzo baten ideia ematea argiro ikusten dugu, sarritan
gehiegizko sinplifikazioa izanik.
Horregatik, zentruko estatistikoak beste estatistiko batzurekin
(sakabanatzearenak,..) osatzen dira, aztertzen ari garen populazio edo laginaren
ideia errealagoa eduki nahi baldin badugu.
26 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
ZENTRU - JOERAren edo
posizioaren balio tipikoak
- neurrizkoak:
Batezbesteko aritmetikoa
Batezbesteko geometrikoa
Batezbesteko harmonikoa




- lekuzkoak:
Mediana
Koantilak



- maiztasunezkoak: Moda













SAKABANATZEaren
balio tipikoak:
- bariantzaetadesbidaziostandarda
- batezbestekodesbidazioa
- ibiltartea eta koartilarteko ibiltartea
- aldakuntz koefizientea






ITXURAREN
balio tipikoak
- asimetri koefizientea
- kurtosi koefizientea



II.2.1.1. Batezbesteko aritmetikoa
Lagin batetan x1, x2, ....., xi, ...., xm , zenbakizko balio-multzo bati
dagozkion maiztasun absolutuak hurrenez hurren n1, n2, ...., ni , ...., nm baldin
badira, beraren batezbesteko aritmetikoa, x­, honako hau da:
Maiztasun erlatiboak, f1 , f2 , .... , fm , kontutan hartuz
Ezaugarriak hartzen dituen balio guztiak desberdinak balira, maiztasun
absolutuek 1 balioa hartuko lukete, hau da, n1 = n2 = .... = nN = 1 eta orduan:
Maiztasun erlatiboak masak bezala kontsideratzen baditugu, batezbesteko
aritmetikoak grabitate-zentrua finkatuko du. Hau da, barra baten gainean eta x1 ,
x2 , ... xm puntuetan maiztasunak bezalako pisuak kokatzen baditugu sistemak
oreka lor dezan, esekitze-puntuak x­ puntuan izan beharko du.
PROPIETATEAK:
1.- Edozein maiztasun-banaketatan, bere maiztasunaz biderkatuz,
batezbestekoarekiko desbideratzeen batukaria zero egiten da.
Hots:
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 27
x =
N
1

i = 1
m
xi
ni
non
i = 1
m
ni
= N
x =
i = 1
m
xi
fi
x =
N
1

i = 1
N
xi

i = 1
m
(xi
- x) ni
= 0
Frogapena:
2.- Ezaugarri edo aldagai baten balio guztiak h parametroaz biderkatzen baditugu,
batezbesteko aritmetikoa ere h-z biderkatuta edukiko dugu.
Hots:
xi balio bakoitza h xi balioaz ordezkatzen badugu:
3.- Aldagai bi edo gehiagoren batura den aldagai baten batezbesteko aritmetikoa,
batezbesteko aritmetikoen batura da.
Suposa dezagun oposizio-lehiaketa bat hiru azterketaz osatzen dela eta i.
lehiakideak xi, yi, zi puntuak ateratzen dituela, puntuazio totala ti = xi + yi + zi
izanez; N lehiakideren puntuazioen batezbesteko aritmetikoa ondokoa izango
da:
28 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
=
N

i = 1
N
xi
+
N

i = 1
N
yi
+
N

i = 1
N
zi
= x + y + z
t =
N

i = 1
N
ti
=
N

i = 1
N
(xi
+ yi
+ zi
)
=
Hau da: t = x + y + z baldin bada.
t = x + y + z izango da.
x =
N
1

i = 1
m
xi
ni
izanez

i = 1
m
(xi
- x) ni
=
i = 1
m
xi
ni
- x
i = 1
m
ni
= N x - N x = 0
N
1

i = 1
m
h xi
ni
= h
N
1

i = 1
m
xi
ni
= h x
BATEZBESTEKO ARITMETIKO PONDERATUA
Batzutan batezbesteko aritmetikoa ateratzean, aldagaien garrantzi erlatiboa
desberdina dela ohartzen gara.
Suposa dezagun hiru sagar mota saltzen direla 60, 80 eta 90 pezeta/kilo
prezioetan hurrenez hurren.
Batezbesteko prezioa honela atera daiteke:
sinplea eginik.
Baina mota bakoitzarentzat saltzen diren kiloak, hurrenez hurren, hauek
baldin badira: 125, 72, 3
Batezbesteko ponderatua, zera izango da:
Ikusten dugunez, batezbesteko aritmetiko ponderatua egitean, aldagaiaren
balio bakoitza zenbaki batez biderkatzen dugu, balio-multzo barnean daukan
garrantziaren arabera.
Zenbaki hauek pisuak edo ponderazioak dira eta sinbolikoki wi deituko
ditugu.
Oharra: kontutan hartu behar da, bien formulak baliokideak badira ere
ponderazioak maiztasunak ez direla. Hala ere, maiztasunak ponderazioak dira
aldagaiaren balio desberdinek duten garrantzia maiztasunen araberakoa izango
baita.
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 29
x =
60 + 80 + 90
3
= 76'6, hau da, batezbestekoaritmetiko
x(pon) =
60125+8072+ 903
125+72+3
= 67'6
Orduanx pon( ) =
xiwi
wi
edota x pon( ) = xiwi wi = 1 denean
Beste adibide bat:
Ondoko taulan Hego Euskal Herriko lau herrialdeen kasuan hileroko
gastuak/familia datuak dauzkagu.
Hileroko gastuak / familia, 1.968. urtean
Familiak Gastuak (mila pezetatan)
Araba 24 4,4
Gipuzkoa 53 5,3
Nafarroa 57 5,1
Bizkaia 84 5,1
Baina, familien kopurua kontutan hartuz:
Noski, batezbesteko ponderatuen bidez errealitatearen azterketari gehiago
hurbiltzen gatzaizkio, baina normalki datu guztiak ezagutzen ez ditugunez,
batezbesteko aritmetiko sinplea egiten dugu.
II.2.1.2. Batezbesteko geometrikoa:
Ondoko berdintasunaren bidez adierazten dugu:
Arrazoi edo ehunekoen batezbesteko bat ateratzeko, batezbesteko aritmetikoa
baino aproposagoa da eta ondoko propietatea betetzen du:
30 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
Log G=
1
N
log xi
n i
=
i =1
m

1
N
(logxi )ni
i=1
m

G = x1
n1
xx
n2
.......... xm
nmN
= xi
ni
i=1
m
N
x pon( ) =
4,424+ 5,353+ 5,157+ 5,184
24+53+ 57+ 84
= 5,07
Batezbesteko aritmetikoa: x =
4
19,9
= 4,975
Hots:
Batezbesteko geometrikoaren logaritmoa, aldagaiaren balioen logaritmoen
batezbesteko aritmetikoa da.
II.2.1.3. Batezbesteko harmonikoa
Ondoko berdintasunaren bidez adierazten dugu
Ohar daiteke batezbesteko harmonikoa zera dela, xi balioen alderantzizko
balioen batezbesteko aritmetikoaren alderantzizko balioa.
Batezbesteko abiaduren batezbesteko bat ateratzeko, batezbesteko
harmonikoa da egokiena.
Ikusitako batezbestekoak eta beste batzuk: batezbesteko koadratikoa,
batezbesteko kubikoa, e.a. sar daitezke k ordenako batezbestekoaren kontzeptuan.
II.2.1.4. Moda
Maiztasun-banaketa batetan gehien errepikatzen den aldagai edo
ezaugarriaren balioari, hau da, maiztasunik handiena duenari, moda eta balio
modala deritzo.
x1 , x2 , ... xi ....... xm edo A, B, ..... , I , ..... M
balio edo kategorien multzo bati dagozkien maiztasun erlatiboak hurrenez hurren
f1 , f2 ,...., fm baldin badira, maiztasun erlatibo gehien duen xi balioari edo I
kategoriari "moda" M0 deritzo.
Hots: M0 = xi edo M0 = I, ni eta fi maiztasun handienak izanik.
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 31
H =

i = 1
m
xi
ni
N
non N =
i = 1
m
ni
Hots: M(k)
= xi
k
fi
k
Banaketa, modagabea izan liteke f1 = f2 = .... = fm , edo moda bat baino
gehiago ere eduki dezake, eta honen arabera, "bimodala", "hirumodala" ...
orokorki moda-anitza izango da.
ADIBIDEAK
Kasu honetan banaketa bimodala L1 , L2 klasea da kasu honetan
dugu, B eta C arloak modak moda, klase honen
direlarik. ordezkaria, M0, har daiteke
modatzat.
Banaketa jarraia edo klasetan taldekatua bada, dakigunez, maiztasun
handiena, M0, duen klasean kokatuko da moda, eta klase-ordezkaria modatzat
hartzen ez badugu, gutxi gorabeherako kalkuluak egin daitezke.
Klase edo tarte modala Li-1, Li izanez, balio modala estimatzeko bi erizpide
desberdinetan oinarritutako formulak proposatuko ditugu.
1) Altueren alderaketaren erizpidea:
32 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
M0
= Li-1
+
di-1
+ di+1
di-1
ci
M0 L4L3
L2L1
L0A B C D E
%5
%20
%30 %30
%15
b)a)
AME eta BMD triangeluak antzekoak dira, hau da, beraien altuerak oinarriekiko
proportzionalak dira.
Hots:
Edo ondoko proportzio baliokidea:
eta, M0 = Li-1 + MG izatean, proposatu dugun formula frogatuta gelditzen da.
Klaseak zabalera berdinekoak balira, altueren alderaketa, zuzenki,
maiztasunen alderaketa izango da.
Hau da:
di-1 = ni - ni-1
di+1 = ni - ni+1
2) Alderantzizko banaketa proportzionalaren erizpidea:
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 33
non:
ci = klaseen zabaltasuna
di-1 = hi - hi-1
di+1 = ni - ni+1
hi = i. klaseen altuera
Frogapen grafikoa LiM0
Li-1
M D
FG
E
BA
klaseen zabalera
MF
MG
=
BD
AE
MG + MF
MG
=
AE + BD
AE
hau da,
ci
MG
=
di-1
+ di+1
di-1
M0
= Li-1
+
hi-1
+ hi+1
hi+1
ci
non:hi-1 = aurreko klasearen altuera
hi+1 = hurrengo klasearen altuera
edo aurrekariak eta atzekariak batzean:
eta, M0 = Li-1 + bi izatean, proposatu dugun formula frogatuta gelditzen da.
Klaseak zabalera berdinekoak balira, hau da, ci = c
c zabaleraz biderkatzen eta zatitzen badugu eta ni = chi dela kontutan hartuz,
ondoko hau izango da formula:
II.2.1.5. Mediana
Mediana banaketaren balioak bi zati berdinetan zatitzen dituen lekuzko
estatistikorik garrantzitsuena da.
Balio-multzoa ordenatuz gero, maiztasun absolutuen histograma area
berdineko bi zatitan ebakitzen duen balioari mediana deritzo, eta hori zehazki
betetzen duenik ez badago, aurrean dagoena hartzen dugu batzutan medianatzat.
34 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
M0
= Li-1
+
(hi+1
+ hi-1
) c
hi+1
c
c = Li-1
+
ni+1
+ ni-1
ni+1
c
bi
hi+1
=
ci
hi+1 + hi-1
M0Li-1
hi+1
bi
hi-1
Ondoko klaseen
altuerekiko alderantzizko
banaketa proportzionala
egitean, aurreko formula
lortzen dugu.
Hots:
b1
hi+1
=
ci - bi
hi-1
Ondoko baldintza betetzen duen balio bat da:
Hala ere, banaketa diskretua eta indibiduoen kopurua bakoitia baldin bada,
aurreko baldintza bete egingo da, baina ez beste edozein kasutan.
Banaketa diskretua eta N bikoiti baten aurrean bagaude.
Banaketa taldekatuetan eta jarraietan: N/2 balioa duen tartea finkatuz gero eta
tartean ni balioak linealki gehitzen direla suposatuz kalkulatuko dugu Me .
Orduan: (Li-1 , Li ) Me duen tartea izanez:
Me = Li-1 + bi
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 35
Me = xi / Ni-1 <
N
2
Ni >
N
2
Me =
xi + xi+1
2
Ni =
N
2
Hots: Me
=
2
erdiko balioak
Irudian dauden bi
triangeluakantze-
koakizanez,zera
idatzdaiteke:
bi
Li
MeLi-1
Ni-1
N/2
Ni
Ni -Ni-1
ci
=
N
2
-Ni-1
bi
Oharra: maiztasun erlatiboak erabiliz, era berdinean kalkula daiteke Me ; kasu
horretan,
KOANTILAK
Koantilak beste lekuzko neurriak dira. Mota desberdinetakoak dira: koartilak,
dezilak eta zentilak.
Koartilak, dezilak eta zentilak medianaren antzera definitzen dira, baina bi
parte hartu ordez lau (koartilak) hamar (dezilak) edo ehun (zentilak) parte hartuz.
Koartilak q1, q2, q3 izango dira eta (q1, q3) tartean banaketaren erdia
daukagu eta justu erdiko balioak, hau da, bazterreko balioak kenduz.
Dezilak d1 ..... d9 izango dira eta zentilak, c1 .... c99 .
Argiro ikusten da:
q2 = d5 = c50 = Me dela.
OHARRAK:
Erdiko baliorik garrantzitsuenak, batezbesteko aritmetikoa, moda eta mediana
dira eta bereziki batezbesteko aritmetikoa, guztiak aldagaia edo ezaugarria neurtua
dagoen unitateetan neurtuak direlarik.
Ondoko erlazio hau betetzen da:
Eta gutxi gorabehera hiruretako edozein, besteen bidez kalkula daiteke.
II.2.2. Sakabanatzearen balio tipikoak
Datu-multzoaren ideia orokorra ematen ziguten zentrurako joeraren balio
tipikoek. Ideia hau osatzeko, zentrurako joeraren balioen inguruan datu-multzoa
36 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
eta: bi =
N / 2-Ni-1
Ni - Ni-1
ci
2
N
=
2
1
.
M0
~ 3 Me
- 2 x
guztiz bilduta edo oso sakabanatuta dagoen adierazten diguten estatistiko batzu ere
behar ditugu.
Batezbesteko aritmetikoaren inguruan datuek duten sakabanatze-neurri
bezala, estatistiko garrantzitsuenak hauek dira: Bariantza, Desbidazio Standarda
eta Batezbesteko Desbidazioa.
II.2.2.1. Bariantza
Batezbestekoarekiko, sakabanatze-neurririk garrantzitsuena da bariantza eta
bera erabiliz lortzen ditugu desbidazio standarda eta aldakuntz koefizientea.
{x1 , x2 , .... , xi .... xm} zenbakizko balio-multzo bati dagozkien maiztasun
absolutuak hurrenez hurren n1 , n2, ... ni .... nm baldin badira, bariantza, ,
deritzona hau da:
Bariantza neurri-unitate karratuetan daukagula, erraz ikusten dugu formulan.
Orduan, sakabanatze-neurri bezala bariantzaren erro karratua hartzea
egokiagoa da, Desbidazio Tipikoa edo Standarda, hain zuzen.
eta ezaugarria neurtuta dagoen unitateetan, sakabanatze-neurketa daukagu.
Askotan, estatistika inferentzialean estimatzaile bezala dituzten
propietateengatik, Quasi-bariantza eta Quasi-desbidazio standarda
erabiltzen dira.
Konputagailuko programa-paketeak , ematen dizkigute Bariantza eta
Desbidazio Standarda deitzen badituzte ere.
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 37
Sx
2
=
N
1

i = 1
m
(xi
- x)
2
ni
edota Sx
2
=
i = 1
m
(xi
- x)
2
fi
Sx
=
N
1

i = 1
m
(xi
- x)
2
ni
=
i = 1
m
(xi
- x)
2
fi
= a2
- x
2
Sx
*2
=
N - 1

i = 1
m
(xi
- x)
2
ni
eta Sx
*
=
N - 1

i = 1
m
(xi
- x)
2
Sx
2
Sx
2
Sx

Sx
2
Sx

Desbidazio tipikoak batezbestekoarekiko suposatzen duen batekoa (edo
ehunekoa) aldakuntz koefizientea deitzen da.
x­ batezbestekoa zerora hurbiltzen bada, g0 horrek ez du zentzu askorik
(infiniturantz jotzen baitu kasu honetan).
Bariantzak garrantzizko propietate bat betetzen du, bigarren ordenako
momentu zentralik txikiena dela, hain zuzen.
Hots:
Eta argiro dagoenez, x0 = x­ baldin bada, txikiena izango da, edozein beste
kasutan bigarren batugaia positiboa baita.
II.2.2.2. Batezbesteko desbidazioa
Balio absolutuak harturik (konpentsaziorik izan ez dadin), batezbesteko
batekiko balioek duten desbidazioen batezbesteko aritmetikoari, "batezbesteko
desbidazioa" deritzo.
38 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
+
N
1
(x - x0
)
2

i = 1
m
ni
= Sx
2
+ (x - x0
)
2
=
N
1

i = 1
m
(xi
- x)
2
ni
+ 2 (x - x0
)
i = 1
m
(xi
- x)
N
ni
+
=
N
1

i = 1
m
((xi
- x)
2
+ 2 (xi
- x) (x - x0
) + (x - x0
)
2
)ni
=
=
N
1

i = 1
m
((xi
- x) + (x - x0
) )
2
ni
=
a2
, x0
=
N
1

i = 1
m
(xi
- x0
)
2
ni
=
g0
ikurraz adieraziko dugu sinbolikoki, non: g0
=
x
Sx
a) Aukeratutako batezbestekoa, batezbesteko aritmetikoa bada, batezbesteko
desbidazioa hauxe izango da:
Neurri honek indibiduoen homogenotasuna adierazten digu, hau da,
desbidazioak txikiak badira, batezbesteko desbidazioa txikia izango da eta,
alderantziz, handiak badira, batezbesteko desbidazioa handia izango da.
b) Aukeratutako batezbestekoa mediana bada, batezbesteko desbidazioa hauxe
izango da:
Batezbestekoa mediana denean, batezbesteko desbidaziorik txikiena daukagu.
II.2.2.3. Ibiltartea
Ezaugarri zenbakizko batek hartzen dituen balio masimo eta minimoaren
arteko diferentziari ibiltarte deritzogu.
Hots:
Koartil arteko ibiltarteak ere kontsidera daitezke, adibidez, q3 ­ q1 hirugarren
eta lehenengoen artekoena hain zuzen ere, edota, dezil arteko ibiltarteak e.a.
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 39
Hau da: D =
1
N
xi - batezbestekoa ni
i =1
m

Dx =
1
N
xi - x
i=1
m
ni
DM
e
=
N
1

i = 1
m
|xi
- Me
|ni
x0
x1
........ xm
izanik
R = xm
- x0
II.2.3. Itxuraren balio tipikoak
Aztertzen ari garen laginaren ezaugarria eta berari dagokion datu-multzoa,
zentrurako joeraren eta sakabanatze-balioen bidez nahiko argi geratu bada ere,
gehiago osa daiteke itxuraren balio tipikoak aztertzean; hauen artean asimetri
koefizientea eta kurtosi-koefizientea ikusiko ditugu.
II.2.3.1. Asimetri koefizientea
Maiztasun-banaketaren grafikoa simetrikoa denean, banaketa simetrikoa dela
esango dugu, hau da, barra-diagrama edo histograma egitean simetrikoa bada,
banaketaren elementuak batezbestekoarekiko bi aldeetan berdin kokatzen direla
esan nahi du.
Aurrekoa betetzen ez bada, banaketa asimetrikoa izango da.
Banaketa bat moda batekoa eta simetrikoa baldin bada, batezbesteko
aritmetikoa, moda eta mediana balio berean daude.
Asimetri koefizientea g1 ikurraz adieraziko dugu sinbolikoki, non:
40 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
Hots: x = M0
= Me
Ezkerrerantz
asimetrikoak
Eskuinerantz
asimetrikoak
Simetrikoak
simetrikoki kokatuta badaude, m3 = 0 izango da; baina maiztasunen balioak
eskuinaldean handiagoak badira, hau da, xi > x­ denean, orduan m3 > 0 izango
da, eta, alderantziz, ezkerraldean handiagoak badira, hau da, xi < x­ denean,
orduan m3 < 0 .
Ikusten dugu, bada, m3 asimetriaren balio adierazle bezala har dezakegula,
baina neurri-unitateak ber hiru izanez zuzenkiago.
erabiltzen da: g1 > 0 bada, maiztasun-banaketa eskuinerantz asimetrikoa dela
esaten da; g1 < 0 bada, alderantziz, ezkerrerantz.
II.2.3.2. Kurtosi-koefizientea edo zapaltasun/zorroztasun-koefizientea
Simetriarekin batera, itxuraren beste balio tipiko bat ikusiko dugu, kurtosi-
-koefizientea hain zuzen.
Maiztasun-banaketaren grafikoa kontutan hartuz, konkretuki, maiztasun-
-poligonoa jarraiaren kasuan edo barrazko diagramaren goi-puntuak lotuko
zituzkeen lerroa diskretuaren kasuan kasu hauek dauzkagu:
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 41
g1 =
m3
Sx
3
m3 = xi - x( )
3 ni
Ni=1
m
izanik, maiztasunen balioak x balioarekiko
g1 =
m3
S3
zapala zorrotza
Batezbesteko aritmetikoa eta bariantza berdina daukaten bi banaketa aztertuz,
itxuraren aldetik bat oso zapala da eta oso zorrotza bestea.
Banaketaren maiztasunak batezbesteko aritmetikoaren inguruan handiak
baldin badira, momentu zentratu bikoitiek, (adibidez, laugarren ordenakoa), balio
handiagoak hartuko dituzte.
Orduan, m4 zapaltasunaren adierazle bezala har daiteke, baina
neurri­unitateak ber lau izanez, zuzenkiago g2 ikurraz adierazten den kurtosi-
koefizientea, zapaltasunaren adierazle bezala erabiliko dugu.
"Normal" deitutako banaketaren kurtosi-koefizientea 3 da eta balio hau
kurtosia aztertzean konparazio-puntu bezala hartuko dugu.
g2, 3 baino handiagoa baldin bada, banaketa zorrotza izango da eta 3 baino
txikiagoa baldin bada, zapala izango da.
g2,-3 kurtosi-koefizientetzat hartzen badugu, kurtosi positiboa edo negatiboa
kontsidera daiteke.
Oharra: Aipatu dugun banaketa "Normala" 3. kurtsoan ikasiko da, inferentzia
estatistikoan, oinarrizko probabilitate-eredua baita.
banaketa Normala : g2 = 3
42 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
g2
=
Sx
4
m4
=
N Sx
4

i = 1
m
(xi
- x)
4
ni
II.3. KONTZENTRAZIO-NEURKETAK
Batezbesteko aritmetikoa egitean zenbakitzailean ateratzen zaigun kopuruak,
abiapuntu estatistiko batetatik ikusita, batzutan ez du zentzu argirik eta
interesgarririk. Adibidez, pertsona batzuren altuera-banaketa aztertzean,
zenbakitzaile hori altueren batuketa izango da; baina, beste kasu batzutan, bereziki
ezaugarri sozioekonomikoetan, aztergarria izaten da adibidez, alokairu-banaketa
aztertzean, alokairu guztien kopurua edo "alokairu-masa" da.
Kontzentrazio-neurketek zehazki "masa" baten uniformetasuna neurtzea dute
helburutzat.
Normalki errenta eta alokairu-banaketetan erabili ohi dira, baina beste
edozein aldagairen banaketatan erabil daitezke.
Suposa dezagun alokairu-banaketa batetan langile guztiek alokairu berdina
jasotzen dutela; orduan, banatzearen uniformetasuna osoa litzateke. Baina, ordez,
alokairu-masa guztia langile batek jasoko balu, uniformetasunik eza ere osoa
izango litzateke edo kontzentrazioa masimoa dela esango genuke kasu honetan.
Banaketak uniformetasun absoluturantz jotzen duenean, maiztasun-
­banaketaren batezbesteko aritmetikoa guztiz adierazgarria da eta, alderantziz
gertatuko da, kontzentrazioa masimoa denean.
II.3.1. LORENZ-en kurba
Grafikoki banaketen kontzentrazioa ikusarazten digun neurrian, interesgarria
zaigu.
Lorenz-en kurba eraikitzeko, ondoko taulan ikusten ditugun zutabeak
kalkulatu beharko ditugu.
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 43
xi ni xi ni Ni Mi Pi Qi
x1 n1 x1 n1 N1 M1 P1 Q1
x2 n2 x2 n2 N2 M2 P2 Q2
. . . . . . .
. . . . . . .
xi ni xi ni Ni Mi Pi Qi
. . . . . . .
. . . . . . .
xk nk xk nk N M 100 100
azken zutabeak honela kalkulatzen dira:
Ni : ( ni ) zutabea metatuz
hots: Ni = n1 + n2 ..... + ni
Mi : ( xi ni ) zutabea metatuz
hots: Mi = x1 n1 + x2 n2 + ...... + xi ni
, eta
(P1 Q1) , (0,0) - jatorriarekin eta beste bikote guztiak elkarren artean zuzenen
bitartez lotuz LORENZ-en kurba lortzen dugu.
Adibidez: Suposa dezagun enpresa batetako langileen banaketa bere asteroko
alokairuaren arabera (mila pezetatan) ondoko taularen lehenengo bi zutabeetan
emana dela:
44 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
ni = N
i
xini = M
i

Pi =
Ni
N
100 maiztasunen(langileena esate baterako) portzentaia metatua
Qi =
Mi
M
100 masaren portzentaia metatua.
Pi , Qi( ){ }iI
bikote guztiak sistema cartesiar batetan grafikoki adieraz
Adibideari dagokion LORENZ-en kurba ondoko hau izango da.
Eskalak, bi ardatzetan berdinak direnez gero, LORENZ-en kurba, karratu
baten barruan aurkitzen da beti. Jatorritik irteten den OD bere diagonala erabiliko
dugu uniformetasunaren erreferentzia moduan.
Zeren eta ( Pi Qi ) multzoko puntu guztiak, OD-n aurkitzen badira orduan
uniformetasuna osoa baitugu.
Hots: langileen arteko % 10-ek, alokairu-masaren % 10-a jasotzen dute,
% 30-ek, alokairu-masaren % 30-a, e.a.
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 45
Pi Qi
metatuak:
PortzentaiaMetaketak
Ni Mi
Alokairu-
-masa: xini
Langile-
-kopurua: ni
Alokairuak:
xi
10
47,5
85
100
20
60
90
100
80
380
680
800
10
30
45
50
80
300
300
120
10
20
15
5
8
15
20
24
N = 50 M =
i = 1
k
xi
ni
= 800
Alokairu-masenportzentaiametatuak%Qi
D
100
75
50
25
langileen portzentaia metatuak % P i
0 25 50 75 A
Zenbat eta tarte handiagoa egon kurba eta diagonalaren artean, orduan eta
banaketa kontzentratuagoa izango da, (edota zenbat eta kurba diagonaletik
hurbilago egon, orduan eta banaketa uniformeagoa).
Abzisa ardatzean Pi kokatzen badugu eta ordenatu ardatzean Qi , LORENZ-
-en kurba, karratuaren beheko triangeluan edukiko dugu (alokairuak txikienetatik
handienetarantz ordenatu ditugunez gero, adibidez ezin dute langileen % 25-ak
alokairu-masaren % 25-a inoiz lortu).
II.3.2. GINI-ren indizea
LORENZ-en kurba banaketen kontzentrazioaren argitzaile bada ere,
zenbakizko indize batetaz kontzentrazioa neurtzea, komenigarria zaigu; esate
baterako, erabilgarria izango zaigu banaketak konbaratzerakoan.
Helburu honi erantzuten dio Gini-ren indizeak edo kontzentrazio-indizeak.
Marraztutako azalera diagonal eta kurbaren artean dagoena bada, honela
definituko dugu IG, GINI-ren indizea:
Kontzentrazioa masimoa bada, orduan OAD azalera = marraztutako azalera,
eta IG = 1 .
Ordez, kontzentrazioa minimoa bada edo eta banaketa uniformea, orduan
marraztutako azalera = 0 izango da eta IG = 0 .
Kalkulua: IG Gini-ren indizea kalkulatzean, azalera horiek zuzenki neurtuz
kalkula litezke; bainan beti era honetan erraza izaten ez denez gero, gutxi
gorabehera ondoko formula erabiliz kalkulatzen da IG :
46 ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­
IG =
Marraztutakoazalera
OAD azalera
non 0 IG 1
kontura gaitezen, batukariak k-1 batugai bakarrik dituela, pk - qk = 0 baita.
Gutxi gorabeherako formula honetaz ere egiazta daiteke 0 IG 1 dela.
Adibidez: Lehenengo taularen datuekin jarraitzen badugu, aurreko formula
erabiliz, IG GINI-ren kontzentrazio-indizea ondoko hau izango da:
LORENZ-en kurba nahiz GINI-ren indizea aldagai sozioekonomikoetarako
erabilgarriak dira. Adibide bezala hauek aipatuko ditugu: errenta pertsonalaren
banaketa, nekazal-propietatearen banaketa, sektore batetako enpresa-
-produkzioaren banaketa eta abar.
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ 47
IG
=

i = 1
k - 1
Pi

i = 1
k - 1
(Pi
- Qi
)
27'5170
Pi - QiQiPi
10
12'5
5
10
47'5
85
20
60
90
IG
=

i = 1
k - 1
Pi

i = 1
k - 1
(Pi
- Qi
)
=
170
27' 5
= 0' 16
III. ZENBAKI INDIZEAK
III.1. INDIZE SINPLEAK
III.2. PONDERAZIO GABEKO INDIZE KONPLEXUAK
III.2.1. Batezbesteko aritmetikoa sinplearen metodoa
III.2.2. Batezbesteko agregatu sinplearen metodoa
III.3. INDIZE KONPLEXU PONDERATUAK
III.3.1. Balioen, prezioen eta kopuruen indizeak
III.4. INDIZE KONPLEXUEN ERAIKETAN SORTZEN
DIREN ZENBAIT ERAGOZPEN
III.4.1. Aldagaien hautapena
III.4.2. Somatutako leku eta denboraren hautapena
III.4.3. Talde eta azpitaldeen hautapena
III.4.4. Oinarri-denboraren hautapena
III.4.5. Formula eta ponderazioen hautapena
III.4.6. Indizearen esangura eta zabaldura
III.5. ERAGOZPEN BEREZI BATZU
III.5.1. Oinarri-aldaketa indize sinpleetan
III.5.2. Berriztapen eta loturak indize konplexuetan
III.6. ZENBAKI-INDIZEEN APLIKAPENAK
III.6.1. Kontsumo-prezioen indizeak
III.1. INDIZE SINPLEAK
Aldagai baten gorabeherakadak aztertzeko, indize sinpleak erabiltzen dira,
eta aldagai batzuren gorabeherakadak "batera" aztertzeko indize konplexuak.
Hemen denboran zeharreko gorabeherakadak aztertuko dira. Erreferentzia
gisa hartzen dugun denborari, oinarria deritzogu.
Erreferentziaren balioarekiko aldagaiaren balio bakoitzaren portzentaiak baino
ez dira indize sinpleak.
Portzentaia hauen bidez, neurtzeko unitatea desagertzen da eta aldagai baten
gorabeherakadak autonomoki azter daitezke. Honela indizeak aldagai­segiden
gorabeherakadak errazten ditu (originalki unitate desberdinetakoak).
Izan bedi x0, x1 ... xt aldagaiaren balio-segida denboral bat; hots, 0, 1, .... t
denboretan neurtutako balioak.
t = 0 oinarritzat harturik eta x0 balio erreferentziala, indize sinpleak ondoko
taulan agertzen diren bezala kalkulatzen dira:
Estatistika deskribatzailea ­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­

Estatistika deskribatzailea: Koerlazioa, erregresioa eta datu anizkoitzen analisia (2. argitalpena)