ESTATISTIKARAKO
SARRERA
Koerlazioa, erregresioa eta
datu anizkoitzen analisia
Plangintza berriei egokitua
Karmele Fernandez Agirre
© Karmele Fernandez Agirre
© Udako Euskal Unibertsitatea
I.S.B.N.: 84-86967-70-8
Lege-gordailua: BI-19-96
Inprimategia: BOAN S.A. Padre Larramendi 2. BILBO
Banatzaileak: UEU. General Concha 25, 6. BILBO
Zabaltzen: Igarabide, 88. DONOSTIA
AURKIBIDEA
HITZAURREA .......................................................................... XIII
I. EZAUGARRI ESTATISTIKO BAKUNAK,
BANAKETAK, TAULAK, ADIERAZPIDE GRAFIKOAK
I.1. ESTATISTIKAREN HISTORIA LABURRA.
ESTATISTIKA ETA PROBABILITATEA ............................. 3
I.2. OROKORTASUNAK .......................................................... 5
I.2.1. Populazioa eta lagina .............................................. 5
I.2.2. Unitate estatistiko edo indibiduoak .......................... 6
I.3. EZAUGARRI ESTATISTIKOAK ........................................ 6
I.3.1. Ezaugarri estatistiko bakunak ................................ 6
I.3.1.1. Ezaugarri kuantitatiboak ........................... 7
I.3.1.2. Ezaugarri kualitatiboak ............................ 7
I.4. MAIZTASUN-BANAKETA BAKUNAK ............................. 8
I.4.1. Maiztasun-banaketak (absolutuak, erlatiboak
eta metatuak) ......................................................... 8
I.4.2. Taulak ....................................................................... 9
I.5. MAIZTASUN-BANAKETA BAKUNEN
ADIERAZPIDE GRAFIKOAK .......................................... 13
I.5.1. Barra-diagramak ..................................................... 13
I.5.2. Histogramak ............................................................. 15
I.5.3. Maiztasun-poligonoak ............................................ 17
I.5.4. Diagrama linealak ................................................. 18
I.5.5. Beste adierazpide grafikoak ................................... 18
II. EZAUGARRI BAKUNEN BALIO TIPIKOAK
II.1. MOMENTUAK .................................................................... 23
II.1.1. Momentu arruntak edo jatorriarekikoak ................. 23
II.1.2. Momentu zentratuak edo batezbestekoarekikoak ..... 24
II.2. MAIZTASUN-BANAKETA BAKUNEN BALIO
TIPIKO EDO ESTATISTIKOAK ........................................ 26
II.2.1. Zentru-joeraren edo posizioaren balio tipikoak ....... 26
II.2.1.1. Batezbesteko aritmetikoa ........................ 27
II.2.1.2. Batezbesteko geometrikoa......................... 30
II.2.1.3. Batezbesteko harmonikoa ........................ 31
II.2.1.4. Moda ........................................................ 31
II.2.1.5. Mediana eta koantilak .............................. 34
II.2.2.Sakabanatzearen balio tipikoak ............................... 36
II.2.2.1. Bariantza ................................................. 37
II.2.2.2. Batezbesteko desbidazioa ........................ 38
II.2.2.3. Ibiltartea ................................................. 39
II.2.3. Itxuraren balio tipikoak ......................................... 40
II.2.3.1. Asimetri koefizientea .............................. 40
II.2.3.2. Kurtosi koefizientea edo
zapaltasun/zorroztasun-koefizientea ......... 41
II.3. ALDAGAIEN TRANSFORMAZIO LINEALAK ..................... 42
II.3.1. Aldagai zentratua ................................................... 43
II.3.2. Aldagai tipifikatua.................................................... 44
II.4. KONTZENTRAZIO-NEURKETAK ....................................... 44
II.4.1. LORENZ-en kurba ................................................... 45
II.4.2. GINI-ren indizea .................................................... 47
III. EZAUGARRI ESTATISTIKO BIKOITZAK,
BANAKETAK, TAULAK, ADIERAZPIDE GRAFIKOAK
III.1. EZAUGARRI ESTATISTIKO BIKOITZAK ........................... 51
III.2. MAIZTASUN-BANAKETA BIKOITZAK .............................. 51
III.2.1. Maiztasun-banaketa bikoitzak eta
bazter-maiztasunak ............................................... 51
III.2.2. Maiztasun-banaketa bikoitzak: Taulak .................. 53
III.3. MAIZTASUN-BANAKETA BIKOITZEN
ADIERAZPIDE GRAFIKOAK ......................................... 55
III.3.1. Sakabanatze-diagrama edo puntu-hodeia .............. 55
III.4. MAIZTASUN-BANAKETA BALDINTZATUAK .................. 57
VI
III.5. TAULA BATEN DEPENDENTZIA EDO
INDEPENDENTZIA ......................................................... 60
III.6. KONTINGENTZI TAULA BATEN ERRENKADA
ETA ZUTABEEN BATEZBESTEKO SOSLAIAK ................ 62
IV. EZAUGARRI BIKOITZEN BALIO TIPIKOAK
IV.1. MOMENTUAK ...................................................................... 65
IV.1.1. Momentu arruntak edo jatorriarekikoak.................. 65
IV.1.2. Momentu zentratuak edo batezbestekoarekikoak .... 66
IV.2. MAIZTASUN-BANAKETA BIKOITZEN BALIO
TIPIKO EDO ESTATISTIKOAK ........................................ 67
IV.2.1. Kobariantza: Sxy .................................................... 67
IV.2.2. Koerlazio-koefizientea: rxy ..................................... 68
IV.3. ALDAGAIEN TRANSFORMAZIO LINEALAK .................... 70
IV.4. KOERLAZIO GABEKO ALDAGAIEN BI PROPIETATE...... 73
IV.5. SAKABANATZE- ETA KOERLAZIO-MATRIZEAK ............. 74
IV.6. OROKORPENA .................................................................... 75
V. KOERLAZIOA ETA ERREGRESIOA
V.1. SARRERA ............................................................................... 79
V.2. ERREGRESIOA R2-n ............................................................ 79
V.2.1. Batezbestekoaren erregresioa ................................. 80
V.2.2. Karratu txikienen erregresioa ................................ 80
V.3. KARRATU TXIKIEN ERREGRESIO LINEALA R2-n ............ 81
V.3.1. Karratu txikienen erregresio zuzena ........................ 81
V.3.2. Karratu txikienen erregresio linealaren propietateak 84
V.3.3. Hondar bariantza eta mugatze-koefizientea ............. 85
V.3.4. Erregresio-koefizientearen eta koerlazio-koefizientearen
zeinuaren azterketa. Doikuntzaren egokitasuna ....... 86
V.4. ERREGRESIO LINEALA Rn-n ............................................... 89
V.4.1. Sarrera ..................................................................... 89
V.4.2. Erregresio hiperplanoa ............................................. 90
Estatistika deskribatzaileaVII
V.4.3. Propietateak .............................................................. 91
V.4.4. Erregresio hiperplanoaren koefizienteak lortzeko
metodoa ..................................................................... 92
V.4.5. erregresio partzial estandardizatuen koefizienteak 94
V.4.6. Hondar bariantza. Mugatze-koefizientea eta
koerlazio-koefiziente anizkoitza ................................ 95
V.4.7. Edozein aldagai azalduaren erregresioaren
orokorpena ............................................................... 97
V.4.8. Erregresio-koefiziente desberdinen zeinuaren azterketa.
Doikuntzaren egokitasuna ........................................ 97
V.5. KOERLAZIO PARTZIALA ..................................................... 98
V.5.1. Koerlazio partziala R3-n .......................................... 99
V.5.2. Koerlazio partziala Rn-n .......................................... 101
V.5.3. Koerlazio partzial eta erregresio-koefizienteen
arteko erlazioa .......................................................... 103
V. A. Eranskina: ALDAGAI ESTATISTIKO "n"-KOITZEN
MATRIZE-ESTATISTIKOAK
V.A.1. DATU-MATRIZEAK .......................................................... 107
V.A.2. BATEZBESTEKO-BEKTOREA: PROPIETATEAK............. 108
V.A.3. KOBARIANTZA MATRIZEA .............................................. 109
V.A.3.1. Kobariantza matrizearen propietateak .................. 110
V.A.4. KOERLAZIO-MATRIZEA ................................................ 112
V.A.4.1. Koerlazio-matrizearen propietateak ..................... 114
V.A.5. DERIBAZIO BEKTORIALA ............................................... 114
VI. ZENBAKI-INDIZEAK
VI.1. INDIZE SINPLEAK .......................................................... 117
VI.2. PONDERAZIO GABEKO INDIZE KONPLEXUAK ......... 118
VI.2.1. Batezbesteko aritmetiko sinplearen metodoa ....... 118
VI.2.2. Batezbesteko agregatu sinplearen metodoa ........... 118
VIII
VI.3. INDIZE KONPLEXU PONDERATUAK ............................. 124
VI.3.1. Balioen, prezioen eta kopuruen indizeak ................ 124
VI.3.1.1. LASPEYRES-en indizeak ........................ 127
VI.3.1.2. PAASCHE-ren indizeak ........................... 127
VI.3.1.3. FISHER-en indizeak ............................... 129
VI.3.1.4. Propietate eta erlazio batzuk: batera-
garritasuna eta alderantzizkotasuna........ 131
VI.3.1.5. Kalkulua ................................................. 132
VI.4. INDIZE KONPLEXUEN ERAIKETAN SORTZEN
DEN ZENBAIT ERAGOZPEN .......................................... 134
VI.4.1. Aldagaien hautapena ............................................ 134
VI.4.2. Somatutako leku eta denboraren hautapena ........... 134
VI.4.3. Talde eta azpitaldeen hautapena ........................... 134
VI.4.4. Oinarri-denboraren hautapena ............................. 134
VI.4.5. Formula eta ponderazioen hautapena .................... 135
VI.4.6. Indizearen esangura eta zabaldura ......................... 135
VI.5. ERAGOZPEN BEREZI BATZUK ........................................ 136
VI.5.1. Oinarri-aldaketa indize sinpleetan ........................ 136
VI.5.2. Berriztapen eta loturak indize konplexuetan .......... 136
VI.6. ZENBAKI-INDIZEEN APLIKAZIOAK ................................ 138
VI.6.1. Kontsumo-prezioen indizeak .................................. 138
VI.6.2. Moneta-unitate arruntetan dauden
magnitudeen deflazioa ........................................... 139
VII. DESKRIBAPEN ESTATISTIKOAREN
ADIERAZPIDE GEOMETRIKOAK
VII.1. OROKORTASUNAK ........................................................... 143
VII.2. X DATU-MATRIZEAREN BI ADIERAZPIDE
GEOMETRIKO ..................................................................... 143
VII.3. BI ALDAGAI ETA BI OHARPEN ....................................... 144
VII.4. BI ALDAGAI ETA HIRU OHARPEN................................... 151
VII.5. ERREGRESIO BAKUNA ALDAGAI ESTATISTIKOEN
BALIO-MULTZOEN ESPAZIOAN ........................................ 157
Estatistika deskribatzailea IX
VIII. DOIKUNTZA ORTOGONALA ETA
KOBARIANTZA MATRIZEAREN AUTODIREKZIOAK
VIII.1. SARRERA ......................................................................... 163
VIII.2. ANALISIA R2 ESPAZIOAN. DOIKUNTZA
ORTOGONALAREN ZUZENA .......................................... 163
VIII.3. DOIKUNTZA ORTOGONALAREN ZUZENAREN
LORPENA ........................................................................ 167
VIII.4. HODEI DUALAREN AURKEZPEN GRAFIKOA ............ 170
VIII.5. TRANTSIZIO ERLAZIOAK ............................................... 172
VIII.6. BATERAKO AURKEZPEN GRAFIKOA ETA
INTERPRETAZIOA ........................................................... 173
VIII.7. DOIKUNTZA ORTOGONALAREN ZUZENA ALDAGAI
NORMATUENTZAKO...................................................... 174
IX. DATU ANIZKOITZEN ANALISIA
IX.1. SARRERA ............................................................................. 181
IX.2. ANALISI OROKORRA ........................................................ 182
IX.2.1. Rn espazioaren Rq azpiespazio baten bidez
egindako doikuntza ................................................ 183
IX.2.2. Rm espazioaren Rq azpiespazio baten bidez
egindako doikuntza ................................................ 186
IX.2.3. Rn eta Rm espazioen arteko erlazioa ................ 187
IX.2.4 X datu-taularen berreraketa ................................. 189
IX.3. OSAGAI NAGUSIZKO ANALISIA .................................... 191
XII.3.1. Rn espazioan egindako analisia .......................... 192
XII.3.2. Rm espazioan egindako analisia ......................... 193
XII.3.3. Baterako aurkezpen grafikoak .............................. 197
XII.3.4. Adibidea ............................................................... 199
IX.4. KORRESPONDENTZI ANALISI FAKTORIALA ................. 207
IX.4.1. Hodeiak, masak eta distantziak .............................. 210
IX.4.2. Rn espazioan egindako analisia .......................... 213
IX.4.3. Rm espazioan egindako analisia ......................... 214
IX.4.4. Rn eta Rm espazioen arteko erlazioa ................. 215
X
IX.4.5. Maiztasun taularen berreraketa ........................... 217
IX.4.6. Interpretaziorako laguntzak .............................. 218
IX.4.7. Korrespondentzia Anitzeko Analisi Faktoriala ...... 220
IX.5. ELEMENTU GEHIGARRIAK ............................................ 223
IX.6. SAILKAPEN-METODOAK .............................................. 224
IX.6.1. Goranzko Sailkapen Hierarkikoa ........................ 224
IX.6.1.1. Bariantzaren metodoa ......................... 225
IX.6.2. Adibidea ............................................................. 227
Estatistika deskribatzaile XI
HITZAURREA
Eskuartean daukazun liburua, Ekonomia eta Enpresa-Zientzien Fakultateko
"Estatistikarako Sarrera" asignaturaren testuliburu gisa, sortuz eta moldatuz joan
garen liburu batzuren ondotik dator.
Duela 13 urte, 1983. urtean alegia, Estatistikaren Hastapenak izenaz lehen
apunte-liburua argitaratu genuen, eta ondoren, Estatistika Deskribatzailea.
Koerlazioa, Erregresioa eta Datu Anizkoitzen Analisia izenburuaz 1989. eta 1993.
urteetan asignaturaren egitarauei egokituz eta gai batzuk berrituz bi argitalpen
atera genituen.
Orain, bi urte t'erdi igaro ondoren Estatistikarako Sarrera. Koerlazioa,
Erregresioa eta Datu Anizkoitzen Analisia kaleratzen dugu. Bi urte t'erdi epe
laburra da, baina Sarrikoko ikastetxean aldaketa asko gertatu dira. Hauetatik
garrantzitsuena plangintza berrien martxan jartzea izan da.
Liburu honetan, irakasgaiak funtsean aurrekoak badira ere lizentziatura berriei
egokiturik daude. Ekonomia lizentziaturaren "Estatistikarako Sarrera" asignaturak
6 kreditu ditu, hau da, 60 ordu eta Administrazio eta Enpresa Zuzendaritza
lizentziaturarenak 3 kreditu, hau da, 30 ordu.
Irakasgai guztiek, Ekonomia lizentziaturako asignaturaren egitaraua betetzen
dute.
Administrazio eta Enpresa Zuzendaritza lizentziaturaren egitaraua lehen VI
irakasgaiek beteko dute, gainera gai hauetan zenbait frogapen ez da emango. VII,
VIII eta IX irakasgaiak "Estatistikarako Sarrera" asignatura gainditzeko, behar ez
badira ere, lizentziatura honetan dagoen zenbait berezitasunetan, oso
garrantzizkoak izan daitezke.
Bestalde, testuliburu hau Unibertsitateko beste ikastetxe batzuetan, euskaraz
azaltzen diren Estatistika asignaturetan, erabilgarria izan daiteke; adibidez,
Enpresa Unibertsitate Eskoletan, Gizarte-Graduatuen Eskolan nahiz beste
fakultate eta eskoletan. Irakasle eta ikasle askori laguntzeko ilusioz lan egin dugu.
Azken 13 urte hauetan, asignaturaren egitarauetan egindako talde-lana izan da
eta meritua ez da gurea bakarrik. Talde hauetan eduki ditugun lankide guztiak
biziki eskertu nahi ditugu eta bereziki guztiok oroimenean daukagun J.M. Piris.
Bestalde, euskararen aldetik lagun askoren laguntza eskergaitza izan da,
gehienak UEUren ingurukoak direlarik. Eskerrak guztiei eta edizio honetan
hainbeste lagundu diguten UEUko Mari Karmen Menika, Nekane Intxaurtza eta
Izaro Gurrutxaga.
Egileak
Sarriko, 1996.eko urtarrila
XIV
I. EZAUGARRI ESTATISTIKO BAKUNAK,
BANAKETAK, TAULAK,
ADIERAZPIDE GRAFIKOAK
I.1. ESTATISTIKAREN HISTORIA LABURRA.
ESTATISTIKA ETA PROBABILITATEA
I.2. OROKORTASUNAK
I.2.1. Populazioa eta lagina
I.2.2. Unitate estatistiko edo indibiduoak
I.3. EZAUGARRI ESTATISTIKOAK
I.3.1. Ezaugarri estatistiko bakunak
I.3.1.1. Ezaugarri kuantitatiboak
I.3.1.2. Ezaugarri kualitatiboak
I.4. MAIZTASUN-BANAKETA BAKUNAK
I.4.1. Maiztasun-banaketak (absolutuak,
erlatiboak eta metatuak)
I.4.2. Taulak
I.5. MAIZTASUN-BANAKETA BAKUNEN
ADIERAZPIDE GRAFIKOAK
I.5.1. Barra-diagramak
I.5.2. Histogramak
I.5.3. Maiztasun-poligonoak
I.5.4. Diagrama linealak
. I.5.5. Beste adierazpide grafikoak
I.1. ESTATISTIKAREN HISTORIA LABURRA.
ESTATISTIKA ETA PROBABILITATEA
Estatistika hitza gutxienez hiru zentzu desberdinetan erabil daiteke.
Esan ohi da:
- "estatistika batzuk" izen arrunt bezala erabiliz edo.
- "..... txosten estatistiko bat....." adjetibotzat hartuz edo.
- ".... Estatistika ikastea.... " izen propio bezala azkenik.
Hitz honen adierazpen orokor, zahar eta ez-espezializatua hauxe da:
MULTZO HANDIEN "Ikasketa" edo "erabilera", MULTZO ZENTZUAN
HARTURIK.
Honela, hasieran Estatistika artea eta teknika izan zen.
Mundu neolitikoan herriak eta salerosketak gero eta ugariagoak egin zirenez,
Estatistikaren beharra sortu zen.
Gizartearen hasiera historikotik praktikatu da beraz. Israeldar, erromatar,
txinatar eta inken aparteko inperioarenak, adibide eder batzuk besterik ez dira.
Baina "Cinquecento" italiarrean (XVI. mendean) izena eta bere buruaren
kontzientzia hartzen hasi zela dirudi, kontabilitatearekin nahiko lotuta hasi ere.
XVIII. mendetik aurrera argiago eta garbiago agertzen da, beharbada. Estatu-
-zientziaren alboan hasi zen, gehienbat, Alemaniak emandako bultzada medio.
Etapa honetan, oraindik Estatistika ez da zientzia, eta gertaera aleatorioetatik
eta probabilitate-teoriatik urrun zegoen artea zen.
Baina geroztik "estatistikariei" arazoak agertzen hasi zitzaizkien:
Estatistika deskribatzailea 3
- nola lortu ondorio zientifikoak estatistiketatik?
- nola lortu informazio fidagarriak kolektibo aldakor edo zentsatzeko zail
direnetatik?
Britaniar giroan XIX. mendearen amaieran eta XX.aren hasieran, oztopo
hauetatik irteten zen heinean, Estatistika zientzia bilakatu zen.
Orain Estatistika probabilitate-teoriarekin esentziazko harremanetan dagoen
zientzia da.
Honela, hurrengo galderetan ikusiko dugun maiztasun kontzeptutik
probabilitate kontzeptura pasatu zen.
Eskematikoki ikusiz:
Fenomenoetatik bere kausetarainoko bidea egiten duen ezagupide honi,
INDUKZIOA deritzo Estatistikaren alorrean eta, hementxe, INFERENTZIA
ESTATISTIKOA.
Estatistika zientziaren oinarri trinkoan bermatutako estimazioak egiten dira
gaur egun, beraien fidagarritasuna ere neurtzen delarik.
Hau dena INFERENTZIA ESTATISTIKOARI dagokio.
Apunte-liburu honetan ikusten diren gaiak Estatistika Deskribatzaileari
dagozkio; hau da, oinarrizko Estatistika ikusiko dugu edo Estatistikaren
hastapenak, eta halaber, Estatistika Deskribatzaile Anizkoitza edo Datu-Analisia
IX. gaian.
MAIZTASUNAK PROBABILITATEAK
(gertaeren arloa) (joerak, gertagarritasunak)
KOLEKTIBO KOLEKTIBO
KONKRETUAK ABSTRAKTUAK
4
} {
Dakusagun, bada, gaian sartu aurretik, ESTATISTIKA DESKRIBA-
TZAILEAREN definizio bat.
ESTATISTIKA DESKRIBATZAILEA, datu-multzo HANDIAK aurkez
ditzakeen teknika bat da, multzo hau eskurakoi bihurtuz, beraren egitura
gardenduz eta beraren barne-harremanak neurtuz.
I.2. OROKORTASUNAK
I.2.1. Populazioa eta lagina
Ikerketa estatistiko bakoitzean objektu nagusi diren pertsona, ondasun,
saioaren emaitza (adibidez: datuaren aurpegia), probintzia baten herri,
hauteskundearen alderdi politiko, edota fabrikazio-unitateek osatzen duten
multzoari POPULAZIO edo UNIBERTSO deritzogu.
Populazioa ondo definitzeko edozein elementu partikular populaziokoa den
ala ez jakin ahal izatea, beharrezkoa zaigu.
Populazioak bukaezinak (adb: boltsa bateko erauzketak) ala bukakorrak
(eskualde bateko enpresa kooperatiboak) izan daitezke.
LAGINA: Lagina azpipopulazio errepresentagarri bat besterik ez da;
populazio batez konklusio fidagarriak atera nahi baditugu, ahal dugun
azpipopulazio errepresentagarriena aukeratu beharko dugu lagintzat.
LAGIN errepresentagarri hau erauzten duen prozesuari zorizko laginketa
deritzo.
Lagina erauztean populazioaren elementu guztiei posibilitate berdina ematen
badiegu, zorizko lagin sinplea deritzogu honela aukeratutako laginari.
Lagina erauzteko beste era eta jokabide asko daude, geruzatuz, mordoketaz...
baina hau LAGINKETA-TEORIAri dagokio.
Lagina osatzen duten elementuen kopuruari laginaren tamainua deritzo.
Estatistika deskribatzailea 5
Sinbolikoki:
= Populazioa
' = Lagina
N = Laginaren tamainua.
I.2.2. Unitate estatistiko edo indibiduoak
Populazioa edo lagina osatzen duen elementu bakoitzari unitate estatistiko
edo indibiduo deritzogu.
Indibiduo izena, estatistika deskribatzailearen jatorri demografikoari zor
diogu.
I.3. EZAUGARRI ESTATISTIKOAK
Ikerketa estatistiko batean helburua ez dugu populazioa edo lagina
exhaustiboki ikertzea, beraren ezaugarri batera edo batzuetara mugatuko gara
baizik.
Ikertu nahi dugun ezaugarria bakarra bada, ezaugarri estatistiko bakuna
deritzo.
Populazioaren bi edo ezaugarri gehiago batera ikertu nahi baditugu,
ezaugarri estatistiko anizkoitza deritzo.
Ezaugarri estatistikoek (bakun ala anizkoitzek) populazio edo laginen
multzoko indibiduo bakoitzean balio indibidual bat har dezakete.
Lagineko indibiduo-multzoari, ezaugarriaren balio-multzo bat dagokio.
Sinbolikoki:
= { 1, 2, ....... } { x1, x2, ......... , xn }
= { 1, 2, ....... } {(x1 y1), (x2 y2) ..... (xn yn) }
I.3.1. Ezaugarri estatistiko bakunak
Ezaugarri estatistiko bakunen sailkapena bere balio multzo desberdinen
arabera:
'= 1,2,...N{ }
6
I.3.1.1. Ezaugarri kuantitatiboak
Ezaugarriaren balio indibidualak populazioan edo laginean zenbakiak baldin
badira, edota balio-multzoa zenbakizkoa bada, ezaugarri kuantitatiboa deritzo.
Ezaugarriari dagokion balio-multzoa, multzo diskretua denean, ezaugarri
diskretua deritzo.1
Balio biren artean edozein balio har dezakenean ezaugarri jarraia deritzo.
I.3.1.2. Ezaugarri kualitatiboak
Ezaugarriak har ditzakeen balio indibidualak kategoria edo atributuak
direnean, edota balio-multzoa kategoria edo atributuek osatzen dutenean
(diskretuak beraz), ezaugarri kualitatiboa deritzo.
Ondo klasifikatu ahal izateko, ezaugarri kualitatiboak hiru baldintza hauek
bete behar ditu:
- Ondo definitua, hau da, kategoria edo atributu bakoitzak zer ulertarazten
duen argiro azaldu behar du.
- Esklusibotasuna, hau da, indibiduo bat ezin liteke bi kategoriatan egon.
- Exhaustibotasuna, hau da, indibiduo guztiek nonbait klasifikatuak egon
behar dute.
ADIBIDEAK: Eskualde bateko enpresa kooperatiboen lagin bat aztertzean:
- Langile-kopurua, ezaugarri kuantitatibo diskretua da;
- Produkzioa, ezaugarri kuantitatibo jarraia da;
EZAUGARRI JARRAIAK
KUANTITATIBOAK
ESTATISTIKO DISKRETUAK
KUALITATIBOAK
BAKUNAK
EDO ATRIBUTIBOAK
Estatistika deskribatzailea 7
_______________
1. Balio-multzoko elementuak, puntu isolatuak direnean, balio-multzo diskretu bat dugu.
- Lekutasuna, ezaugarri kualitatiboa da.
I.4. MAIZTASUN-BANAKETA BAKUNAK
I.4.1. Maiztasun-banaketak (absolutuak, erlatiboak eta metatuak)
Ezaugarri diskretuetan:
Suposa dezagun N indibiduoz osatutako lagin bat, non ezaugarri bakun batek
"m" balio edo kategoria desberdin hartzen dituen.
Hots:
{ 1, 2, .... } { x1, x2, ......... , xj ....... xm }
{ 1, 2, .... } {,, .... , J, .... M }
xj balioaren MAIZTASUN ABSOLUTUA, sinbolikoki nj ikurraz
adieraziko dugu, eta laginean xj balioa hartzen duten indibiduoen kopurua da.
Non:
xj balioaren MAIZTASUN ERLATIBOA, sinbolikoki fj ikurraz
adieraziko dugu, non:
hau da, laginean xj balioa hartzen duten indibiduoen kopurua erlatiboki kontutan
hartuz lortzen den proportzioa da.
Maiztasun erlatiboak portzentaietan ere adierazten dira, batzuetan nahiko
komenigarria baita horrela egitea.
Orduan:
fj =
nj
N
nj
j=1
m
= N
nj
j=1
m
= N
8
Laginari dagokion balio-multzoa ordenatu ahal badugu (ezaugarria
kuantitatiboa bada, beti; bestela ez beti), txikitik handira ordenatuko dugu.
Hots:
x1 x2 ...... xj ...... xm
Kasu honetan, xj balioaren MAIZTASUN ABSOLUTU METATUA,
sinbolikoki Nj , honela definituko dugu:
hau da, laginean xj balioa eta txikiagoak hartzen dituzten indibiduoen kopurua da.
Eta: xj balioaren MAIZTASUN ERLATIBO METATUA, sinbolikoki Fj,
honela definituko dugu:
hau da, xj balioa eta txikiagoak hartzen dituzten indibiduoen kopurua N
indibiduo guztiekiko kontsideratutako proportzioa (batekotan).
Edozein maiztasun erlatibo bezala, portzentaietan ere adierazten dira.
I.4.2. Taulak
Kasu honetan, Fm = pj
j=1
m
=100
Fj =
n1 + n2 +K+nj
N
=
Nj
N
= f1+K+fj
Fm = fj
j=1
m
=1
Nj = n1 + n2 +K+nj Nm = nj
j=1
m
= N
Pj = %fj 100 pj
j=1
m
=100
Estatistika deskribatzailea 9
Datu edo balioen ordenaketa eta elkarketari TABULAZIOA deritzo, eta,
azkeneko datu-disposizioari, TAULA ESTATISTIKOA.
Lagin bati dagokion maiztasun-banaketen taula (ezaugarri bakun eta
diskretua izanik) ondokoa da.
Ezaugarri jarraietan
Nahiz eta teorikoki ezaugarria etengabea izan eta fenomeno askok ezaugarri
mota honi erantzun, praktikan zehaztasun gehiago edo gutxiago duten tresnez
neurtzen direnez gero, diskretu bukaezinak gertatzen zaizkigu.
Hots:
baina praktikan:
Lehen urratsean: ezaugarriari dagokion balio-multzoa mailatan zatituko
dugu, mailen muturrak ondo definituz.
I = a0,a1( ) a1,a2( ) ... an-1,an( )
1, 2,...,N{ } x
x1,x2,...,xN ..{ } a,b( ) R
1,2,...,N{ } x
x1,x2,...,xN{ } (a,b) R
Lagina Balio-
-multzoa
MAIZTASUN-BANAKETA
M. absolutuak M. absolutu
metatuak
M. erlatiboak M. erlatibo
metatuak
1F
2F
jF
1
1f
2f
jf
f
1N
2N
jN
N
1n
2n
jn
n
1x A
2
1
2
j
m
. .
. .
. .
. .
. .
. .
. .
. .
. .
. .
. .
. .
N m
x B
jx J
mx M
10
non:
a a0 a1 a2 .... an-1 an b
Mailen kopurua, tamainu desberdinekoak hartu ala ez...... azterketa
bakoitzean erabaki beharreko gauzak dira, baina beti ere mailaketak hiru baldintza
hauek bete beharko ditu:
- Ondo definituak izatea
- Esklusibotasuna
- Exhaustibotasuna
Bigarren urratsean: maila bakoitza balio batera mugatuko dugu, klase-
-ordezkari deritzoguna.
Normalki ordezkaria, maila tartearen erdiko puntua da, baina goi ala beheko
muturrean ere izan liteke.
Honela bada, balio-multzoko maila bakoitza, balio batera mugatzen dugu
(ordezkariaren baliora) eta laburpen honetaz informazio estatistikoa galdu arren,
hasieran ezaugarri jarraia zena, ezaugarri diskretu bukakor bihurtzen dugu, eta
dagokion maiztasun-banaketa kalkulatu ondoren, ondoan dagoen taula bezalako
batean adieraz daiteke.
2
1
..
..
(a0,a1)
(a1,a2)
.. ..
(aj-1 ,aj)
.. ..
(am-1,am)
x1
x2
..
xj
..
xm
M. erlatibo
metatuakM. erlatiboak
M. absolutu
metatuak
M. absolutuakMailak edo
klaseak
Lagina
F1
F2
Fj
1
f1
f2
..
fj
..
fm
N1
N2
Nj
N
n1
n2
..
nj
..
n m
Klase-
-ordezkariak
N
nj = N
m
fj = 1
n
Estatistika deskribatzailea 11
ADIBIDEAK
a) X ezaugarri kualitatiboa da.
Eskualde bateko populazioaren banaketa produkzio-sektoreen arabera:
(Kasu honetan, sektore-kategoria bakoitzari dagozkien maiztasun erlatiboak
portzentaietan bakarrik jarri ditugu).
b) X ezaugarria kuantitatiboa da.
b-1) Diskretu-taldekatua
Enpresen banaketa, langile kopuruaren arabera herri bateko enpresetatik
lortutako lagin batean.
Langile kopurua
Enpresa kopurua
m. absolutuak m. abs. metatuak
0-tik
10-tik
50-tik
100-tik
500-tik
1.000-tik
5.000-tik
10.000-tik
N = 8.500
9-ra
49-ra
99-ra
499-ra
999-ra
4.999-ra
9.999-ra
aurrera
3.876
2.028
976
689
320
304
295
12
3.876
5.904
6.880
7.569
7.889
8.193
8.488
8.500
70
95
100
70
25
5
Nekazaritza
Industrigintza
Zerbitzuak
Sektoreak Portzentaiak Portzentaia
metatuak
12
(Kasu honetan, laginean langile kopuru ezaugarriari zegozkion balio
desberdinak asko zirenez gero, taldekatu egin ditugu mailaka edo klaseka).
b-2) Ezaugarri jarraia
Soldaduzkara urte batean doazen gazteen banaketa, beren altueraren arabera:
(Kasu honetan, mailaketan, maila guztiek tamainu berdina dute, aurrenekoa
eta azkenekoa kenduz).
I.5. MAIZTASUN-BANAKETA BAKUNEN ADIERAZPIDE
GRAFIKOAK
Nahiz eta maiztasun-banaketen taulak informazio guztia hartu (balioak
mailetan laburtuak izan ez badira behintzat), grafikoki adierazteak asko laguntzen
du ikusarazten eta ulertzen.
Adierazpide grafiko asko erabili izan arren, batzuk bakarrik ikusiko ditugu.
I.5.1. Barra-diagramak
Oso baliagarriak zaizkigu ezaugarriak diskretuak ditugunean (kuantitatiboak
zein kualitatiboak).
Abzisa-ardatzean balio edo kategoria desberdinak (ahal bada ordenaturik),
ezarriko ditugu, eta ordenatu-ardatzean berriz laginari dagozkion maiztasunak
(absolutuak, erlatiboak ala metatuak).
ADIBIDEAK
1
8
20
38
68
88
98
100
1
7
12
18
30
20
10
2
1'525
1'575
1'625
1'675
1'725
1'775
1'5 b. gutxiago
1'5-tik 1'55-era
1'55 1'60
1'60 1'65
1'65 1'70
1'70 1'75
1'75 1'80
1'80 b. gehiago
Portzentaia
metatuak
Portzentaiak
Klase-
-ordezkariak
Klaseak
(altuera m.)
Estatistika deskribatzailea 13
a) Ezaugarri kualitatibo diskretua.
Enpresen banaketa bere kokapenaren arabera:
b) Ezaugarri kuantitatibo diskretua.
Loteen banaketa, beren baitan dituzten pieza akastunen kopuruaren arabera:
Txarren
kopurua:
Maiztasun
erlatiboa:
(portzentaietan)
Maiztasun erlatiboa:
Portzentaia
metatuak
1 15 15
2 10 25
3 23 48
4 37 85
5 15 100
A B C D E
kokapena
Enpresen
kopurua
A arloa
B arloa
C arloa
D arloa
E arloa
301
400
503
670
102
1.976
670
503
400
301
102
barra-diagrama
14
I.5.2. Histogramak
Oso baliagarriak zaizkigu ezaugarriak jarraiak direnean.
Ezaugarriaren balio-multzoa mailetan zatitu ondoren eta maila edo klase
bakoitza oinarritzat harturik, dagokion maiztasunaren (nahiz absolutua, erlatiboa
edo metatua) araberako azalera duen laukizuzen bat eraikitzen da.
15
25
48
85
100
1 2 3 4 5
Maiztasun metatuen diagrama
10
15
23
37
1 2 3 4 5
Maiztasun erlatiboen barra-diagrama
Estatistika deskribatzailea 15
Klase guztiak zabalera berdinekoak baldin badira, klase bakoitzari dagokion
laukizuzenaren altuera, bere maiztasun absolutu edo erlatiboa da. Honela, soilik,
laukizuzenen oinarriak berdinak izatean, azalerak altueren menpe daude.
Ondoan b-2) adibideari dagozkion histogramak eta maiztasun-poligonoak
ditugu (ikus b-2) 13. orrialdean).
1'50 1'55 1'60 1'65 1'70 1'75 1'80 (altuera)
Histogramak eta maiztasun-poligonoak
Klaseen zabalerak, ordea, desberdinak baldin badira, laukizuzenen altuerak,
maiztasun absolutuak edo erlatiboak zabaleraz zatituz, kalkulatuko ditugu.
hi, ni eta ci , i . klasearen altuera, maiztasuna eta zabalera, hurrenez hurren,
izanik:
hi altuera di bezala ere izendatzen da eta maiztasun-dentsitate bezala ezagutzen.
Adibidea:
Bi goi-mailako ikastetxetan, ikasleen adinak honela banatzen dira:
hi =
ni
ci
, orduan Si azalera: Si = ci
ni
ci
= ni
16
Urteak (mailak) M.E. Ikastetxea E.F. Ikastetxea
17 - 19 400 750
20 - 25 400 2.000
26 - 37 200 250
Adibidearen histogramak egin ditugu a) kasuan maiztasun absolutuak
kontsideratuz eta b) kasuan, berriz, maiztasun erlatiboak portzentaietan.
Dakusagunez, maiztasun erlatiboak (ehunekotan edo ez) adieraztean totalaren
ikusketa, N-rena hain zuzen, galtzen da, baina ordea bi banaketak konparagarriago
bihurtzen dira.
I.5.3. Maiztasun-poligonoak
Maiztasun-poligonoa laukizuzenen goiko oinarriko erdiko puntuak marra
batez lotuz eraikitzen da.
Honela egin dugu 16. orrialdeko histograman.
N = 1000 N = 3000
M.E. E.F.
N = % 100N = % 100
Estatistika deskribatzailea 17
I.5.4. Diagrama linealak
Oso erabilgarriak izan ohi dira, balioen aldaketetan denborak izan lezakeen
eragina aztertzeko.
Adibidez: Energi produkzioa 1.950etik, 1.960 urterarte:
I.5.5. Beste adierazpide grafikoak
Beste batzuen artean, ikus ditzagun, azkenez, bi hauek:
- POPULAZIO-PIRAMIDEAK.
Histograma bikoitzak dira, eta honela eraikitzen dira: ordenatu-ardatzean
adin-taldeak adierazten dira eta abzisa-ardatzean, ezkerrerantz eta eskuinerantz
gizonezko eta emakumezkoen maiztasun erlatiboak populazio totalarekiko
adierazten dira, dagozkien laukizuzenak eraikiz.
Maiztasun erlatiboak populazio totalarekiko kontsideratzean, gizonezkoen eta
emakumezkoen laukizuzenak konpara daitezke adin-talde bakoitzerako.
Halaber, maiztasun erlatiboak kontsideratzean, eskala berdinean eraikiz gero,
tamainuaren aldetik oso desberdinak diren populazioak konpara daitezke.
18
1.950 1.952 1.954 1.956 1.958 1.960
INDAR
TERMIKOA
UR-INDARRA
GUZTIRA
- SEKTORE GRAFIKOAK
Grafiko hauek honela eraikitzen dira: zirkunferentziako 360 graduetatik,
aldagaien balio ala kategoria bakoitzaren maiztasunari proportzionalki zati bat
dagokio.
Euskararen ezaguera Sarrikoko Fakultatean 1979. urtean.
% 9.9
% 15.60
Ez dakite
Betidanik dakite
Euskaldunberriak
% 74.50
Adina urte betetan
Populazioa milatan
Bizkaiko populazio-piramidea 1.975. urtean
50 40 30 20 10 5040302010
75
70
65
60
55
50
45
40
35
30
25
20
15
10
5
0
Estatistika deskribatzailea 19
20
II. EZAUGARRI BAKUNEN BALIO TIPIKOAK
II.1. MOMENTUAK
II.1.1. Momentu arruntak edo jatorriarekikoak
II.1.2. Momentu zentralak edo
batezbestekoarekikoak
II.2. MAIZTASUN-BANAKETA BAKUNEN
BALIO TIPIKO EDO ESTATISTIKOAK
II.2.1. Zentru-joeraren balio tipikoak
II.2.1.1. Batezbesteko aritmetikoa
II.2.1.2. Batezbesteko geometrikoa
II.2.1.3. Batezbesteko harmonikoa
II.2.1.4. Moda
II.2.1.5. Mediana
II.2.2. Sakabanatzearen balio tipikoak
II.2.2.1. Bariantza
II.2.2.2. Batezbesteko desbidazioa
II.2.2.3. Ibiltartea
II.2.3. Itxuraren balio tipikoak
II.2.3.1. Asimetri koefizientea
II.2.3.1. Kurtosi koefizientea edo
zapaltasun/zorroztasun-koefizientea
II.3. KONTZENTRAZIO-NEURKETAK
II.3.1. LORENZ-en kurba
II.3.2. GINI-ren indizea
II.1. MOMENTUAK
Datuek berekin duten informazioa, balio tipiko edo estatistikoen bidez
sintetizatzea komeni da.
Noski, laburketa guztiei informazio-galtze bat dagokie; errakuntzarako motibo
hau, bada, kontuan izan beharko dugu estatistiko bakoitza aztertzerakoan.
Baina, estatistiko edo balio tipikoak aurkeztu baino lehen, momentuak ikusi
behar ditugu, balio tipikoak momentuak baitira edo momentuen bidez definitzen.
Momentuak bi motatakoak izan daitezke:
- arruntak edo jatorriarekikoak.
- zentralak edo batezbestekoarekikoak.
II.1.1. Momentu arruntak edo jatorriarekikoak
Maiztasun-banaketa bakun baten h-ordenako momentu arrunta edo
jatorriarekikoa, sinbolikoki ah ikurraz adieraziko da eta honela definituko:
non:
N = Laginaren edo populazioaren indibiduoen kopurua.
xi = Ezaugarriaren i. balioa.
m = Ezaugarriak hartzen dituen balio desberdinak; m N izango da.
Momentu arrunten bi berezitasun ikusiko ditugu:
1) O-ordenako momentuak 1 balioa hartzen du:
ah =
(xi )h
i=1
N
N
=
(xi )h
ni
i=1
m
N
Estatistika deskribatzailea 23
Hots:
2) 1- ordenako edo lehenengo ordenako momentua batezbesteko aritmetikoa da:
Hots:
eta normalki x ikurraz adierazten da.
Ikusten ari garen momentu arruntek nahiz ondoren ikusiko ditugunek, ez dute
berekiko esangurarik, bide batez balio tipiko direnean izan ezik, adibidez,
batezbesteko aritmetikoa, bariantza, e.a.
Halere, Estatistikan eragile matematiko bezala sartzen dira, teoriaren
garapenean oso erabilgarriak baitira.
II.1.2. Momentu zentratuak edo batezbestekoarekikoak
Maiztasun-banaketa bakun baten h-ordenako momentu zentratua edo
batezbestekoarekikoa, sinbolikoki mh ikurraz adieraziko da eta honela definituko:
Eragiketak eginez, ikus dezagun nola kalkulatzen diren momentu zentratuak
momentu arrunten bidez:
mh =
(xi - x)h
i=1
N
N
=
(xi - x)h
i=1
m
ni
N
a1 =
xi ni
i=1
m
N
= x
a0 =
(xi )0
ni
i=1
m
N
=1
24
Hortik:
Momentu hauen artean bigarren ordenakoa (m2), BARIANTZA delakoa da
garrantzitsuena.
Eta azkenez, momentuak edozein punturekiko izan daitezke:
x0 = 0 baldin bada, momentu arruntak izango dira.
eta x0 = x bada, zentratuak.
ah , x0 =
N
(xi - x0 )h
N
=
m
(xi - x0 )h
ni
N
m2 =
(xi - x)2
ni
N
= a2 - x2
=
xi
2
ni
N
-
xi ni
N
2
m2 = a2 - x2
m3 = a3 - 3a2x + 2x3
m4 = a4 - 4a3x + 6a2x3
- 3x4
mh =
1
N
(xi - x)h
N
ni =
=
1
N
(0
h
) xi
h
- (1
h
) xi
h-1
x +( (2
h
) xi
h-2
x2
- ...... +
m
+ (-1)h-1
(h-1
h
) xi xh-1
+ (-1)h-1
(h
h
) xh
) ni =
= (0
h
) ah - (1
h
) ah-1 x + (2
h
) ah-2 x2
-....+(-1)h-1
hxh
+ (-1)h
xh
Estatistika deskribatzailea 25
II.2. MAIZTASUN-BANAKETA BAKUNEN BALIO TIPIKO EDO
ESTATISTIKOAK
Organigrama batean azalduko ditugu lehenik banaketa bakunetan erabili ahal
diren estatistiko edo balio tipikoak, eta gero erabilienak banaka ikusten joango gara.
II.2.1. Zentru-joeraren edo Posizioaren balio tipikoak
Lagin batean ezaugarri bati dagozkion balioak ordenatzen baditugu, zentruan
kokatzen diren balioak erabiltzen dira datu guztiak errepresentatzeko. Posizio-
-neurriak dira.
Balio batean datu-multzo baten ideia ematea argiro ikusten dugu, sarritan
gehiegizko sinplifikazioa izanik.
Horregatik, zentruko estatistikoak beste estatistiko batzuekin
(sakabanatzearenak..) osatzen dira, aztertzen ari garen populazio edo laginaren
ideia errealagoa eduki nahi baldin badugu.
ZENTRU - JOERAren edo
posizioaren balio tipikoak
- neurrizkoak:
Batezbesteko aritmetikoa
Batezbesteko geometrikoa
Batezbesteko harmonikoa
- lekuzkoak:
Mediana
Koantilak
- maiztasunezkoak: Moda
SAKABANATZEaren
balio tipikoak
- bariantza eta desbidazio standarda
- batezbesteko desbidazioa
- ibiltartea eta koartilarteko ibiltartea
- aldakuntza koefizientea
ITXURAREN
balio tipikoak
- asimetri koefizientea
- kurtosi koefizientea
26
II.2.1.1. Batezbesteko aritmetikoa
Lagin batean x1, x2, ....., xi, ...., xm , zenbakizko balio-multzo bati dagozkion
maiztasun absolutuak hurrenez hurren n1, n2, ...., ni, ...., nm baldin badira, beraren
batezbesteko aritmetikoa, x, honako hau da:
Maiztasun erlatiboak, f1 , f2 , .... , fm , kontutan hartuz
Ezaugarriak hartzen dituen balio guztiak desberdinak balira, maiztasun
absolutuek 1 balioa hartuko lukete, hau da, n1 = n2 = .... = nN = 1 eta orduan:
Maiztasun erlatiboak masak bezala kontsideratzen baditugu, batezbesteko
aritmetikoak grabitate-zentrua finkatuko du. Hau da, barra baten gainean eta x1 ,
x2 , ... xm puntuetan maiztasunak bezalako pisuak kokatzen baditugu sistemak
oreka lor dezan, esekitze-puntuak x puntuan izan beharko du.
PROPIETATEAK:
1.- Edozein maiztasun-banaketatan, bere maiztasunaz biderkatuz,
batezbestekoarekiko desbideratzeen batukaria zero egiten da.
Hots:
(xi - x) ni = 0
i=1
m
x =
1
N
xi
i=1
N
x = xi fi
i=1
m
x =
1
N
xi ni
i=1
m
non ni
i=1
m
= N
Estatistika deskribatzailea 27
Frogapena:
2.- Ezaugarri edo aldagai baten balio guztiak h parametroaz biderkatzen baditugu,
batezbesteko aritmetikoa ere h-z biderkatuta edukiko dugu.
Hots:
xi balio bakoitza h xi balioaz ordezkatzen badugu:
3.- Aldagai bi edo gehiagoren batura den aldagai baten batezbesteko aritmetikoa,
batezbesteko aritmetikoen batura da.
Suposa dezagun oposizio-lehiaketa bat hiru azterketaz osatzen dela eta i.
lehiakideak xi, yi, zi puntuak ateratzen dituela, puntuazio totala ti = xi + yi + zi
izanez; N lehiakideren puntuazioen batezbesteko aritmetikoa ondokoa izango
da:
t =
ti
i=1
N
N
=
(xi + yi + zi )
i=1
N
N
=
=
xi
i=1
N
N
+
yi
i=1
N
N
+
zi
i=1
N
N
= x + y + z
Hau da: t = x + y + z baldin bada.
t = x + y + z izango da.
1
N
h xi ni
i=1
m
= h
1
N
xi ni
i=1
m
= h x
x =
1
N
xi ni
i=1
m
izanez
(xi - x) ni = xi ni - x ni = N x
i=1
m
i=1
m
i=1
m
- N x = 0
28
BATEZBESTEKO ARITMETIKO PONDERATUA
Batzuetan batezbesteko aritmetikoa ateratzean, aldagaien garrantzi erlatiboa
desberdina dela ohartzen gara.
Suposa dezagun hiru sagar mota saltzen direla 60, 80 eta 90 pezeta/kilo
prezioetan hurrenez hurren.
Batezbesteko prezioa honela atera daiteke:
sinplea eginik.
Baina mota bakoitzarentzat saltzen diren kiloak, hurrenez hurren, hauek
baldin badira: 125, 72, 3
Batezbesteko ponderatua, zera izango da:
Ikusten dugunez, batezbesteko aritmetiko ponderatua egitean, aldagaiaren
balio bakoitza zenbaki batez biderkatzen dugu, balio-multzo barnean daukan
garrantziaren arabera.
Zenbaki hauek pisuak edo ponderazioak dira eta sinbolikoki wi deituko
ditugu.
Oharra: kontutan hartu behar da, bien formulak baliokideak badira ere
ponderazioak ez direla maiztasunak. Hala ere, maiztasunak ponderazioak dira
aldagaiaren balio desberdinek duten garrantzia maiztasunen araberakoa izango
baita.
Orduan x pon( ) =
xiwi
wi
edota x pon( ) = xiwi wi = 1 denean
x(pon) =
60 125 + 80 72 + 90 3
125 + 72 + 3
= 67'6
x =
60 + 80 + 90
3
= 76'6, hau da, batezbesteko aritmetiko
Estatistika deskribatzailea 29
Beste adibide bat:
Ondoko taulan Hego Euskal Herriko lau herrialdeen kasuan hileroko
gastuak/familia datuak dauzkagu.
Hileroko gastuak / familia, 1.968. urtean
Familiak Gastuak (mila pezetatan)
Araba 24 4,4
Gipuzkoa 53 5,3
Nafarroa 57 5,1
Bizkaia 84 5,1
Baina, familien kopurua kontutan hartuz:
Noski, batezbesteko ponderatuen bidez errealitatearen azterketari gehiago
hurbiltzen gatzaizkio, baina normalki datu guztiak ezagutzen ez ditugunez,
batezbesteko aritmetiko sinplea egiten dugu.
II.2.1.2. Batezbesteko geometrikoa:
Ondoko berdintasunaren bidez adierazten dugu:
Arrazoi edo ehunekoen batezbesteko bat ateratzeko, batezbesteko aritmetikoa
baino aproposagoa da eta ondoko propietatea betetzen du:
Log G =
1
N
log xi
ni
=
i=1
m
1
N
(logxi )ni
i=1
m
G = x1
n1
xx
n2
.......... xm
nmN
= xi
ni
i=1
m
N
x pon( ) =
4,4 24 + 5,3 53 + 5,1 57 + 5,184
24 + 53 + 57 + 84
= 5,07
Batazbesteko aritmetikoa: x =
19,9
4
= 4,975
30
Hots:
Batezbesteko geometrikoaren logaritmoa, aldagaiaren balioen logaritmoen
batezbesteko aritmetikoa da.
II.2.1.3. Batezbesteko harmonikoa
Ondoko berdintasunaren bidez adierazten dugu
Ohar daiteke batezbesteko harmonikoa zera dela, xi balioen alderantzizko
balioen batezbesteko aritmetikoaren alderantzizko balioa.
Batezbesteko abiaduren batezbesteko bat ateratzeko, batezbesteko
harmonikoa da egokiena.
Ikusitako batezbestekoak eta beste batzuk: batezbesteko koadratikoa,
batezbesteko kubikoa, e.a. sar daitezke k ordenako batezbestekoaren kontzeptuan.
II.2.1.4. Moda
Maiztasun-banaketa batean gehien errepikatzen den aldagai edo ezaugarriaren
balioari, hau da, maiztasunik handiena duenari, moda eta balio modala deritzo.
x1 , x2 , ... xi ....... xm edo A, B, ..... , I , ..... M
balio edo kategorien multzo bati dagozkien maiztasun erlatiboak hurrenez hurren
f1 , f2 ,...., fm baldin badira, maiztasun erlatibo gehien duen xi balioari edo I
kategoriari "moda" M0 deritzo.
Hots: M0 = xi edo M0 = I, ni eta fi maiztasun handienak izanik.
Hots: M(k) = xi
k
fik
H =
N
ni
xii=1
m
non N = ni
i=1
m
Estatistika deskribatzailea 31
Banaketa, modagabea izan liteke f1 = f2 = .... = fm , edo moda bat baino
gehiago ere eduki dezake, eta honen arabera, "bimodala", "hirumodala"... orokorki
moda-anitza izango da.
ADIBIDEAK
Kasu honetan banaketa bimodala L1 , L2 klasea da kasu honetan
dugu, B eta C arloak modak moda, klase honen
direlarik. ordezkaria, M0, har daiteke
modatzat.
Banaketa jarraia edo klasetan taldekatua bada, dakigunez, maiztasun
handiena, M0, duen klasean kokatuko da moda, eta klase-ordezkaria modatzat
hartzen ez badugu, gutxi gora-beherako kalkuluak egin daitezke.
Klase edo tarte modala Li-1, Li izanez, balio modala estimatzeko bi irizpide
desberdinetan oinarritutako formulak proposatuko ditugu.
1) Altueren alderaketaren irizpidea:
M(k) = Li-1 +
di-1
di-1 + di+1
ci
M0 L4L3
L2L1
L0A B C D E
%5
%20
%30 %30
%15
b)a)
32
non:
ci = klaseen zabalera
di1 = hi hi+1
di+1 = ni ni+1
h = i. klaseen altuera
Frogapena grafikoa
AME eta BMD triangeluak antzekoak dira, hau da, beraien altuerak oinarriekiko
proportzionalak dira.
Hots:
Edo ondoko proportzio baliokidea:
eta, M0 = Li1 + MG izatean, proposatu dugun formula frogatuta gelditzen da.
Klaseak zabalera berdinekoak balira, altueren alderaketa, zuzenki,
maiztasunen alderaketa izango da.
Hau da:
di1 = ni - ni1
di+1 = ni - ni+1
2) Alderantzizko banaketa proportzionalaren irizpidea:
M0 = Li-1 +
hi+1
hi-1 + hi+1
ci
MG
MG + MF
=
AE
AE + BD
hau da,
MG
ci
=
di-1
di-1 + di+1
MG
MF
=
AE
BD
Estatistika deskribatzailea 33
LiM0
Li-1
M D
FG
E
BA
non:hi1 = aurreko klasearen altuera
hi+1 = hurrengo klasearen altuera
Ondoko klaseen
altuerekiko alderantzizko
banaketa proportzionala
egitean, aurreko formula
lortzen dugu.
Hots:
edo aurrekariak eta atzekariak batzean:
eta, M0 = Li-1 + bi izatean, proposatu dugun formula frogatuta gelditzen da.
Klaseak zabalera berdinekoak balira, hau da, ci = c
c zabaleraz biderkatzen eta zatitzen badugu eta ni = chi dela kontutan hartuz,
ondoko hau izango da formula:
II.2.1.5. Mediana eta koantilak
Mediana banaketaren balioak bi zati berdinetan zatitzen dituen lekuzko
estatistikorik garrantzitsuena da.
Balio-multzoa ordenatuz gero, maiztasun absolutuen histograma azalera
berdineko bi zatitan ebakitzen duen balioari mediana deritzo, eta hori zehazki
betetzen duenik ez badago, aurrean dagoena hartzen dugu batzuetan medianatzat.
M0 = Li-1 +
hi+1 c
(hi+1 + hi-1)c
c = Li-1 +
ni+1
hi+1 + hi-1
c
bi
hi+1
=
ci
hi+1 + hi-1
b1
hi+1
=
ci - bi
hi-1
34
M0Li-1
hi+1
bi
hi-1
Ondoko baldintza betetzen duen balio bat da:
Hala ere, banaketa diskretua bada eta indibiduoen kopurua bakoitia, aurreko
baldintza bete egingo da, baina ez beste edozein kasutan.
Banaketa diskretua eta N bikoiti baten aurrean bagaude.
Banaketa taldekatuetan eta jarraietan: N/2 balioa duen tartea finkatuz gero eta
tartean ni balioak linealki gehitzen direla suposatuz kalkulatuko dugu Me.
Orduan: (Li-1 , Li ) Me duen tartea izanez:
Me = Li-1 + bi
Ni - Ni-1
ci
=
N
2
- Ni-1
bi
Irudian dauden bi
triangeluak antze-
koak izanez, zera
idatz daiteke:
bi
Li
MeLi-1
Ni-1
N/2
Ni
Me =
xi + xi+1
2
Ni =
N
2
Hots: Me =
erdiko balioak
2
Me = xi / Ni-1 <
N
2
Ni >
N
2
Estatistika deskribatzailea 35
Oharra: maiztasun erlatiboak erabiliz, era berdinean kalkula daiteke Me; kasu
horretan,
KOANTILAK
Koantilak beste lekuzko neurriak dira. Mota desberdinetakoak dira: koartilak,
dezilak eta zentilak.
Koartilak, dezilak eta zentilak medianaren antzera definitzen dira, baina bi
parte hartu ordez lau (koartilak), hamar (dezilak) edo ehun (zentilak) parte hartuz.
Koartilak q1, q2, q3 izango dira; (q1, q3) tartean banaketaren erdia daukagu,
justu erdiko balioak, hau da, bazterreko balioak kenduz.
Dezilak d1 ..... d9 izango dira eta zentilak, c1 .... c99 .
Argiro ikusten da:
q2 = d5 = c50 = Me dela.
OHARRAK:
Erdiko baliorik garrantzitsuenak, batezbesteko aritmetikoa, moda eta mediana
dira eta bereziki batezbesteko aritmetikoa, guztiak aldagaia edo ezaugarria neurtua
dagoen unitateetan neurtuak direlarik.
Ondoko erlazio hau betetzen da:
Eta gutxi gora-behera hiruretako edozein, besteen bidez kalkula daiteke.
II.2.2. Sakabanatzearen balio tipikoak
Datu-multzoaren ideia orokorra ematen ziguten zentrurako joeraren balio
N
2
=
1
2
eta: bi =
N / 2 - Ni-1
Ni - Ni-1
ci
36
M0
~ 3 Me
- 2 x
tipikoek. Ideia hau osatzeko, zentrurako joeraren balioen inguruan datu-multzoa
guztiz bilduta edo oso sakabanatuta dagoen adierazten diguten estatistiko batzuk
ere behar ditugu.
Batezbesteko aritmetikoaren inguruan datuek duten sakabanatze-neurri
bezala, estatistiko garrantzitsuenak hauek dira: Bariantza, Desbidazio Standarda
eta Batezbesteko Desbidazioa.
II.2.2.1. Bariantza
Batezbestekoarekiko sakabanatze-neurririk garrantzitsuena da bariantza eta
bera erabiliz lortzen ditugu desbidazio standarda eta aldakuntza koefizientea.
{x1 , x2 , .... , xi .... xm} zenbakizko balio-multzo bati dagozkien maiztasun
absolutuak hurrenez hurren n1 , n2, ... ni .... nm baldin badira, bariantza, ,
deritzona hau da:
Bariantza neurri-unitate karratuetan daukagula erraz ikusten dugu formulan.
Orduan, sakabanatze-neurri bezala bariantzaren erro karratua hartzea
egokiagoa da, Desbidazio Tipikoa edo Standarda, hain zuzen.
eta ezaugarria neurtuta dagoen unitateetan, sakabanatze-neurketa daukagu.
Askotan, estatistika inferentzialean estimatzaile bezala dituzten
propietateengatik, Quasi-bariantza eta Quasi-desbidazio standarda
erabiltzen dira.
Konputagailuko programa-paketeek ematen dizkigute, Bariantza eta
Desbidazio Standarda deitzen badituzte ere.
Sx
2
eta Sx
Sx
2
=
(xi - x)2
ni
i=1
m
N -1
eta Sx
=
(xi - x)2
i=1
m
N -1
Sx
Sx
2
Sx =
1
N
(xi - x)2
ni
i=1
m
= (xi - x)2
fi
i=1
m
= a2 - x2
Sx
2
=
1
N
(xi - x)2
ni
i=1
m
edota Sx
2
= (xi - x)2
fi
i=1
m
Sx
2
Estatistika deskribatzailea 37
Desbidazio tipikoak batezbestekoarekiko suposatzen duen batekoa (edo
ehunekoa) aldakuntza koefizientea deitzen da.
x batezbestekoa zerora hurbiltzen bada, g0 horrek ez du zentzu askorik
(infiniturantz jotzen baitu kasu honetan).
Bariantzak garrantzizko propietate bat betetzen du, bigarren ordenako
momentu zentralik txikiena baita, hain zuzen.
Hots:
Eta argiro dagoenez, x0 = x baldin bada, txikiena izango da, beste edozein
kasutan bigarren batugaia positiboa baita.
II.2.2.2. Batezbesteko desbidazioa
Balio absolutuak harturik (konpentsaziorik izan ez dadin), batezbesteko
batekiko balioek duten desbidazioen batezbesteko aritmetikoari, "batezbesteko
desbidazioa" deritzo.
a2, x0 =
1
N
(xi - x0 )2
i=1
m
ni =
=
1
N
(xi - x) + (x - x0 )( )2
i=1
m
ni =
=
1
N
(xi - x)2
+ 2(xi - x)(x - x0 ) + (x - x0 )2
( )
i=1
m
ni =
=
1
N
(xi - x)2
ni + 2(x - x0 )
i=1
m
(xi - x)
ni
Ni=1
m
+
+
1
N
(x - x0 )2
ni = Sx
2
+ (x - x0 )
i=1
m
2
g0 ikurraz adieraziko dugu sinbolikoki, non: g0 =
Sx
x
38
a) Aukeratutako batezbestekoa, batezbesteko aritmetikoa bada, batezbesteko
desbidazioa hauxe izango da:
Neurri honek indibiduoen homogenotasuna adierazten digu, hau da,
desbidazioak txikiak badira, batezbesteko desbidazioa txikia izango da eta,
alderantziz, handiak badira, batezbesteko desbidazioa handia izango da.
b) Aukeratutako batezbestekoa mediana bada, batezbesteko desbidazioa hauxe
izango da:
Batezbestekoa mediana denean, batezbesteko desbidaziorik txikiena daukagu.
II.2.2.3. Ibiltartea
Ezaugarri zenbakizko batek hartzen dituen balio maximo eta minimoaren
arteko diferentziari ibiltarte deritzogu.
Hots:
x0 x1 ........ xm izanik
R = xm x0
Koartil arteko ibiltarteak ere kontsidera daitezke, adibidez, q3 q1 hirugarren
eta lehenengoen artekoena hain zuzen ere, edota, dezil arteko ibiltarteak e.a.
DMe
=
1
N
xi - Me
i=1
m
ni
Dx =
1
N
xi - x
i=1
m
ni
Hau da: D =
1
N
xi - batazbestekoa
i=1
m
ni
Estatistika deskribatzailea 39
II.2.3. Itxuraren balio tipikoak
Aztertzen ari garen laginaren ezaugarria eta berari dagokion datu-multzoa,
zentrurako joeraren eta sakabanatze-balioen bidez nahiko argi geratu bada ere,
itxuraren balio tipikoak aztertzean gehiago osa daiteke; hauen artean asimetri
koefizientea eta kurtosi koefizientea ikusiko ditugu.
II.2.3.1. Asimetri koefizientea
Maiztasun-banaketaren grafikoa simetrikoa denean, banaketa simetrikoa dela
esango dugu, hau da, barra-diagrama edo histograma egitean simetrikoa bada,
banaketaren elementuak batezbestekoarekiko bi aldeetan berdin kokatzen direla
esan nahi du.
Aurrekoa betetzen ez bada, banaketa asimetrikoa izango da.
Banaketa bat moda batekoa eta simetrikoa baldin bada, batezbesteko
aritmetikoa, moda eta mediana balio berean daude.
Hots: x = M0 = Me
Asimetri koefizientea g1 ikurraz adieraziko dugu sinbolikoki, non:
Ezkerrerantz
asimetrikoak
Eskuinerantz
asimetrikoak
Simetrikoak
40
simetrikoki kokatuta badaude, m3 = 0 izango da; baina maiztasunen balioak
eskuinaldean handiagoak badira, hau da, xi > x denean, orduan m3 > 0 izango
da, eta, alderantziz, ezkerraldean handiagoak badira, hau da, xi < x denean,
orduan m3 < 0 .
Ikusten dugu, bada, m3 asimetriaren balio adierazle bezala har dezakegula,
baina neurri-unitateak ber hiru izanez zuzenkiago.
erabiltzen da: g1 > 0 bada, maiztasun-banaketa eskuinerantz asimetrikoa dela
esaten da; g1 < 0 bada, alderantziz, ezkerrerantz.
II.2.3.2. Kurtosi koefizientea edo zapaltasun/zorroztasun-koefizientea
Simetriarekin batera, itxuraren beste balio tipiko bat ikusiko dugu, kurtosi
koefizientea hain zuzen.
Maiztasun-banaketaren grafikoa kontutan hartuz, konkretuki, maiztasun-
-poligonoa ezaugarri jarraiaren kasuan, edo barra-diagramaren goiko puntuak
lotuko lituzkeen lerroa ezaugarri diskretuaren kasuan, kasu hauek dauzkagu:
zapala zorrotza
Batezbesteko aritmetikoa eta bariantza berdina daukaten bi banaketa aztertuz,
itxuraren aldetik bata oso zapala da eta oso zorrotza bestea.
g1 =
m3
S3
g1 =
m3
Sx
3
m3 = xi - x( )3 ni
Ni=1
m
izanik, maiztasunen balioak x balioarekiko
Estatistika deskribatzailea 41
Banaketaren maiztasunak batezbesteko aritmetikoaren inguruan handiak
baldin badira, momentu zentratu bikoitiek, (adibidez, laugarren ordenakoa), balio
handiagoak hartuko dituzte.
Orduan, m4 zapaltasunaren adierazle bezala har daiteke, baina neurri-
-unitateak ber lau izanez, zuzenkiago g2 ikurraz adierazten den kurtosi
koefizientea, zapaltasunaren adierazle bezala erabiliko dugu.
"Normal" deitutako banaketaren kurtosi koefizientea 3 da eta balio hau
kurtosia aztertzean konparazio-puntu bezala hartuko dugu.
g2, 3 baino handiagoa baldin bada, banaketa zorrotza izango da eta 3 baino
txikiagoa baldin bada, zapala izango da.
g23, kurtosi koefizientetzat hartzen badugu, kurtosi positiboa edo negatiboa
kontsidera daiteke.
Oharra: Aipatu dugun banaketa "Normala" 3. kurtsoan ikasiko da, inferentzia
estatistikoan, oinarrizko probabilitate-eredua baita.
banaketa Normala : g2 = 3
II.3. ALDAGAIEN TRANSFORMAZIO LINEALAK
X aldagaia U aldagaiaren transformatu lineala izan daiteke, hau da:
X = a U + b
g2 =
m4
Sx
4
=
(xi - x)4
ni
i=1
m
N Sx
4
42
b = 0 baldin bada, unitate-aldaketa daukagu soilik
a = 1 baldin bada, jatorri-aldaketa edo traslazioa daukagu soilik, zeina berdin
b baita.
Batzutan, jatorria eta unitatea aldatzea komenigarria da, honela, kalkuluak
errazten baitira.
Ikus ditzagun, bi aldagaien estatistiko garrantzitsuenen arteko erlazioak:
Ikusten dugunez X eta U aldagaien batezbesteko aritmetikoak ez dira
berdinak; pentsa dezagun estatistiko hau, ezaugarriak neurtzen ditugun unitateetan
neurri bat dela.
Bariantza eta desbidazio tipikoen arteko erlazioak:
Eta orokorki, momentu zentratuen arteko erlazioak:
Ikusten dugunez, unitate-aldaketak eragina dauka bariantza eta edozein
momentu zentratuan baina traslazioak ez.
II.3.1. Aldagai zentratua
Aldagai baten batezbesteko aritmetikoa zero baldin bada, aldagai zentratua
deitzen da; aldiz, batezbesteko aritmetikoa zero eta desbidazio tipikoa bat balioak
baldin badira, aldagai tipifikatua deritzogu.
mh (x) =
1
N
(xi - x)h
ni
i
=
1
N
(aui + b- au - b)h
ni
i
=
= ah 1
N
(ui
i
- u)h
ni = ah
mh (u)
Sx
2
=
1
N
x1 - x( )2
ni
i
=
1
N
aui + b-au - b( )2
ni
i
=
= a2
1
N
ui - u( )2
i
ni =a2
Su
2
eta Sx = a Su
x =
1
N
xini
i
=
1
N
(aui + b)ni
i
=
= a
1
N
ui
i
ni + b
1
n
ni =
i
au + b
Estatistika deskribatzaile 43
Edozein X aldagairen kasuan bere batezbestekoa kenduz Z = X - x, aldagai
zentratua lortzen dugu.
Hau da:
Kontutan hartu behar dugu zentratze-eragiketak ez duela unitate-aldaketarik
suposatzen, jatorri-aldaketa edota aldagaiaren translazioa ardatzean suposatzen du
bakarrik.
Aldagaiaren grabitate-zentrua, translazio honetan, jatorrira eraman dugu,
II.3.2. Aldagai tipifikatua edo standardizatua
Modu berean, edozein X aldagairen kasuan batezbestekoa kenduz eta
desbidazio tipikoaz zatituz T = (X - x)/ Sx , aldagai tipifikatua lortzen dugu.
Ikus dezagun 3.1. atalean emandako definizioa betetzen duela:
Tipifikazio-eragiketak, zentratzeaz gainera unitatez aldatzea suposatzen du.
Aldagai bakoitzaren balio zentratuak, bere desbidazio tipikoaz zatitzean, honen
arabera neurturik ditugu, jatorrizko neurri-unitateak desagertu egiten direlarik.
II.4. KONTZENTRAZIO-NEURKETAK
Batezbesteko aritmetikoa egitean zenbakitzailean ateratzen zaigun kopuruak,
abiapuntu estatistiko batetatik ikusita, batzutan ez du zentzu argirik eta
interesgarririk. Adibidez, pertsona batzuren altuera-banaketa aztertzean,
zenbakitzaile hori altueren batuketa izango da; baina, beste kasu batzutan, bereziki
t =
1
Sx
(xi - x)
ni
Ni
= 0
St
2
=
1
N
(ti - t)
i
2
ni =
1
N
(xi - x)2
Sx
2
i
ni =
=
1
Sx
2
1
N
(xi - x)2
i
ni =
1
Sx
2
Sx
2
=1
~z = 0 baita.
z =
1
N
zjni
i
=
1
N
(xi - x)ni
i
=
=
1
N
xjni
i
-
1
N
x ni
i
= x - x = 0
44
ezaugarri sozioekonomikoetan, aztergarria izaten da, adibidez, alokairu-banaketa
aztertzean, alokairu guztien kopurua edo "alokairu-masa" da.
Kontzentrazio-neurketek, zehazki, "masa" baten uniformetasuna neurtzea dute
helburutzat.
Normalki errenta eta alokairu-banaketetan erabili ohi dira, baina beste
edozein aldagairen banaketatan erabil daitezke.
Suposa dezagun alokairu-banaketa batetan langile guztiek alokairu berdina
jasotzen dutela; orduan, banatzearen uniformetasuna osoa litzateke. Baina, ordez,
alokairu-masa guztia langile batek jasoko balu, uniformetasunik eza ere osoa
izango litzateke edo kontzentrazioa maximoa dela esango genuke kasu honetan.
Banaketak uniformetasun absoluturantz jotzen duenean, maiztasun-
banaketaren batezbesteko aritmetikoa guztiz adierazgarria da, eta, alderantziz
gertatuko da, kontzentrazioa maximoa denean.
II.4.1. LORENZ-en kurba
Grafikoki banaketen kontzentrazioa ikusarazten digun neurrian, interesgarria
zaigu.
Lorenz-en kurba eraikitzeko, ondoko taulan ikusten ditugun zutabeak
kalkulatu beharko ditugu.
xi ni xi ni Ni Mi Pi Qi
x1 n1 x1 n1 N1 M1 P1 Q1
x2 n2 x2 n2 N2 M2 P2 Q2
. . . . . . .
. . . . . . .
xi ni xi ni Ni Mi Pi Qi
. . . . . . .
. . . . . . .
xk nk xk nk N M 100 100
ni = N
i
xini = M
i
Estatistika deskribatzaile 45
Azken zutabeak honela kalkulatzen dira:
bikote guztiak sistema cartesiar batetan grafikoki adieraziz, eta
(P1 Q1) , (0,0) jatorriarekin eta beste bikote guztiak elkarren artean zuzenen
bitartez lotuz LORENZ-en kurba lortzen dugu.
Adibidez: Suposa dezagun enpresa batetako langileen banaketa bere asteroko
alokairuaren arabera (milaka pezetatan) ondoko taularen lehenengo bi zutabeetan
emana dela:
Adibideari dagokion LORENZ-en kurba ondoko hau izango da.
Eskalak, bi ardatzetan berdinak direnez gero, LORENZ-en kurba, karratu
baten barruan aurkitzen da beti. Jatorritik irteten den OD bere diagonala erabiliko
dugu uniformetasunaren erreferentzia moduan ( Pi Qi ) multzoko puntu guztiak,
OD-n aurkitzen badira, orduan uniformetasun osoa baitugu.
Hots: langileen arteko % 10-ak, alokairu-masaren % 10-a jasotzen du,
% 30-ak, alokairu-masaren % 30-a, e.a.
N = 50 M = xini
i=1
k
= 800
Pi Qi
metatuak:
PortzentaiaMetaketak
Ni M i
Alokairu-
-masa: xini
Langile
kopurua: n i
Alokairuak:
x i
10
47,5
85
100
20
60
90
100
80
380
680
800
10
30
45
50
80
300
300
120
10
20
15
5
8
15
20
24
Pi, Qi( ){ }iI
Ni: (ni ) zutabea metatuz
hots: Ni = n1 + n2.....+ni
Mi: (xini ) zutabea metatuz
hots: Mi = x1n1 + x2n2 +.....+xini
Pi =
Ni
N
100 maiztasunen (langileena esate baterako) portzentaia metatua
Qi =
Mi
M
100 masaren portzentaia metatua.
46
Zenbat eta tarte handiagoa egon kurba eta diagonalaren artean, orduan eta
banaketa kontzentratuagoa izango da, (edota zenbat eta kurba diagonaletik
hurbilago egon, orduan eta banaketa uniformeagoa).
Abzisa ardatzean Pi kokatzen badugu eta ordenatu ardatzean Qi , LORENZ-
-en kurba, karratuaren beheko triangeluan edukiko dugu (alokairuak txikienetatik
handienetarantz ordenatu ditugunez gero, adibidez langileen % 25-ak ezin du
alokairu-masaren % 25-a inoiz lortu).
II.4.2. GINI-ren indizea
LORENZ-en kurba banaketen kontzentrazioaren argitzaile bada ere,
zenbakizko indize batetaz kontzentrazioa neurtzea, komenigarria zaigu; esate
baterako, erabilgarria izango zaigu banaketak konparatzerakoan.
Helburu honi erantzuten dio Gini-ren indizEstatistikarako sarrera