Dependentia (statistica)

E testwiki
Redactio 23:03, 24 Martii 2024 a conlatore imported>Andrew Dalby facta (adnecto)
(diff) ← Redactio superior | Redactio novissima (diff) | Redactio recentior → (diff)
Jump to navigation Jump to search

Formula:Latinitas Dependentia distributionis frequentiarum duobus characteribus in statistica est proprietas qua valores unius characteris illos alterius inflectunt.

Singillatim dicitur distributio frequentiarum dupla distributio cui inscribuntur frequentiae elementorum binis valoribus duorum characterum, tamquam:

Valor primus,

secundi characteris

Valor secundus,

secundi characteris

Valor tertius,

secundi characteris

Valor primus,

primi characteris

f11 f12 f13
Valor secundus,

primi characteris

f21 f22 f23
Valor tertius,

primi characteris

f31 f32 f33

Tabella haec tabella duplici ingressu vel tabella contingentiae dicitur.

Itaque licet dependentiam mentiri, exempli gratia, ut investigemusFormula:Dubsig mulieribusne stipendium minus persolvatur quam viris ("ergo stipendiineFormula:Dubsig magnitudo a sexu dependat"), vel generane quaedam alumnorum maius examinationibus proficiant alteris, vel quandocumque suspicemur valorem unius characteris ab altero dependere.

Distributiones duplae

Distributio dupla fere binis his elementis describitur:

(x1,y1),...,(xN,yN)

ubi xi signum valorem characteris X designat atque yi characteris Y. Binis tamen quibusque valoribus adhibere potest frequentia coniuncta nij, quae numerum elementorum designat valoribus characterum xi,yj.

Exempli gratia ita potest tabella contingentiae fieri:

y1=stipendio demisso y2=stipendio medio y3=stipendio alto
x1=viri n11=10 n12=20 n13=5
x2=mulieres n21=15 n22=24 n23=4
Exemplum graphi dispersionis.
Exemplum graphi bullarum.

Hae depingi possunt grapho dispersionis vel graho bullarum, hoc aptiore distributioni frequentiarum. Grapho dispersionis depinguntur omnia elementa singulo puncto coordinatis (xi,yi) (nec indecet duobus punctis esse easdem coordinatas); grapho bullarum depinguntur bini valores (xi,yi) circulo cuius magnitudo frequentiae coniunctae proportionalis est, coordinataeque valoribus aequales sunt.

Distributio marginalis

Appellatur distributio marginalis characteris X, distributione frequentiarum dupla, distributio simplex elementorum secundum hoc character. Itaque a tabella duplici ingressu deducitur, valores versuum aut columnarum summando.

Exempli gratia, tabella summi huius subcapituli in distributiones has marginales dissolvitur:

Frequentiae stipendiorum
y1 y2 y3
Frequentia 10+15=25 20+24=44 5+4=9
Frequentiae sexuum
Frequentia
x1 10+20+5=45
x2 15+24+4=43

Praecipue distributio marginalis characteris X littera fX designatur, eiusque frequentiae signis n0j aut ni0.

Distributio conditionata

Characteris Y distributio conditionata valori xi characteris X dicitur distributio secundum character Y elementorum cuius valor est xi charactere X. Itaque e tabella contingentiae educitur versibus aut columnis quibusdam eligendis, fereque fY|xi signo designatur.

Exempli gratia, haec sunt distributiones conditionatae stipendiorum ipsius tabellae prioris singulis sexibus:

Stipendia virorum (distributio conditionata valori x1)
y1 y2 y3
Frequentia 10 20 5
Stipendia mulierum (distributio conditionata valori x2)
y1 y2 y3
Frequentia 15 24 4

Independentia

Charactera X atque Y distributionis frequentiarum duplae statistice independentia dicuntur si subdicta aequatio vera habetur cunctis frequentiis coniunctis:

nij=ni0×n0jN,(i,j)

Potest enim demonstrari tabella contingentiae tres has sententias una veras aut falsas esse (aequivalere):

  1. fX|yi=fX,i;
  2. nij=(ni0×n0j)/N,(i,j);
  3. fY|Xi,j.

Indipendentia enim quaeque distributio conditionata aequalis est marginali. Nisi una earum sententiarum vera est, omnes igitur tres falsae sunt, haberi dicitur dependentia statistica.

Tabella independentiae

Ad dependentiam distributionis duplae mentiendam, fere oportet eius tabellam contingentiae conferre et illam tabellam contingentiae, quae haberetur characteribus duobus ipsis independentibus.

Itaque definimus frequentias tabellae independentiae:

n^ij=ni0×n0jN,(i,j)

Exempli gratia haec est tabella independentiae ipsius distributionis paragraphi prioris:

y1 y2 y3
x1 (25×45)/8812.78 (44×45)/88=22.5 (9×45)/884.6
x2 (25×43)/8812.21 (44×43)/88=21.5 (9×43)/884.4

Ex his frequentiis etiam licet definire contingentias:

cij=nijn^ijn^ij

Itaque possumus nunc indicem dependentiae characterum definire per medietatem quadraticam ponderatam contingentiarum ad secundam potentiam dignatarum numeris n^ij ponderibus:

ψ=1Ni=1sj=1t(nijn^ij)2n^ij=i=1sj=1tnij2ni0×n0j1

Hic index cum tabella contingentiae longius a tabella independentiae differat, magis augetur, nullusque est independentia.

Alter index priori conexus est:

χ2=Nψ2=i=1sj=1t(nijn^ij)2n^ij=Ni=1sj=1tnij2ni0×n0j1

Normalizatio indicis dependentiae

Primum dicendum est, indicem supradictum valorem suum maximum attingere cum tabella contingentiae sit tabella dependentiae perfectae.

Singillatim, si plus est valorum characteri X quam characteri Y, dicitur tabella dependentiae perfectae characteris Y a charactere X tabella contingentiae cui (si columnae ad character Y pertinent) omni columnae solae frequentiae nullae sint omni versu excepto uno. Exempli gratia:

y1 y2
x1 0 3
x2 5 0

Si numerus valorum duorum characterum adaequat, potest haberi dependentia perfecta characteris X ab Y versaque vice.

Valorem tamen maximum t1, si ts, adipiscitur index ψ cum tabella contingentiae sit tabella dependentiae perfectae characteris Y a charactere X, ubi t littera numerum valorum characteris Y designat, atque s valorum characteris X.

Ab hac definitione itaque potest definiri index Cramérianus:

C=ψmin[(s1),(t1)]

Qui inter [0,1] comprehenditur.

Demonstratio indicis Cramériani valendi

Primum ad secundam dignemus indicem dependentiae potentiam:

ψ2=i=1sj=1tnij2ni0n0j1

Cum uno sit fractio nij/ni0 minor, scribi potest:

nij2ni0n0jnijn0jψ2i=1sj=2tnijn0j1=j=1t1n0ji=1snij1=j=1t11

quod scimus i=1snij=n0j. Valet igitur: ψ2t1; quae duo membra modo adaequant, si nij2ni0n0j=nijn0jnij=ni0, quod sola dependentia perfecta characteris Y a charactere X evenit.

Item a disaequatione supradicta videmus valere nij2ni0n0jnijni0, et eisdem computationibus edici potest ψ2s1 membraque adaequare sola dependentia perfecta characteris X a charactere Y.

E quo duobus deducitur:

ψ2min(s1,t1),ψ:ψ2=min(s1,t1)maxψ=min(s1,t1)

Dependentia media

Notandum est facilius computari ita medietas arithmetica distributionum conditionatarum marginaliumque:

μY(xi)=1ni0j=1tyjnij

μY=1Nj=0tyjn0j

Itaque ab his potest definiri dependentia media. Singillatim character Y dicitur medie dependere a charactere X medietatibus arithmeticis distributionum conditionatarum characteris Y inter se differentibus.

Ad hanc mentiendam, oportet scire medietatem distributionis marginalis esse medietatem ponderatam medietatum distributionum conditionatarum:

μY=1Ni=1sμY(xi)ni0

Itaque dependentiam mediam sumus mensuri deviantia medietatum conditionatarum:

DE=i=1s(μY(xi)μY)ni0

Decompositio deviantiae

Index supradictus invenitur in decompositio deviantiae totalis distributionis marginalis, in deviantiam explicitam ac deviantiam residuam:

DY=DE+DR=i=0t(yiμY)2n0j=i=1s(μY(xi)μY)2ni0+i=1sj=1t(yjμY(xi))2nij

Ab hac definiri potest corrationalitas correlationis:

ηY2=DEDY=1DRDY

quae inter [0,1] comprehenditur.

Demonstratio decompositionis deviantiae

Patet:

j=1t(yjμY)2n0j=j=1t(yjμY)2i=1snij=i=1sj=1t(yjμY)2nij

Medietatesque conditionatas cum addiderimus subtraxerimusque in differentiam illam, id fit:

i=1sj=1t((yjμY(xi))+(μY(xi)μY))2nij

Et binomio quadrato evoluto sic membrum expanditur:

i=1sj=1t(yiμY)2nij=i=1sj=1t(yjμY(xi))2nij+i=1sj=1t(μY(xi)μY)2nij+2i=1sj=1t(yjμY(xi))(μY(xi)μY)nij

Ubi postremum membrum nullum. Multiplicatio enim est differentiarum inter elementa medietatesque:

2i=1sj=1t(yjμY(xi))(μY(xi)μY)nij=2i=1s(μY(xi)μY)j=1t(yjμY(xi))nij=0

Computationibus peractis videmus:

j=1t(yjμY)2n0j=i=1sj=1t(yjμY)2nij=i=1sj=1t(yjμY(xi))2nij+i=1s(μY(xi)μY)2ni0

quod erat demonstrandum.

Bibliographia

  • Cicchitelli, D'Urso, Minozzo, 2018. Statistica: principi e metodi. Pearson. ISBN 9788891902788.