Indices varietatis statistici

E testwiki
Redactio 19:54, 20 Maii 2024 a conlatore imported>Toadino2 facta (Me ad finem puto correxisse)
(diff) ← Redactio superior | Redactio novissima (diff) | Redactio recentior → (diff)
Jump to navigation Jump to search

Indices varietatis sunt res statisticae, singillatim numeri, quae metiuntur quantum elementa copiae inter se differant. Hi generaliter medietates supplent, ut non modo in valorem unum omnia elementa cohibeantur, sed etiam sciatur quomodo inter se differant.

Varietas datorum statisticorum multis causis exstare potest. Saepe data varia sunt, cum in multis rebus vel hominibus inspecta, tum quia rerum proprietates a multis viribus naturalibus aut socialibus conformantur: id accidit investigationibus medicis, quibus si exempli gratia medicamentum aegris sumministraverimus quibusdam, erunt qui curabuntur et qui etiam postea aegrotabunt, quia omnibus hominibus sunt variae geneticae vel valetudines; alias, data variant cum una res vel homo ipse variet ob horam diei, instrumentum mensorium, aliasve vires naturales.

Ob hanc varietatem, praeter medietatem, oportet scire quantum elementa copiae varient, singillatim circumne medietatem subiecta sint, an multum dispergantur. Hi enim indices varietatis generaliter nulli sunt nulla varietate, quoque igitur elemento aequali.

Saepe indices varietates in tres genera dividuntur: indices dispersionis vel amotiones mediae, indices disaequalitatis vel differentiae mediae, atque intervalla variationis.

Amotiones mediae

Sit selectio exemplorum numericorum {1,2,3,4,8,12}. Videlicet est medietatem arithmeticam 5, et ab ipsa quicque elementum distare {4,3,2,1,3,7}.

Quod nobis subicit posse aliquem varietatem elementorum mentiri per medietatem arithmeticam distantiarum a medietate arithmetica, quae amotio simplex media appellatur; exempli distributioni est amotio media 4+3+2+1+3+763,3. Rite scribitur:

Aμ=1Ni=1N|xiμ|

At saepe non simplici utimur, sed amotione quadratica media, quae est radix quadratica medietatis arithmeticae distantiarum ad secundam potentiam dignatarum:

σ=1Ni=1N(xiμ)2

quam plerique appellant deviationem canonicam.

Quae formula computari potest breviori, e medietate quadratica atque arithmetica exstructa:

σ=μq2μ2

Proprietates amotionum mediarum

  1. Nullae sunt nulla varietate, ergo cum quicque elementum aequale sit: x1=x2=...=xNAμ,σ=0.
  2. Numero constante elementis addito non mutantur: y1=x1+a,...,yN=xN+a,aAμ(X)=Aμ(Y),σ(X)=σ(Y).
  3. Multiplicatis numero constante elementis indices duo multiplicantur magnitudine absoluta ipsius numeri: z1=bx1,...,zN=bxNAμ(Z)=|b|Aμ(X),σ(Z)=|b|σ(X).

Variantia et deviantia

Appellatur variantia deviatio canonica ad secundam potentiam dignata:

σ2=1Ni=1N(xiμ)2

Atque appellatur N-upla variantia deviantia:

Deviantia=i=1N(xiμ)2

Adaptatio deviationis canonicae distributioni frequentiarum

Cum copiae elementorum indices dispersionis adhibeantur, cui adest distributio frequentiarum, totiens differentiae quadraticae (xiμ)2 multiplicandae sunt, quotiens adsunt elementa valore xi. Itaque si numeri ni sunt frequentiae absolutae et fi relativae, sic deviatio canonica fit:

σ=1Ni=1k(xiμ)2ni=i=1k(xiμ)2fiN=i=1kni

Formula brevior non mutatur, medietates tamen quadratica atque arithmetica ut distributionibus frequentiarum computantur.

Cum frequentiae in classes subdividantur, in valorum locum subdendae sunt earum medietates arithmeticae aut eis absentibus valores centrales, ut computandis medietatibus frequentiis in classes subdivisis:

σ=1Ni=1k(x¯iμ)2ni=i=1k(x¯iμ)2fi=1Ni=1kx¯i2niμ2

ubi postremum membrum est adaptatio formulae brevioris supradictae.

Differentiae mediae

Differentiae mediae ab amotionibus mediis ob id differunt, quod non a medietate elementorum distantiae computantur, sed a quoque alio elemento. Cum sit multum usitatior deviatio canonica, his indicibus magna est gravitas rationalis.

Itaque definiri potest differentia simplex media:

Δ=1N(N1)i=1Nj=1,ijN|xixj|

quae est medietas arithmetica distantiarum cuiusque elementi a quoque alio elemento.

Quia binis elementis xi,xj est distantia reflexiva |xixj|=|xjxi|, supradicta definitio sic quoque rescribi potest:

Δ=2N(N1)i=2Nj=1i=1|xixj|

Differentiae simplici mediae eaedem sunt proprietates atque amotionibus mediis supradictae.

Quae cum frequentiarum distributioni computetur, distantiaque igitur |xixj| adhibeatur omnibus binis elementis valoribus xi et xj, tum sic mutatur definitioFormula:Dubium:

Δ=2N(N1)i=2kj=1i1|xixj|ninj

Intervalla variationis

Campus variationis

Campus variationis modo est differentia inter maximum minimumque elementum:

Δc=x(N)x(1)

Huic eaedem sunt proprietates atque amotionibus differentiisque mediis.

Differentia interquartilis

Elementorum copiae dicitur differentia interquartilis differentia inter eius primum tertiumque quartile:

Δq=q3q1

Ut campi variationis, huius differentiae descriptione de varietate distributionis non multum potest cognosci; differentia interquartilis enim nulla potest esse, etiam nonnulla varietate.

Indices varietatis percentuales

Omnes indices varietatis supradicti absoluti dicuntur. Indices absoluti aliquando idonei non sunt; inter alia eis non oportet uti, cum distributiones duae (aut plures) committendae sint, quod earum magnitudines possunt inter se differre. Exempli gratia sint hae duae distributiones:

A={1.98,2.03,2.01,1.99,2}

B={495,507.5,502.5,497.5,500}

Distributionis B elementa modo sunt illa distributionis A ducentupla ac quinquagintupla: earum varietas non vere commutatur. Absoluti vero indices varietatis cum id non comprehendant, magnitudinem varietatis distributionis B inflant.

Itaque oportet definiri indices varietatis percentuales, qui sunt centupli indices varietatis absoluti medietate arithmetica divisi.

Inter eos potissimus est coefficiens variationis, qui est deviatio canonica percentualis:

CV=100σ/μ

Concentratio

Cum character transferibile (et positivum) sit, possit igitur in elemento deminui vel augeri, quasi ab elemento ad aliud transferatur, eius potest computari concentratio, quae metitur cuiquene elemento sit characteris valor similis an paucis elementis sit valor maior at omnibus aliis minor. Ergo cum pleramque summam characteris habeant elementa maximis valoribus, maior est concentratio, quam si omnia similia essent.

Singillatim habetur aequidistributio cum omnibus elementis sit isdem valor (x1=...=xN), et maxima concentratio cum uni elemento soli sit valor positivus (x(1)=...=x(N1)=0,x(N)=Nμ). Hic signum x(i) elementum significat i-esimum cum omnia elementa ordinata sint a minore ad maius.

Index Ginianus

Ad concentrationem metiendam usitatissimus index est index concentrationis Ginianus. Ante pauca dicenda sunt, quam definiatur.

Oportet mentiri quantam partem summae characteris elementa minoribus valoribus obtineant. Ad hoc faciendum, definimus numerum Ai:

Ai=j=1ix(j)

Hic ergo est valorum summa numeri i elementorum minoribus valoribus. Itaque AN=Nμ modo est summa valorum characteris omnium. Nunc appellamus i-esima pars characteris numerus Qi=Ai/AN, et i-esima pars elementorum numerus Pi=i/N. Notandum est aequidistributione partes characteris easdem et partes elementorum.

Itaque sic potest definiri index Ginianus:

G=i=1N1(PiQi)i=1N1Pi vel 2N1i=1N1(PiQi)

Quod posuimus Qi et Pi numeros positivos, numerator est minor denominatore; index igitur hic inter 0 et 1 comprehenditur, nullusque est aequidistributione unusque maxima concentratione. Ob eam rem, index Ginianus idoenus est ad distributiones committendas.

Etiam potest definiri corrationalitasFormula:Dubsig concentrationis R=2Ni=1N1(PiQi)=N1NG; limite cardinalitatis N ad infinitatem corrationalitas concentrationis atque index Ginianus adaequant.

Inter eius proprietates:

  1. Index Ginianus deminuitur addito omnibus elementis numero positivo: yi=xi+a,a+Gy<Gx.
  2. Constat multiplicatis omnibus elementis numero positivo: yi=bxi,b+Gy=Gx.
  3. Augetur deminuto valore elementi auctoque valore elementi aliius cui valor erat maior valore deminuendo (ergo charactere "translato" ab elemento valore minore ad aliud valore maiore): y(i)=x(i)c,y(j)=x(j)+c,y(k)=x(k),c+,i<j,ki,jGy>Gx.

Demonstratio proprietatum indicis Giniani

Primum demonstramus indicem deminui addito elementis numero positivo. i-esima enim pars characteris sic fit: Ai+icAN+Nc, ubi c est additus numerus; et verum id est: ANNAii0, quia medietas arithmetica copiae omnium elementorum certe maior est medietate unius subcopiae, cuius elementa sunt omnia minora quam illa quae subcopiae desint, sed copiae adsint. Itaque:

Ai+icAN+NcAiAN=AiAN+icANAiANNcAiAN(AN+Nc)=icN(ANNAii)AN(AN+Nc)0

Partes enim characteris augentur, quod deminutionem concentrationis exprimit.

Similiter, ut demonstretur indicem constare elementis multiplicatis, est satis id perspicere: bAibAN=AiAN, ergo partes characteris non mutantur, neque index.

Ad tertiam proprietatem demonstrandam, solam novam explicemus distributionem charactere translato:

x(1),...,x(i)c,...,x(j)+c,...,x(N)

Ergo partes characteris Q1,...,Qi1,Qj,...,QN non mutantur; partes autem Qi,...,Qj1 deminuuntur, quod augmentum exprimit concentrationis.

Curvamen Lorenzianum

Exemplum curvaminis Lorenziani.

Curvamen Lorenzianum imago curvaminis est concentrationem depingentis. Si enim ad indicem Ginianum computandum inventae sunt elementorum partes P1,P2...PN charaterisque partes Q1,Q2...QN, curvamen Lorenzianum est curvamen quod puncta (0,0),(P1,Q1)...(PN,QN) in plano Cartesiano coniungit. In ipso plano saepe etiam depingitur linea recta ab puncto (0,0) ad punctum (1,1), appellata linea aequidistributionis, atque altera per puncta (0,0),(N1N,0),(1,1), appellata curvamen maximae concentrationis.

Aequidistributione enim curvamen Lorenzianum atque linea aequidistributionis adaequant; idem maxima concentratione accidit ipsius curvamini.

Per curvamen Lorenzianum etiam potest alio modo computari index Ginianus. Si enim appellamus littera S aream inter curvamen Lorenzianum ac linea aequidistributionis:

G=2NSN1=SmaxS

ubi maxS expressio aream inter lineam aequidistributionis curvamenque maximae concentrationis designat.

Demonstratio indicis Giniani computabilis per curvamen Lorenzianum

Sint {l1,l2,...,lN} puncta curvaminis Lorenziani, quorum coordinatae sint (Pi,Qi). Nunc appellemus signo Ii aream polygoni a punctis {(Pi1,Qi1),(Pi1,0),(Pi,0),(Pi,Qi)} designati, signoque Si aream alterius polygoni a punctis {(Pi1,Pi1),(Pi1,0),(Pi,0),(Pi,Pi)} designati. Id patet:

Ii=(PiPi1)(Qi1+Qi)2

Si=(PiPi1)(Pi1+Pi)2

S=i=1N(SiIi)=i=1Nsi

ubi signum si areas polygonorum a punctis {(Pi1,Qi1),(Pi1,Pi1),(Pi,Qi),(Pi,Pi)} designatorum significat, quae coniuncta aream S efficiunt. Quod licet scribi:

si=(PiPi1)(Pi1Qi1+PiQi)/2

S=12i=1N((PiPi1)(Pi1Qi1+PiQi))

Nunc cum haec vera sciamus:

PiPi1=1/N

i=1N(Pi1Qi1)=i=1N(PiQi)=i=1N1(PiQi)

Potest computari S=22Ni=1N1(PiQi), et quod maxS=N12N, denique liquet:

SmaxS=2N1i=1N1(PiQi)=NN1R=G

quod erat demonstrandum.

Concentratio distributionum frequentiarum

Si distributioni frequentiarum a nobis index Ginianus computandus est, formula non simplex fit, aliquasque adaptationes necesse est facere. Definiamus littera Ni frequentias cumulatas, et deinde hos numeros:

A'i=i=1kxini,P'i=NiN,Q'i=A'iA'k

Itaque potest corrationalitas concentrationis definiri:

R=i=1k((P'i1Q'i1)+(P'iQ'i))niN,P'0=Q'0=0

Eadem formula haec ad frequentias in classes subdivisas adaptari potest, cum in valorum xi locum subdantur classium valores centrales aut cognotae classium medietates arithmeticae.

Heterogeneitas atque homogeneitas

Omnes indices supradicti characteribus quantitativis excogitati sunt. Multum difficilius est characterum qualitativorum in unum numerum varietatem colligere, oportet enim homogeneitatem atque heterogeneitatem definire.

Distributioni frequentiarum est minima heterogeneitas maximaque homogeneitas cum cuique elemento sit isdem valor characteris; est autem maxima heterogeneitas cum cuique valori sit eadem frequentia.

Exempli gratia:

Distributio maxima homogeneitate
Valor x1 x2 x3 Omnes
Frequentia 0 0 N N

Hic omnibus elementis est valor x3.

Distributio maxima heterogeneitate
Valor x1 x2 x3 Omnes
Frequentia N/3 N/3 N/3 N

Hic omnibus valoribus est frequentia N/3.

Itaque duo indices heterogeneitatis possunt definiri, index heterogeneitatis Ginianus atque entropia:

hG=1i=1kfi2

ent=i=1kfiln(fi)

ubi fi litterae frequentias relativas designant.

Utendi delectus indicis varietatis

Varietati mentiendae plerique deviatione canonica utuntur, quod inter alia, ipsa eiusque functiones potissimae sunt in inferentia statistica. Deviatio canonica enim aptissima est varietati elementorum eadem magnitudine vel mensura.

Cum id non accidat, potius quam ea differentiis mediis utendum est. Quod autem saepe non evenit, cum programmata computatralia statistica pleraque ad inferentiam statisticam conceptentur et deviationem canonicam praeponant; idem campo variationis intervalloque interquartili accidit, quibus iam non praestet uti facilius computandis, quod nunc computatores celeriter facileque computant deviationem canonicam.

Indicibus percentualibus tamen uti oportet cum distributiones elementorum magnitudine diversa conferantur; atque indices concentrationis heterogeneitatisque saepe prosunt, primi characteribus trasferibilibus, secundique qualitativis.

Nexus interni

Bibliographia

  • Cicchitelli, D'Urso, Minozzo, 2018. Statistica: principi e metodi. Pearson. ISBN 9788891902788.