Jump to content

Shpërndarja normale

Nga Wikipedia, enciklopedia e lirë
Shpërndarja normale
Probability density function

Kurba e kuqe është shpërndarja normale standarde
Cumulative distribution function
Simboli
Parametrat = vendndodhja
= shkalla
Mbështetës
FDGJ
FGSH
Kuantili
Vlera e pritur
Mediana
Moda
Varianca
DMA
Shtrirja
Kurtoza e tepërt
Entropia
FGJM
FK
Informacione për Fisher
Divergjenca Kullback-Leibler

statistikë, një shpërndarje normale ose shpërndarje Gausiane është një lloj shpërndarjeje e vazhdueshme probabiliteti për një ndryshore të rastësishme me vlera reale . Forma e përgjithshme e funksionit të densitetit të probabilitetit të tij është

Parametri është mesatarja ose pritja matematike e shpërndarjes (dhe gjithashtu mesorja dhe moda e saj), ndërsa parametri është devijimi standard i tij. Varianca e shpërndarjes është . Një ndryshore e rastësishme me shpërndarje Gausiane thuhet se është e shpërndarë normalisht .

Shpërndarjet normale janë të rëndësishme në statistikë dhe shpesh përdoren në shkenca natyrore dhe sociale për të përfaqësuar ndryshore rasti me vlera reale, shpërndarjet e të cilave nuk dihen. [1] [2] Rëndësia e shpërndarjes normale vjen pjesërisht për shkak të teoremës së qendrore limite . Ai thotë se, në disa kushte, mesatarja e shumë zgjedhjeve (vëzhgimeve) të një ndryshoreje rasti me pritje dhe dispersion të fundëm është në vetvete një ndryshore rasti - shpërndarja e së cilës konvergjon në një shpërndarje normale teksa numri i zgjedhjeve rritet. Prandaj, madhësitë fizike që priten të jenë shuma e shumë proceseve të pavarura, siç janë gabimet e matjes, shpesh kanë shpërndarje që janë pothuajse normale. [3]

Për më tepër, shpërndarjet Gausiane kanë disa veti unike që janë të vlefshme në studimet analitike. Për shembull, çdo kombinim linear i disa ndryshoreve që ndjekin ligj normal është një ndryshore rasti që ndjek po një ligj normal. Shumë rezultate dhe metoda, të tilla si përhapja e pasigurisë dhe përshtatja e parametrave të katrorëve më të vegjël, mund të nxirren në mënyrë analitike në formë të qartë kur ndryshoret përkatëse shpërndahen normalisht.

Një shpërndarje normale nganjëherë quhet joformalisht një kurbë këmbanë . [4] Megjithatë, shumë shpërndarje të tjera janë në formë këmbane (të tilla si Cauchy, e Studentit dhe shpërndarjet logjistike ).

Shpërndarja e probabilitetit njëdimensional përgjithësohet për vektorët në shpërndarjen normale multivariate dhe për matricat në shpërndarjen normale të matricës .

Shpërndarja normale standarde

[Redakto | Redakto nëpërmjet kodit]

Rasti më i thjeshtë i një shpërndarjeje normale njihet si shpërndarja normale standarde ose shpërndarja normale njësi . Ky është një rast i veçantë kur dhe , dhe përshkruhet nga ky funksion i densitetit të probabilitetit (ose densiteti):

Ndryshorja ka një mesatare 0 dhe variancë dhe devijim standard të barabartë me 1. Dendësia arrin majën e saj dhe pikat e infleksionit në dhe .

Shpërndarja e përgjithshme normale

[Redakto | Redakto nëpërmjet kodit]

Çdo shpërndarje normale është një modifikim i shpërndarjes normale standarde, domeini i së cilës është shtrirë me një faktor (devijimi standard) dhe më pas zhvendoset me (vlera mesatare):

Nqs ndjek ligjin normal standard, atëherë do të ketë një shpërndarje normale me pritje matematike dhe devijim standard . Në mënyrë analoge, nëse ndjek një ligj normal me parametera dhe , atëherë shpërndarja e mund të rishkallëzohet dhe të zhvendoset duke zbatuar formulën për ta kthyer atë në shpërndarjen normale standarde. Ndryshorja quhet ndrysha forma e standardizuar e .

Shpërndarja normale shpesh shënohet me simbolet ose . [5] Kështu kur një ndryshore rasti zakonisht ndjek një ligj normal me mesatare dhe devijimi standard , mund të shkruhet

Funksioni mbledhës i shpërndarjes

[Redakto | Redakto nëpërmjet kodit]

Funksioni kumulativ (mbledhës) i shpërndarjes (CDF) i shpërndarjes normale standarde, zakonisht i shënuar me germën e madhe greke , jepet si integrali

Funksioni i gabimit jep probabilitetin që një ndryshore rasti, me shpërndarje normale dhe mesatare 0 dhe variancë 1/2 të bjerë në intervalin . Kjo është:

Këto integrale nuk mund të shprehen në terma të funksioneve elementare, pra janë të paintegrueshme me kuadraturë, dhe shpesh thuhet se janë funksione speciale . Megjithatë, njihen shumë përafrime numerike të tyre.

Të dy funksionet janë të lidhura ngushtë, domethënë

Për një shpërndarje normale të zakonshme me dendësi , pritje matematike dhe devijimi , funksioni mbledhës i shpërndarjes është

Një përafrim i shpejtë i CDF-së së shpërndarjes normale standarde mund të gjendet duke përdorur një përafrim nëpërmjet serisë Tejlor:

Devijimi standard dhe mbulimi

[Redakto | Redakto nëpërmjet kodit]
Për shpërndarjen normale, vlerat më pak se një devijim standard larg mesatares përbëjnë 68.27% të grupit; ndërsa dy devijime standarde nga mesatarja përbëjnë 95.45%; dhe tre devijime standarde përbëjnë 99.73%.

Rreth 68% e vlerave të nxjerra nga një shpërndarje normale janë brenda një devijimi standard σ larg mesatares ; rreth 95% e vlerave qëndrojnë brenda dy devijimeve standarde; dhe rreth 99.7% janë brenda tre devijimeve standarde. [4] Ky fakt njihet si rregulli 68-95-99.7 (empirik), ose rregulli 3-sigma .

Më saktësisht, probabiliteti që një realizim (rast) i n.r me ligj normal të jetë në intervalin ndërmjet dhe jepet nga

Shpërndarja normale është e vetmja shpërndarje kumulantët e së cilës përtej dy të parave (dmth., përveç mesatares dhe variancës ) janë zero. Është gjithashtu shpërndarja e vazhdueshme me entropinë maksimale për një mesatare dhe variancë të caktuar. [6] [7] Geary ka treguar, duke supozuar se mesatarja dhe varianca janë të fundme, se shpërndarja normale është e vetmja shpërndarje ku mesatarja dhe varianca e llogaritur nga një grup i pavaru janë të pavarura nga njëra-tjetra. [8]

Shpërndarja normale është simetrike me bosht simetrie mesataren e saj dhe është jo zero mbi të gjithë vijën reale. Si e tillë, mund të mos jetë një model i përshtatshëm për variablat që janë në thelb pozitive ose shumë të anuara, si pesha e një personi ose çmimi i një aksioni . Ndryshore të tilla mund të përshkruhen më mirë nga shpërndarje të tjera, të tilla si shpërndarja log-normale ose shpërndarja Pareto .

Shpërndarja gausiane i përket familjes së shpërndarjeve të qëndrueshme. Me përjashtim të Gaussian-it që është një rast kufizues, të gjitha shpërndarjet e qëndrueshme kanë bishta të rëndë dhe variancë të pafundme. Është një nga shpërndarjet e pakta që janë të qëndrueshme dhe që kanë funksione të densitetit të probabilitetit të cilat mund të shprehen në mënyrë analitike, të tjerat janë shpërndarja Cauchy dhe shpërndarja Lévy .

Shpërndarjet e ndërlidhura

[Redakto | Redakto nëpërmjet kodit]

Teorema e kufirit qendror

[Redakto | Redakto nëpërmjet kodit]
Ndërsa numri i ngjarjeve diskrete rritet, funksioni fillon të ngjajë me një shpërndarje normale

Teorema qendrore limite pohon se në kushte të caktuara (mjaft të zakonshme), shuma e shumë ndryshoreve të rastit do të ketë një shpërndarje afërsisht normale. Më konkretisht, kur janë variabla të rastësishme të pavarura dhe të shpërndara identikisht me të njëjtën shpërndarje çfarëdo, mesatare zero dhe variancë dhe është mesatarja e tyre e shkallëzuar nga

Atëherë, kur rritet, shpërndarja e probabilitetit të do të prirent drejt shpërndarjes normale me mesatare 0 dhe variancë .

Teorema mund të shtrihet për variabla që nuk janë të pavarura dhe/ose jo të shpërndara identikisht nëse vendosen kufizime të caktuara mbi shkallën e varësisë dhe momentet e shpërndarjeve.

Teorema e kufirit qendror nënkupton gjithashtu që shpërndarje të caktuara mund të përafrohen me shpërndarjen normale, për shembull:

  • Shpërndarja binomiale është afërsisht normale me mesatare dhe variancë për të mëdha dhe për vlera të jo shumë afër 0 ose 1.
  • Shpërndarja Poisson me parametër është afërsisht normale me mesatare dhe variancë , për vlera të mëdha të . [9]
  • Shpërndarja hi-katror është afërsisht normale me mesatare dhe variancë , për vlera të mëdha të .
  • Shpërndarja e studentit t është afërsisht normale me mesatare 0 dhe variancë 1 kur është e madhe.

Nëse këto përafrime janë të sakta mjaftueshëm varet nga qëllimi për të cilin nevojiten dhe nga shkalla e konvergjencës me shpërndarjen normale. Zakonisht ndodh që përafrime të tilla janë më pak të sakta në bishtat e shpërndarjes.

Veprimet dhe funksionet e ndryshoreve normale

[Redakto | Redakto nëpërmjet kodit]

Dendësia e probabilitetit, shpërndarja kumulative dhe shpërndarja kumulative e anasjelltë e çdo funksioni të një ose më shumë ndryshoreve normale të pavarura ose të ndërlidhura mund të llogariten me metodën numerike të gjurmimit të rrezeve [10] ( kodi Matlab ). Në seksionet e mëposhtme do të shohim disa raste të veçanta.

Veprimet mbi një ndryshore të vetme normale

[Redakto | Redakto nëpërmjet kodit]

Nëse ndjek një ligj normal me mesatare dhe variancë , atëherë

  • , për çdo numër real dhe , gjithashtu ndjek një shpërndarje normale, me mesatare dhe devijim standard . Kjo do të thotë se familja e shpërndarjeve normale është e mbyllur nën transformimet lineare .
  • Eksponenciali i shpërndahet log-normalisht : .
  • Vlera absolute e ka shpërndarje normale të palosshme : . Nëse kjo njihet si shpërndarja gjysëm normale .
  • Vlera absolute e mbetjeve të normalizuara, pra , ka shpërndarje hi me një shkallë lirie: .
  • Katrori i ka shpërndarjen joqendrore hi-katrore me një shkallë lirie: . Nëse , shpërndarja quhet thjesht hi-katrore .
  • ka një shpërndarje Lévy me vendndodhje 0 dhe shkallë .
Veprimet në dy ndryshore normale të pavarura
[Redakto | Redakto nëpërmjet kodit]
  • Nëse dhe janë dy ndryshore rasti normale të pavarura, me mesatare , dhe devijime standarde , , atëherë shuma e tyre gjithashtu do të ndjekë një shpërndarje normale, [prova] me mesatare dhe variancë .
  • Në veçanti, nëse dhe janë normale të pavarura me mesatare 0 dhe variancë , atëherë dhe janë gjithashtu të pavarura dhe të shpërndara normalisht, me mesatare zero dhe variancë . Ky është një rast i veçantë i identitetit të polarizimit . [11]
  • Nëse , janë dy n.r normale të pavarura me mesatare dhe devijim , dhe , janë numra realë arbitrarë, atëherë ndryshorja:
  • Nëse , janë shpërndarje normale, atëherë mesatarja e tyre gjeometrike e normalizuar është një shpërndarje normale me dhe (shih këtu për një vizualizim).
Veprimet në dy ndryshore normale standarde të pavarura
[Redakto | Redakto nëpërmjet kodit]

Nëse dhe janë dy n.r standarde të pavarura me mesatare 0 dhe variancë 1, atëherë

  • Shuma dhe diferenca e tyre ndjek një shpërndarje normale me mesatare zero dhe variancë dy: .
  • Produkti i tyre ndjek shpërndarjen e produktit [12] me funksionin e densitetit ku është funksioni Bessel i modifikuar i llojit të dytë . Kjo shpërndarje është simetrike rreth zeros, e pakufizuar në , dhe ka funksionin karakteristik .
  • Raporti i tyre ndjek shpërndarjen standarde Cauchy : .
  • Norma e tyre Euklidiane ka shpërndarjen Rayleigh .

Veprimet në shumë ndryshore normale të pavarura

[Redakto | Redakto nëpërmjet kodit]
  • Çdo kombinim linear i n.r normale është ndryshore rasti normale.
  • Nëse janë ndryshore të rastit normale standarde dhe të pavarura, atëherë shuma e katrorëve të tyre ka shpërndarjen chi-katror me shkallë lirie
  • Nëse janë n.r të pavarura të shpërndara normalisht me mesatare dhe variancë , atëherë mesatarja e kampionit të tyre është e pavarur nga devijimi standard i mostrës. [13] Raporti i këtyre dy madhësive do të ketë shpërndarjen e Studentit me shkallët e lirisë:
  • Nëse , janë ndryshore rasti normale standarde të pavarura, atëherë raporti i shumave të tyre të normalizuara të katrorëve do të ndjekë shpërndarjen F me (n, m ) shkallë lirie: [14]

Ndodhja dhe aplikimet

[Redakto | Redakto nëpërmjet kodit]

Ndodhja e shpërndarjes normale në problemet praktike mund të klasifikohet lirshëm në katër kategori:

  1. Shpërndarjet saktësisht normale;
  2. Ligjet përafërsisht normale, për shembull kur një përafrim i tillë justifikohet nga teorema qendrore limite ; dhe
  3. Shpërndarjet e modeluara si normale – shpërndarja normale është shpërndarja me entropinë maksimale për një mesatare dhe variancë të caktuar.
  4. Problemet e regresionit - shpërndarja normale gjendet pasi efektet sistematike janë modeluar mjaft mirë.

Normalitet i saktë

[Redakto | Redakto nëpërmjet kodit]
Gjendja bazë e një oshilatori harmonik kuantik ka shpërndarjen Gausiane.

Madhësi të caktuara në fizikë shpërndahen normalisht, siç u demonstrua për herë të parë nga James Clerk Maxwell . Shembuj të madhësuve të tilla janë:

  • Funksioni i densitetit të probabilitetit të një gjendjeje bazë në një oshilator kuantik harmonik .
  • Pozicioni i një grimce që përjeton difuzion . Nëse fillimisht grimca ndodhet në një pikë specifike , atëherë pas t kohe, vendndodhja e saj përshkruhet nga një shpërndarje normale me variancë t, e cila kënaq ekuacionin e difuzionit .  . Nëse vendndodhja fillestare jepet nga një funksion i caktuar i densitetit , atëherë dendësia në kohën t është konvolucioni i g dhe PDF-së normale.

Normalitet i përafërt

[Redakto | Redakto nëpërmjet kodit]

Shpërndarjet përafërsisht normale ndodhin në shumë situata, siç shpjegohet nga TQL . Kur rezultati prodhohet nga shumë efekte të vogla që veprojnë në mënyrë mbledhëse dhe të pavarur, shpërndarja e tij do të jetë afër normales. Përafrimi normal nuk do të jetë i vlefshëm nëse efektet veprojnë në mënyrë shumëzuese (në vend të shtimit), ose nëse ka një ndikim të vetëm të jashtëm që ka një madhësi dukshëm më të madhe se efektet e tjera.

  • Në problemet e numërimit, ku teorema qendrore limite përfshin një përafrim diskret në vazhdimësi dhe ku përfshihen shpërndarje pafundësisht të pjesëtueshme dhe të zbërthyeshme, si p.sh.
    • Ndryshore të rastit binomiale, të lidhura me variablat e përgjigjes binare;
    • Ndryshore të rastit Poisson, të lidhura me ngjarje të rralla;
  • Rrezatimi termik ka një shpërndarje Bose-Einstein në shkallë shumë të shkurtra kohore dhe një shpërndarje normale në shkallë më të gjata kohore për shkak të teoremës së kufirit qendror.

Normalitet i supozuar

[Redakto | Redakto nëpërmjet kodit]
Histogrami i gjerësisë së sepalit për Iris versicolor nga grupi i të dhënave të luleve të Iris, me shpërndarjen normale ë të përshtatshme të mbivendosur.

Ka metoda statistikore për të testuar në mënyrë empirike atë supozim; shih seksionin e mësipërm të testeve të normalitetit .

  • biologji, logaritmi i variableve të ndryshme priret të ketë një shpërndarje normale, domethënë, ata priren të kenë një shpërndarje log-normale (pas ndarjes në nënpopullatat meshkuj/femra), me shembuj që përfshijnë:
    • Matjet e madhësisë së indit të gjallë (gjatësia, lartësia, sipërfaqja e lëkurës, pesha); [15]
    • Gjatësia e shtojcave inerte (flokët, kthetrat, thonjtë, dhëmbët) e ekzemplarëve biologjikë, në drejtim të rritjes ;mendohet se trashësia e lëvores së pemës gjithashtu i përket kësaj kategorie;
    • Disa matje fiziologjike, si presioni i gjakut tek njerëzit e rritur.
  • Në financë, në veçanti modeli Black–Scholes, ndryshimet në logaritmin e kurseve të këmbimit, indekseve të çmimeve dhe indekseve të bursës supozohen normale (këto variabla sillen si interesi i përbërë, jo si interesi i thjeshtë dhe kështu janë shumëzues). Disa matematikanë si Benoit Mandelbrot kanë argumentuar se shpërndarjet log-Levy, të cilat posedojnë bishta të rëndë do të ishin një model më i përshtatshëm, veçanërisht për analizën për rrëzimet e tregut të aksioneve.
  • Gabimet e matjes në eksperimentet fizike shpesh modelohen nga një shpërndarje normale. Ky përdorim i një shpërndarjeje normale nuk nënkupton që dikush po supozon se gabimet e matjes shpërndahen normalisht, përkundrazi përdorimi i shpërndarjes normale prodhon parashikimet më konservatore të mundshme duke pasur parasysh vetëm njohuritë rreth mesatares dhe variancës së gabimeve. [16]
  • Në testimin e standardizuar, rezultatet mund të bëhen që të kenë një shpërndarje normale ose duke zgjedhur numrin dhe vështirësinë e pyetjeve (si në testin IQ ) ose duke i transformuar rezultatet e testit të papërpunuara në rezultate "output" duke i përshtatur ato në shpërndarjen normale. Për shembull, diapazoni tradicional i SAT prej 200–800 bazohet në një shpërndarje normale me një mesatare prej 500 dhe një devijim standard prej 100.
  1. ^ Normal Distribution, Gale Encyclopedia of Psychology
  2. ^ Casella & Berger (2001, f. 102)
  3. ^ Lyon, A. (2014).
  4. ^ a b "Normal Distribution". www.mathsisfun.com. Marrë më 2020-08-15. {{cite web}}: Mungon ose është bosh parametri |language= (Ndihmë!) Gabim referencash: Invalid <ref> tag; name ":1" defined multiple times with different content
  5. ^ McPherson (1990, f. 110)
  6. ^ Cover, Thomas M.; Thomas, Joy A. (2006). Elements of Information Theory. John Wiley and Sons. fq. 254. ISBN 9780471748816. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  7. ^ Park, Sung Y.; Bera, Anil K. (2009). "Maximum Entropy Autoregressive Conditional Heteroskedasticity Model" (PDF). Journal of Econometrics. 150 (2): 219–230. CiteSeerX 10.1.1.511.9750. doi:10.1016/j.jeconom.2008.12.014. Arkivuar nga origjinali (PDF) më 7 mars 2016. Marrë më 2011-06-02. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  8. ^ Geary RC(1936) The distribution of the "Student's" ratio for the non-normal samples".
  9. ^ "Normal Approximation to Poisson Distribution". Stat.ucla.edu. Marrë më 2017-03-03. {{cite web}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  10. ^ Das. "A method to integrate and classify normal distributions". arXiv:2012.14331. {{cite arXiv}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  11. ^ Bryc (1995, f. 27)
  12. ^ Weisstein, Eric W. "Normal Product Distribution". MathWorld. wolfram.com. {{cite web}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  13. ^ Lukacs, Eugene (1942). "A Characterization of the Normal Distribution". The Annals of Mathematical Statistics. 13 (1): 91–3. doi:10.1214/aoms/1177731647. ISSN 0003-4851. JSTOR 2236166. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  14. ^ Lehmann, E. L. (1997). Testing Statistical Hypotheses (bot. 2nd). Springer. fq. 199. ISBN 978-0-387-94919-2. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  15. ^ Huxley (1932)
  16. ^ Jaynes, Edwin T. (2003). Probability Theory: The Logic of Science. Cambridge University Press. fq. 592–593. ISBN 9780521592710. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)