Shpërndarja Pareto

Nga Wikipedia, enciklopedia e lirë
Pareto Type I
Probability density function
Pareto Type I probability density functions for various α
FDP Pareto për të ndryshme me Kur shpërndarja i përafrohet ku është funksioni delta i Dirakut.
Cumulative distribution function
Pareto Type I cumulative distribution functions for various α
FMSH Pareto për të ndryshme me
Parametrat Parametri i shkallës (real)
Parametri i formës (real)
Mbështetës
FDGJ
FGSH
Kuantili
Vlera e pritur
Mediana
Moda
Varianca
Shtrirja
Kurtoza e tepërt
Entropia
FGJMnuk ekziston
FK
Informacione për Fisher Right:

Shpërndarja Pareto, e emërtuar sipas inxhinierit të ndërtimit, ekonomistit dhe sociologut italian Vilfredo Pareto, [1] është një shpërndarje probabiliteti që përdoret në përshkrimin e dukurive të vëzhgueshme sociale, kontrollit të cilësisë, shkencore, gjeofizike, aktuariale dhe shumë llojeve të tjera; parimi i zbatuar fillimisht për të përshkruar shpërndarjen e pasurisë në një shoqëri, duke iu përshtatur prirjes që një pjesë e madhe e pasurisë të mbahet nga një pjesë e vogël e popullsisë. [2] [3] Parimi Pareto ose "rregulli 80-20" që thotë se 80% e rezultateve janë për shkak të 20% të shkaqeve u emërtua për nder të Paretos, por konceptet janë të dallueshme dhe vetëm shpërndarjet Pareto me vlerë të formës ( ) rreth 4 5 ≈ 1.16 pasqyrojnë saktësisht atë. Vëzhgimi empirik ka treguar se kjo shpërndarje 80-20 përshtatet me një gamë të gjerë rastesh, duke përfshirë fenomenet natyrore [4] dhe aktivitetet njerëzore. [5] [6]

Përkufizimet[Redakto | Redakto nëpërmjet kodit]

Nëse është një ndryshore e rastit me një shpërndarje Pareto, [7] atëherë probabiliteti që është më i madh se një numër , pra funksioni i mbijetesës (i quajtur edhe funksioni i bishtit), jepet nga

ku është vlera minimale e mundshme (domosdoshmërisht pozitive) e , dhe është një parametër pozitiv. Shpërndarja Pareto Lloji I karakterizohet nga një parametër i shkallës dhe një parametër i formës , i cili njihet si indeksi i bishtit . Kur kjo shpërndarje përdoret për të modeluar shpërndarjen e pasurisë, atëherë parametri quhet indeksi Pareto .

Funksioni mbledhës i shpërndarjes[Redakto | Redakto nëpërmjet kodit]

Nga përkufizimi, funksioni mbledhës i shpërndarjes së një ndryshoreje të rastit Pareto me parametra dhe është

Funksioni i densitetit të probabilitetit[Redakto | Redakto nëpërmjet kodit]

Nga kjo rrjedh (me diferencim ) se funksioni i dendësisë së probabilitetit është

Vetitë[Redakto | Redakto nëpërmjet kodit]

Momentet dhe funksioni karakteristik[Redakto | Redakto nëpërmjet kodit]

(Nëse , varianca nuk ekziston. )
  • Momentet e papërpunuara janë
  • Funksioni gjenerues i momentit përcaktohet vetëm për vlerat jo pozitive si
  • Funksioni karakteristik jepet nga
ku është funksioni i paplotë gama .

Mesatarja harmonike[Redakto | Redakto nëpërmjet kodit]

Mesatarja harmonike ( H ) është [8]

Lidhja me shpërndarjen eksponenciale[Redakto | Redakto nëpërmjet kodit]

Shpërndarja Pareto lidhet me shpërndarjen eksponenciale si më poshtë. Nëse X është Pareto-shpërndarë me minimum x m dhe indeks α, atëherë

shpërndahet në mënyrë eksponenciale me parametrin e shakllës  α . Në mënyrë ekuivalente, nëse Y shpërndahet në mënyrë eksponenciale me shpejtësi α, atëherë

është Pareto-shpërndarë me minimum x m dhe indeks α .

Më në përgjithësi, nëse (parametizimi i shkallës së formës) dhe , atëherë .

Lidhja me shpërndarjen log-normale[Redakto | Redakto nëpërmjet kodit]

Shpërndarja Pareto dhe shpërndarja log-normale janë shpërndarje alternative për përshkrimin e madhësive të së njëjtit lloj. Një nga lidhjet ndërmjet të dyjave është se ato janë të dyja shpërndarjet e eksponencialit të ndryshoreve të rastit të shpërndara sipas shpërndarjeve të tjera të zakonshme, përkatësisht shpërndarjes eksponenciale dhe shpërndarjes normale . (Shih seksionin e mëparshëm . )

Konkluzioni statistikor[Redakto | Redakto nëpërmjet kodit]

Vlerësimi i parametrave[Redakto | Redakto nëpërmjet kodit]

Funksioni i përgjasisë për parametrat e shpërndarjes Pareto α dhe x m, duke pasur parasysh një mostër të pavarur , është

Prandaj, funksioni logaritmik të përgjasisë është

Mund të shihet se është në rritje monotonike me , pra sa më e madhe të jetë vlera e , aq më e madhe është vlera e funksionit të gjasave. Prandaj, meqenëse , arrijmë në përfundimin se

Për të gjetur vlerësuesin për α, ne llogarisim derivatin e pjesshëm përkatës dhe përcaktojmë se ku është zero:

Kështu, vlerësuesi i përgjasisë maksimale për α është:

Gabimi statistikor i pritur është: [9]

Ndodhia dhe aplikimet[Redakto | Redakto nëpërmjet kodit]

Të përgjithshme[Redakto | Redakto nëpërmjet kodit]

Vilfredo Pareto fillimisht e përdori këtë shpërndarje për të përshkruar ndarjen e pasurisë midis individëve pasi dukej se tregonte mjaft mirë mënyrën se një pjesë më e madhe e pasurisë së çdo shoqërie zotërohet nga një përqindje më e vogël e njerëzve në atë shoqëri. Ai gjithashtu e përdori atë për të përshkruar shpërndarjen e të ardhurave. [3] Kjo ide ndonjëherë shprehet më thjesht si parimi Pareto ose "rregulli 80-20" që thotë se 20% e popullsisë kontrollon 80% të pasurisë. [10] Megjithatë, rregulli 80-20 korrespondon me një vlerë të veçantë të α, dhe në fakt, të dhënat e Paretos mbi tatimet britanike mbi të ardhurat në Cours d'économie politique tregojnë se rreth 30% e popullsisë kishte rreth 70% të të ardhurave.Grafiku i funksionit të dendësisë së probabilitetit (FDP) në fillim të këtij artikulli tregon se "probabiliteti" ose pjesa e popullsisë që zotëron një sasi të vogël pasurie për person është mjaft e lartë dhe më pas zvogëlohet në mënyrë të qëndrueshme me rritjen e pasurisë. (Sidoqoftë, shpërndarja Pareto nuk është realiste për pasurinë për pjesën e poshtme. Në fakt, vlera neto mund të jetë edhe negative. ) Kjo shpërndarje nuk kufizohet në përshkrimin e pasurisë ose të ardhurave, por në shumë situata në të cilat gjendet një baraspeshë në shpërndarjen e "të voglave" tek "të mëdhatë". Shembujt e mëposhtëm shihen ndonjëherë si të shpërndarë përafërsisht Pareto:

  • Madhësitë e vendbanimeve njerëzore (pak qytete, shumë fshatra/fshatra) [11] [12]
  • Shpërndarja e madhësisë së skedarit të trafikut të internetit që përdor protokollin TCP (shumë skedarë më të vegjël, pak më të mëdhenj) [11]
  • Shkalla e gabimit të diskut të ngurtë [13]
  • Grupet e kondensatës Bose-Einstein afër zeros absolute [14]
  • Vlerat e rezervave të naftës në fushat e naftës (disa fusha të mëdha, shumë fusha të vogla ) [11]
  • Shpërndarja e gjatësisë në punët e caktuara për superkompjuterët (disa të mëdhenj, shumë të vegjël) [15]
  • Kthimet e standardizuara të çmimeve për aksionet individuale [11]
  • Madhësitë e grimcave të rërës [11]
  • Madhësia e meteoritëve
  • Ashpërsia e humbjeve të mëdha të viktimave për linja të caktuara biznesi si përgjegjësia e përgjithshme, makina tregtare dhe kompensimi i punëtorëve. [16] [17]
  • Sasia e kohës që një përdorues në Steam do të kalojë duke luajtur lojëra të ndryshme. (Disa lojëra luhen shumë, por shumica luhen pothuajse kurrë.) [1] 
  • Në B[ hulumtim origjinal?esueshmërinë e Shpërndarjes së Ndërmarrjeve Elektrike (80% e minutave të ndërprera të klientit ndodhin në afërsisht 20% të ditëve në një vit të caktuar).
  1. ^ Amoroso, Luigi (1938). "VILFREDO PARETO". Econometrica (Pre-1986); Jan 1938; 6, 1; ProQuest. 6. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  2. ^ Pareto, Vilfredo (1898). "Cours d'economie politique". Journal of Political Economy. 6. doi:10.1086/250536. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  3. ^ a b Pareto, Vilfredo, Cours d'Économie Politique: Nouvelle édition par G.-H. Bousquet et G. Busino, Librairie Droz, Geneva, 1964, pp. 299–345. Original book archived
  4. ^ VAN MONTFORT, M.A.J. (1986). "The Generalized Pareto distribution applied to rainfall depths". Hydrological Sciences Journal. 31 (2): 151–162. doi:10.1080/02626668609491037. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  5. ^ Oancea, Bogdan (2017). "Income inequality in Romania: The exponential-Pareto distribution". Physica A: Statistical Mechanics and Its Applications. 469: 486–498. Bibcode:2017PhyA..469..486O. doi:10.1016/j.physa.2016.11.094. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  6. ^ Morella, Matteo. "Pareto Distribution". {{cite journal}}: Burimi journal ka nevojë për |journal= (Ndihmë!); Mungon ose është bosh parametri |language= (Ndihmë!)
  7. ^ Barry C. Arnold (1983). Pareto Distributions. International Co-operative Publishing House. ISBN 978-0-89974-012-6. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  8. ^ Johnson NL, Kotz S, Balakrishnan N (1994) Continuous univariate distributions Vol 1. Wiley Series in Probability and Statistics.
  9. ^ M. E. J. Newman (2005). "Power laws, Pareto distributions and Zipf's law". Contemporary Physics. 46 (5): 323–51. arXiv:cond-mat/0412004. Bibcode:2005ConPh..46..323N. doi:10.1080/00107510500052444. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  10. ^ For a two-quantile population, where approximately 18% of the population owns 82% of the wealth, the Theil index takes the value 1.
  11. ^ a b c d e Reed, William J.; etj. (2004). "The Double Pareto-Lognormal Distribution – A New Parametric Model for Size Distributions". Communications in Statistics – Theory and Methods. 33 (8): 1733–53. CiteSeerX 10.1.1.70.4555. doi:10.1081/sta-120037438. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!) Gabim referencash: Invalid <ref> tag; name "Reed" defined multiple times with different content
  12. ^ Reed, William J. (2002). "On the rank‐size distribution for human settlements". Journal of Regional Science. 42 (1): 1–17. doi:10.1111/1467-9787.00247. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  13. ^ Schroeder, Bianca; Damouras, Sotirios; Gill, Phillipa (2010-02-24). "Understanding latent sector error and how to protect against them" (PDF). 8th Usenix Conference on File and Storage Technologies (FAST 2010). Marrë më 2010-09-10. We experimented with 5 different distributions (Geometric, Weibull, Rayleigh, Pareto, and Lognormal), that are commonly used in the context of system reliability, and evaluated their fit through the total squared differences between the actual and hypothesized frequencies (χ2 statistic). We found consistently across all models that the geometric distribution is a poor fit, while the Pareto distribution provides the best fit. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  14. ^ Yuji Ijiri; Simon, Herbert A. (maj 1975). "Some Distributions Associated with Bose–Einstein Statistics". Proc. Natl. Acad. Sci. USA. 72 (5): 1654–57. Bibcode:1975PNAS...72.1654I. doi:10.1073/pnas.72.5.1654. PMC 432601. PMID 16578724. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  15. ^ Harchol-Balter, Mor; Downey, Allen (gusht 1997). "Exploiting Process Lifetime Distributions for Dynamic Load Balancing" (PDF). ACM Transactions on Computer Systems. 15 (3): 253–258. doi:10.1145/263326.263344. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  16. ^ Kleiber and Kotz (2003): p. 94.
  17. ^ Seal, H. (1980). "Survival probabilities based on Pareto claim distributions". ASTIN Bulletin. 11: 61–71. doi:10.1017/S0515036100006620. {{cite journal}}: Mungon ose është bosh parametri |language= (Ndihmë!)