Në teorinë dhe statistikat e probabilitetit, varianca ose dispersioni është shamngia në katror nga mesatarja e një ndryshoreje rasti . Varianca shpesh përkufizohet gjithashtu si katrori i devijimit standard . Varianca është një matëse e shpërndarjes, që do të thotë se është një matëse se sa larg është shpërndarë një grup numrash nga vlera e tyre mesatare. Është momenti i dytë qendror i një shpërndarjeje, dhe kovarianca e ndryshores së rastësishme me vetveten, dhe shpesh përfaqësohet nga , , , , ose . [1]
Një avantazh i dispersionit si masë e shpërndarjes është se është më i përshtatshëm për manipulimin algjebrik sesa masat e tjera të shpërndarjes, siç është devijimi absolut i pritur ; për shembull, varianca e një shume ndryshoresh rasti të pakorreluara është e barabartë me shumën e variancave të tyre. Një disavantazh i dispersionit në zbatime praktike është se, ndryshe nga devijimi standard, njësitë e tij ndryshojnë nga ajo e n.r, kjo është arsyeja pse devijimi standard raportohet më shpesh si një masë e shpërndarjes pasi përfundon llogaritja.
Ka dy koncepte të ndryshme që emërtohen të dyja "variancë". Njëra, siç u diskutua më lart, është pjesë e një shpërndarjeje teorike probabiliteti dhe përcaktohet nga një ekuacion. Varianca tjetër është një karakteristikë e një grupi vëzhgimesh. Kur varianca llogaritet nga vëzhgimet, ato vëzhgime zakonisht maten nga një sistem i botës reale. Nëse të gjitha rezultatet e mundshme të sistemit janë të pranishme, atëherë varianca e llogaritur quhet variancë e popullsisë. Normalisht, megjithatë, vetëm një nëngrup është i gatshëm dhe varianca e llogaritur nga kjo mënyrë quhet variancë e mostrës. Varianca e llogaritur nga një kampion konsiderohet si një vlerësim i variancës së plotë të popullsisë. Ka shumë mënyra për të llogaritur një vlerësim të variancës së popullsisë, siç diskutohet në seksionin më poshtë.
Varianca e një ndryshoreje rasti është vlera e pritur e devijimit nga mesatarja në katror e , :
Ky përkufizim përfshin ndryshore rasti që krijohen nga procese që janë diskrete, të vazhdueshme, as ose të përziera. Varianca mund të konsiderohet gjithashtu si kovarianca e një ndryshoreje të rastësishme me vetveten:
Një tjetër formulë për dispersionin merret si më poshtë:
Me fjalë të tjera, varianca e X është e barabartë me mesataren e n.r të ngritur në katror minus katrorin e mesatares së . Ky ekuacion nuk duhet të përdoret për llogaritjet duke përdorur aritmetikën me pikë lundruese, sepse vuan nga anulimi katastrofik nëse dy komponentët e ekuacionit janë të ngjashëm në madhësi. Për alternativa të tjera numerikisht të qëndrueshme, shihni Algoritmet për llogaritjen e variancës .
Hedhja e një zari të drejtë mund të modelohet si n.r diskrete, , me rezultate nga 1 deri tek 6, secila me probabilitet të njëjtë 1/6. Pritja matematike e është Kështu që, varianca e është
Shpërndarjet e probabilitetit të përdorura zakonisht
Nëse një shpërndarje nuk ka pritje matematike të fundme, siç është rasti për shpërndarjen Cauchy, atëherë edhe varianca nuk mund të jetë e fundme. Megjithatë, disa shpërndarje mund të mos kenë një variancë të fundme, pavarësisht se pritja matematike është e fundme. Një shembull i tillë është një shpërndarje Pareto, indeksi i së cilës plotëson kushtin
Ndryshe nga devijimi absolut i pritur, varianca e një ndryshore ka njësi që janë katrori i njësive të vetë ndryshores. Për shembull, një ndryshore e matur në metra do të ketë një variancë të matur në metra katrorë. Për këtë arsye, përshkrimi i grupeve të të dhënave nëpërmjet devijimit të tyre standard ose devijimit mesatar katror nën rrënjë shpesh preferohet ndaj përdorimit të variancës. Në shembullin e zareve, devijimi standard është , pak më i madh se devijimi absolut i pritur, 1.5.
Varianca është e pandjeshme ndaj ndryshimeve në një parametër vendndodhjeje . Kjo do të thotë se nëse një konstante u shtohet të gjitha vlerave të ndryshores, varianca mbetet e pandryshuar:
Nëse të gjitha vlerat shkallëzohen me një konstante, varianca shkallëzohet me katrorin e asaj konstante:
Varianca e shumës së dy ndryshoreve të rastit jepet nga barazimi
Vëzhgimet e botës reale të tilla si matjet e shiut të djeshëm gjatë gjithë ditës zakonisht nuk mund të jenë grupe të plota të të gjitha vëzhgimeve të mundshme. Si e tillë, varianca e llogaritur nga bashkësia e fundme në përgjithësi nuk do të përputhet me variancën që do të ishte llogaritur nga popullata e plotë e vëzhgimeve të mundshme. Kjo do të thotë që vlerësohet mesatarja dhe varianca nga një bashkësi e kufizuar vëzhgimesh duke përdorur një ekuacion vlerësues . Vlerësuesi është një funksion i zgjedhjes së vëzhgimeve të nxjerra pa paragjykime vëzhguese nga e gjithë popullata e vëzhgimeve të mundshme. Në këtë shembull ajo zgjedhje do të ishte grupi i matjeve të reshjeve të djeshme nga matësat në gatishmëri.
Vlerësuesit më të thjeshtë për mesataren e popullsisë dhe variancën e popullsisë janë thjesht mesatarja dhe varianca e zgjedhjes/kampionit, mesatarja e zgjedhjes dhe varianca (e pakorrigjuar) e zgjedhjes- këta janë vlerësues të qëndrueshëm (ata konvergjojnë në vlerën e saktë teksa numri i zgjedhjeve rritet), por mund të të përmirësohet. Vlerësimi i variancës së popullatës duke marrë variancën e zgjedhjes është afër optimales në përgjithësi, por mund të përmirësohet në dy mënyra. Më thjeshtë, varianca e kampionit llogaritet si një mesatare e devijimeve në katror rreth mesatares (së kampionit), duke e pjesëtuar me . Megjithatë, përdorimi i vlerave të tjera përveç përmirëson vlerësuesin në mënyra të ndryshme. Katër vlera për emëruesin janë ,, , dhe : është më e thjeshta (varianca e popullsisë së kampionit), eliminon paragjykimet, minimizon gabimin mesatar në katror për shpërndarjen normale, dhe më së shumti eliminon zjvendosjet/anësinë në vlerësimin e paanshëm të devijimit standard për shpërndarjen normale.
Në shumë situata praktike, varianca e vërtetë e një popullate nuk dihet apriori dhe duhet të llogaritet sipas ndonjë mënyre. Kur kemi të bëjmë me popullata jashtëzakonisht të mëdha, nuk është e mundur të numërohet çdo objekt i popullatës, kështu që llogaritja duhet të kryhet në një zgjedhje të popullsisë. [3] Kjo zakonisht quhet variancë e zgjedhjes ose variancë empirike . Varianca e zgjedhjes mund të zbatohet gjithashtu për vlerësimin e variancës së një shpërndarjeje të vazhdueshme nga një kampion i asaj shpërndarjeje.
Marrim një kampion me zëvendësim të vlerave nga popullsia, ku , dhe vlerësojmë variancën në bazë të këtij kampioni. [4] Marrja e drejtpërdrejtë e variancës së të dhënave të mostrës jep mesataren e devijimeve në katror :
Këtu, tregon mesataren e mostrës :
Meqenëse Yi zgjidhen rastësisht, të dyja dhe janë ndryshore të rastit. Pritjet matematike të tyre mund të vlerësohen duke marrë një mesatare mbi grupin e të gjitha kampioneve të mundshme me madhësi n nga popullata. Për kjo jep:
Prandaj jep një vlerësim të variancës së popullatës që është e njëanshme/ e zhvendosur me një faktor prej . Per kete arsye, referohet si varianca e mostrës së njëanshme .
Korrigjimi për këtë anësi jep variancën e pazhvendosur të mostrës, të shënuar :
Secili vlerësues mund të referohet thjesht si varianca e kampionit kur versioni mund të përcaktohet nga konteksti.
^Wasserman, Larry (2005). All of Statistics: a concise course in statistical inference. Springer texts in statistics. fq. 51. ISBN9781441923226. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)