Shpërndarja e Studentit

Nga Wikipedia, enciklopedia e lirë
Shpërndarja e Studentit
Probability density function
Cumulative distribution function
Parametrat Shkallët e lirisë (real)
FDGJ
FGSH
ku 2F1 është funksioni hipergjeometrik
Vlera e pritur0 për , ndryshe
Mediana0
Moda0
Varianca për , ∞ për , përndryshe e papërcaktuar
Shtrirja0 për , përndryshe e papërcaktuar
Kurtoza e tepërt për , ∞ për , përndryshe e papërcaktuar

teorinë e probabilitetit dhe statistikë, shpërndarja t e Studentit (ose thjesht shpërndarja t ) është një shpërndarje e vazhdueshme probabiliteti që përgjithëson shpërndarjen normale standarde . Ashtu si kjo e fundit, ajo është simetrike rreth zeros dhe në formë këmbane.

Megjithatë, ka bishta më të rëndë dhe sasia e masës së probabilitetit në bishta kontrollohet nga parametri . Për shpërndarja e t Studentit bëhet shpërndarje standarde Cauchy, ndërsa për bëhet shpërndarje normale standarde .

Shpërndarja e studentit luan një rol në një numër analizash statistikore të përdorura gjerësisht, duke përfshirë testin t Student për vlerësimin e rëndësisë statistikore të ndryshesës midis dy mesatareve të mostrës, ndërtimin e intervaleve të besimit për ndryshesën midis dy mesatareve të popullsisë dhe në analiza e regresit linear.

Në formën e shkallës-vendndodhje shpërndarja t ajo përgjithëson shpërndarjen normale dhe gjithashtu lind në analizën Bejesiane të të dhënave nga një familje normale si një shpërndarje e përbërë kur margjinalizohet mbi parametrin e variancës.

ku

Përkufizimi[Redakto | Redakto nëpërmjet kodit]

Funksioni i dendësisë së probabilitetit[Redakto | Redakto nëpërmjet kodit]

Shpërndarja t e studentit ka funksionin e dendësisë së probabilitetit (PDF) të dhënë nga

ku është numri i shkallëve të lirisë dhe është funksioni gama. Kjo mund të shkruhet edhe si

ku B është funksioni Beta. Në veçanti për shkallët e lirisë me vlerë të plotë ne kemi:

Për çift,

Për tek,

Funksioni i dendësisë së probabilitetit është simetrik, dhe forma e tij e përgjithshme i ngjan formës së këmbanës me mesatare 0 dhe variancë 1, përveç se është pak më e ulët dhe më e gjerë. Ndërsa numri i shkallëve të lirisë rritet, shpërndarja t i afrohet shpërndarjes normale me mesataren 0 dhe variancën 1. Per kete arsye njihet edhe si parametri i normalitetit. [1]

 

Funksioni mbledhës i shpërndarjes[Redakto | Redakto nëpërmjet kodit]

Funksioni i shpërndarjes mbledhëse (FSHM) mund të shkruhet në termat e I, funksioni beta jo i plotë i rregulluar. Për t > 0,

Shpërndarja e Studentit lind në një sërë problemesh të vlerësimit statistikor ku qëllimi është të vlerësohet një parametër i panjohur, si një vlerë mesatare, në një mjedis ku të dhënat vëzhgohen me gabime mbledhëse. Nëse (si në pothuajse të gjitha punët praktike statistikore) devijimi standard i popullatës i këtyre gabimeve është i panjohur dhe duhet të vlerësohet nga të dhënat, shpërndarja t përdoret shpesh për të llogaritur pasigurinë shtesë që rezulton nga ky vlerësim. Në shumicën e problemeve të tilla, nëse dihej shmangia standarde e gabimeve, do të përdorej një shpërndarje normale në vend të shpërndarjes t .

Raste të veçanta[Redakto | Redakto nëpërmjet kodit]

Vlerat e caktuara të jepni një formë të thjeshtë për shpërndarjen së Studentit.

PDF CDF shënime
1 Shih shpërndarjen Cauchy
2
3
4
5
Shikoni Shpërndarja normale, Funksioni i gabimit

Vendndodhja-shkalla e shpërndarjes t[Redakto | Redakto nëpërmjet kodit]

Shndërrimi i shkallës-vendndodhje[Redakto | Redakto nëpërmjet kodit]

Shpërndarja t e studentit përgjithësohet në shpërndarjen e tre parametrave vendndodhje-shkalla t duke futur një parametër vendndodhjeje dhe një parametër shkallë . Me

dhe transformimi i familjes në shkallë vendi

marrim

Raste të veçanta[Redakto | Redakto nëpërmjet kodit]

  • Nëse ndjek një shpërndarje Studenti shkallë-vendndodhje pastaj për shpërndahet normalisht me mesatare dhe variancë .
  • Shpërndarja e Studentit shkallë-vendndodhje me shkallë lirie është e njëvlerëshme me shpërndarjen Cauchy .
  • Shpërndarja t -shkallë-vendndodhje me dhe reduktohet në shpërndarjen e Studentit

Si lind shpërndarja t (karakterizimi)[Redakto | Redakto nëpërmjet kodit]

Shpërndarja e mostrës së statistikës Student[Redakto | Redakto nëpërmjet kodit]

Shpërndarja t lind si shpërndarja e mostrës së statistikës t . Më poshtë diskutohet statistika t në një kampion, për statistikën t korresponduese me dy mostra shihni T-testin e Studentit .

Vlerësimi i paanshëm i variancës[Redakto | Redakto nëpërmjet kodit]

Le të jenë mostra të pavarura dhe të shpërndara identikisht nga një shpërndarje normale me mesatare dhe variancë . Varianca mesatare dhe e paanshme e kampionit jepen nga:

Statistika t që rezulton (një mostër) jepet nga

dhe shpërndahet sipas një shpërndarjeje që ndjek ligjin e Studentit me shkallët e lirisë.

Vlerësimi i variancës PM[Redakto | Redakto nëpërmjet kodit]

Në vend të vlerësimit të paanshëm ne gjithashtu mund të përdorim vlerësuesin e përgjasisë maksimale

duke dhënë statistikën

Kjo shpërndahet sipas shpërndarjes t shkallës-vendndodhje:

Përdorimet[Redakto | Redakto nëpërmjet kodit]

Në përfundimin statistikor frekuentist[Redakto | Redakto nëpërmjet kodit]

Shpërndarja e Studentit lind në një sërë problemesh të vlerësimit statistikor ku qëllimi është të vlerësohet një parametër i panjohur, si një vlerë mesatare, në një mjedis ku të dhënat vëzhgohen me gabime mbledhëse. Nëse (si në pothuajse të gjitha punët praktike statistikore) shmangia standard i popullatës i këtyre gabimeve është i panjohur dhe duhet të vlerësohet nga të dhënat, shpërndarja t përdoret shpesh për të llogaritur pasigurinë shtesë që rezulton nga ky vlerësim. Në shumicën e problemeve të tilla, nëse do të dihej shmangia standarde e gabimeve, do të përdorej një shpërndarje normale në vend të shpërndarjes së Studentit .

Intervalet e besimit dhe testet e hipotezave janë dy procedura statistikore në të cilat kërkohen kuantiljet e shpërndarjes së mostrës së një statistike të caktuar (p.sh. rezultati standard ). Në çdo situatë ku kjo statistikë është një funksion linear i të dhënave, pjesëtuar me vlerësimin e zakonshëm të shmangies standarde, sasia që rezulton mund të rishkallëzohet dhe të përqendrohet për të ndjekur shpërndarjen e Studentit. Analizat statistikore që përfshijnë mesataret, mesataret e ponderuara dhe koeficientët e regresionit të gjitha çojnë në statistika që kanë këtë formë.

Testimi i hipotezave[Redakto | Redakto nëpërmjet kodit]

Një numër statistikash mund të tregohet se kanë shpërndarje t-Studenti për mostrat me madhësi mesatare nën hipotezat zero që janë me interes, në mënyrë që shpërndarja e Studentit të formojë bazën për testet e rëndësisë. Për shembull, shpërndarja e koeficientit të korrelacionit të Spearman ρ, në rastin zero (korrelacion zero) përafrohet mirë me shpërndarjen t për madhësitë e mostrës mbi 20. 

Intervalet e besimit[Redakto | Redakto nëpërmjet kodit]

Supozoni se numri A është zgjedhur i tillë që

kur T ka një shpërndarje Studenti me n − 1 shkallë lirie. Nga simetria, kjo është njësoj si të thuash që A kënaq kushtin

pra A është "përqindja 95" e kësaj shpërndarjeje probabiliteti, ose . Atëherë

dhe kjo është e njëvlerëshme me

Prandaj, intervali, pikat fundore të të cilit janë

është një interval besimi 90% për μ. Prandaj, nëse gjejmë mesataren e një grupi vëzhgimesh që mund të presim në mënyrë të arsyeshme të kemi një shpërndarje normale, mund të përdorim shpërndarjen e Studentit për të shqyrtuar nëse kufijtë e besimit në atë mesatare përfshijnë disa vlera të parashikuara teorikisht - siç është vlera e parashikuar nën një hipotezë zero .

Është ky rezultat që përdoret në testet e Studentit : meqenëse ndryshesa midis mesatareve të mostrave nga dy shpërndarje normale shpërndahet normalisht, shpërndarja t-Student mund të përdoret për të ekzaminuar nëse kjo diferencë mund të supozohet në mënyrë të arsyeshme të jetë zero. .

Tabelë e vlerave të zgjedhura[Redakto | Redakto nëpërmjet kodit]

Tabela e mëposhtme liston vlerat për shpërndarjet t-Student me ν shkallë lirie për një sërë zonash kritike të njëanshme ose të dyanshme. Kolona e parë është ν, përqindjet përgjatë majës janë nivele besimi dhe numrat në trupin e tabelës janë faktorët e përshkruar në seksionin mbi intervalet e besimit .

I njëanshëm 75% 80% 85% 90% 95% 97.5% 99% 99.5% 99.75% 99.9% 99.95%
I dyanshëm 50% 60% 70% 80% 90% 95% 98% 99% 99.5% 99.8% 99.9%
1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 14.089 22.327 31.599
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.924
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.610
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869
6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707 4.317 5.208 5.959
7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355 3.833 4.501 5.041
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 3.690 4.297 4.781
10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587
11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437
12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055 3.428 3.930 4.318
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012 3.372 3.852 4.221
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.140
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073
16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921 3.252 3.686 4.015
17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898 3.222 3.646 3.965
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878 3.197 3.610 3.922
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.883
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.850
21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.135 3.527 3.819
22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.792
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807 3.104 3.485 3.767
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797 3.091 3.467 3.745
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787 3.078 3.450 3.725
26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.067 3.435 3.707
27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771 3.057 3.421 3.690
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763 3.047 3.408 3.674
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756 3.038 3.396 3.659
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750 3.030 3.385 3.646
40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3.551
50 0.679 0.849 1.047 1.299 1.676 2.009 2.403 2.678 2.937 3.261 3.496
60 0.679 0.848 1.045 1.296 1.671 2.000 2.390 2.660 2.915 3.232 3.460
80 0.678 0.846 1.043 1.292 1.664 1.990 2.374 2.639 2.887 3.195 3.416
100 0.677 0.845 1.042 1.290 1.660 1.984 2.364 2.626 2.871 3.174 3.390
120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617 2.860 3.160 3.373
0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576 2.807 3.090 3.291
I njëanshëm 75% 80% 85% 90% 95% 97.5% 99% 99.5% 99.75% 99.9% 99.95%
I dyanshëm 50% 60% 70% 80% 90% 95% 98% 99% 99.5% 99.8% 99.9%

Llogaritja e intervalit të besimit

Le të themi se kemi një mostër me madhësi 11, mesatare të kampionit 10 dhe variancë të mostrës 2. Për shkallën e besimit 90% me 10 gradë lirie, vlera e njëanshme t nga tabela është 1.372. Pastaj me interval besimi të llogaritur nga

ne përcaktojmë se me 90% besim kemi një mesatare të vërtetë që ndodhet poshtë

Me fjalë të tjera, 90% e rasteve kur një prag i sipërm llogaritet me këtë metodë nga mostra të veçanta, ky prag i sipërm tejkalon mesataren e vërtetë.

Dhe me 90% besim ne kemi një mesatare të vërtetë që ndodhet më lart

Me fjalë të tjera, 90% e rasteve kur një prag më i ulët llogaritet me këtë metodë nga mostra të veçanta, ky prag më i ulët qëndron nën mesataren e vërtetë.

Kështu që me 80% besim (llogaritur nga 100% − 2 × (1 − 90%) = 80%), kemi një mesatare të vërtetë që shtrihet brenda intervalit

  1. ^ Kruschke JK (2015). Doing Bayesian Data Analysis (bot. 2nd). Academic Press. ISBN 9780124058880. OCLC 959632184. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)