Shpërndarja e Studentit
Probability density function | |||
Cumulative distribution function | |||
Parametrat | Shkallët e lirisë (real) | ||
---|---|---|---|
FDGJ | |||
FGSH | ku 2F1 është funksioni hipergjeometrik | ||
Vlera e pritur | 0 për , ndryshe | ||
Mediana | 0 | ||
Moda | 0 | ||
Varianca | për , ∞ për , përndryshe e papërcaktuar | ||
Shtrirja | 0 për , përndryshe e papërcaktuar | ||
Kurtoza e tepërt | për , ∞ për , përndryshe e papërcaktuar |
Në teorinë e probabilitetit dhe statistikë, shpërndarja t e Studentit (ose thjesht shpërndarja t ) është një shpërndarje e vazhdueshme probabiliteti që përgjithëson shpërndarjen normale standarde . Ashtu si kjo e fundit, ajo është simetrike rreth zeros dhe në formë këmbane.
Megjithatë, ka bishta më të rëndë dhe sasia e masës së probabilitetit në bishta kontrollohet nga parametri . Për shpërndarja e t Studentit bëhet shpërndarje standarde Cauchy, ndërsa për bëhet shpërndarje normale standarde .
Shpërndarja e studentit luan një rol në një numër analizash statistikore të përdorura gjerësisht, duke përfshirë testin t Student për vlerësimin e rëndësisë statistikore të ndryshesës midis dy mesatareve të mostrës, ndërtimin e intervaleve të besimit për ndryshesën midis dy mesatareve të popullsisë dhe në analiza e regresit linear.
Në formën e shkallës-vendndodhje shpërndarja t ajo përgjithëson shpërndarjen normale dhe gjithashtu lind në analizën Bejesiane të të dhënave nga një familje normale si një shpërndarje e përbërë kur margjinalizohet mbi parametrin e variancës.
ku
Përkufizimi
[Redakto | Redakto nëpërmjet kodit]Funksioni i dendësisë së probabilitetit
[Redakto | Redakto nëpërmjet kodit]Shpërndarja t e studentit ka funksionin e dendësisë së probabilitetit (PDF) të dhënë nga
ku është numri i shkallëve të lirisë dhe është funksioni gama. Kjo mund të shkruhet edhe si
ku B është funksioni Beta. Në veçanti për shkallët e lirisë me vlerë të plotë ne kemi:
Për çift,
Për tek,
Funksioni i dendësisë së probabilitetit është simetrik, dhe forma e tij e përgjithshme i ngjan formës së këmbanës me mesatare 0 dhe variancë 1, përveç se është pak më e ulët dhe më e gjerë. Ndërsa numri i shkallëve të lirisë rritet, shpërndarja t i afrohet shpërndarjes normale me mesataren 0 dhe variancën 1. Per kete arsye njihet edhe si parametri i normalitetit. [1]
Funksioni mbledhës i shpërndarjes
[Redakto | Redakto nëpërmjet kodit]Funksioni i shpërndarjes mbledhëse (FSHM) mund të shkruhet në termat e I, funksioni beta jo i plotë i rregulluar. Për t > 0,
Shpërndarja e Studentit lind në një sërë problemesh të vlerësimit statistikor ku qëllimi është të vlerësohet një parametër i panjohur, si një vlerë mesatare, në një mjedis ku të dhënat vëzhgohen me gabime mbledhëse. Nëse (si në pothuajse të gjitha punët praktike statistikore) devijimi standard i popullatës i këtyre gabimeve është i panjohur dhe duhet të vlerësohet nga të dhënat, shpërndarja t përdoret shpesh për të llogaritur pasigurinë shtesë që rezulton nga ky vlerësim. Në shumicën e problemeve të tilla, nëse dihej shmangia standarde e gabimeve, do të përdorej një shpërndarje normale në vend të shpërndarjes t .
Raste të veçanta
[Redakto | Redakto nëpërmjet kodit]Vlerat e caktuara të jepni një formë të thjeshtë për shpërndarjen së Studentit.
CDF | shënime | ||
---|---|---|---|
1 | Shih shpërndarjen Cauchy | ||
2 | |||
3 | |||
4 | |||
5 | |||
Shikoni Shpërndarja normale, Funksioni i gabimit |
Vendndodhja-shkalla e shpërndarjes t
[Redakto | Redakto nëpërmjet kodit]Shndërrimi i shkallës-vendndodhje
[Redakto | Redakto nëpërmjet kodit]Shpërndarja t e studentit përgjithësohet në shpërndarjen e tre parametrave vendndodhje-shkalla t duke futur një parametër vendndodhjeje dhe një parametër shkallë . Me
dhe transformimi i familjes në shkallë vendi
marrim
Raste të veçanta
[Redakto | Redakto nëpërmjet kodit]- Nëse ndjek një shpërndarje Studenti shkallë-vendndodhje pastaj për shpërndahet normalisht me mesatare dhe variancë .
- Shpërndarja e Studentit shkallë-vendndodhje me shkallë lirie është e njëvlerëshme me shpërndarjen Cauchy .
- Shpërndarja t -shkallë-vendndodhje me dhe reduktohet në shpërndarjen e Studentit
Si lind shpërndarja t (karakterizimi)
[Redakto | Redakto nëpërmjet kodit]Shpërndarja e mostrës së statistikës Student
[Redakto | Redakto nëpërmjet kodit]Shpërndarja t lind si shpërndarja e mostrës së statistikës t . Më poshtë diskutohet statistika t në një kampion, për statistikën t korresponduese me dy mostra shihni T-testin e Studentit .
Vlerësimi i paanshëm i variancës
[Redakto | Redakto nëpërmjet kodit]Le të jenë mostra të pavarura dhe të shpërndara identikisht nga një shpërndarje normale me mesatare dhe variancë . Varianca mesatare dhe e paanshme e kampionit jepen nga:
Statistika t që rezulton (një mostër) jepet nga
dhe shpërndahet sipas një shpërndarjeje që ndjek ligjin e Studentit me shkallët e lirisë.
Vlerësimi i variancës PM
[Redakto | Redakto nëpërmjet kodit]Në vend të vlerësimit të paanshëm ne gjithashtu mund të përdorim vlerësuesin e përgjasisë maksimale
duke dhënë statistikën
Kjo shpërndahet sipas shpërndarjes t shkallës-vendndodhje:
Përdorimet
[Redakto | Redakto nëpërmjet kodit]Në përfundimin statistikor frekuentist
[Redakto | Redakto nëpërmjet kodit]Shpërndarja e Studentit lind në një sërë problemesh të vlerësimit statistikor ku qëllimi është të vlerësohet një parametër i panjohur, si një vlerë mesatare, në një mjedis ku të dhënat vëzhgohen me gabime mbledhëse. Nëse (si në pothuajse të gjitha punët praktike statistikore) shmangia standard i popullatës i këtyre gabimeve është i panjohur dhe duhet të vlerësohet nga të dhënat, shpërndarja t përdoret shpesh për të llogaritur pasigurinë shtesë që rezulton nga ky vlerësim. Në shumicën e problemeve të tilla, nëse do të dihej shmangia standarde e gabimeve, do të përdorej një shpërndarje normale në vend të shpërndarjes së Studentit .
Intervalet e besimit dhe testet e hipotezave janë dy procedura statistikore në të cilat kërkohen kuantiljet e shpërndarjes së mostrës së një statistike të caktuar (p.sh. rezultati standard ). Në çdo situatë ku kjo statistikë është një funksion linear i të dhënave, pjesëtuar me vlerësimin e zakonshëm të shmangies standarde, sasia që rezulton mund të rishkallëzohet dhe të përqendrohet për të ndjekur shpërndarjen e Studentit. Analizat statistikore që përfshijnë mesataret, mesataret e ponderuara dhe koeficientët e regresionit të gjitha çojnë në statistika që kanë këtë formë.
Testimi i hipotezave
[Redakto | Redakto nëpërmjet kodit]Një numër statistikash mund të tregohet se kanë shpërndarje t-Studenti për mostrat me madhësi mesatare nën hipotezat zero që janë me interes, në mënyrë që shpërndarja e Studentit të formojë bazën për testet e rëndësisë. Për shembull, shpërndarja e koeficientit të korrelacionit të Spearman ρ, në rastin zero (korrelacion zero) përafrohet mirë me shpërndarjen t për madhësitë e mostrës mbi 20.
Intervalet e besimit
[Redakto | Redakto nëpërmjet kodit]Supozoni se numri A është zgjedhur i tillë që
kur T ka një shpërndarje Studenti me n − 1 shkallë lirie. Nga simetria, kjo është njësoj si të thuash që A kënaq kushtin
pra A është "përqindja 95" e kësaj shpërndarjeje probabiliteti, ose . Atëherë
dhe kjo është e njëvlerëshme me
Prandaj, intervali, pikat fundore të të cilit janë
është një interval besimi 90% për μ. Prandaj, nëse gjejmë mesataren e një grupi vëzhgimesh që mund të presim në mënyrë të arsyeshme të kemi një shpërndarje normale, mund të përdorim shpërndarjen e Studentit për të shqyrtuar nëse kufijtë e besimit në atë mesatare përfshijnë disa vlera të parashikuara teorikisht - siç është vlera e parashikuar nën një hipotezë zero .
Është ky rezultat që përdoret në testet e Studentit : meqenëse ndryshesa midis mesatareve të mostrave nga dy shpërndarje normale shpërndahet normalisht, shpërndarja t-Student mund të përdoret për të ekzaminuar nëse kjo diferencë mund të supozohet në mënyrë të arsyeshme të jetë zero. .
Tabelë e vlerave të zgjedhura
[Redakto | Redakto nëpërmjet kodit]Tabela e mëposhtme liston vlerat për shpërndarjet t-Student me ν shkallë lirie për një sërë zonash kritike të njëanshme ose të dyanshme. Kolona e parë është ν, përqindjet përgjatë majës janë nivele besimi dhe numrat në trupin e tabelës janë faktorët e përshkruar në seksionin mbi intervalet e besimit .
I njëanshëm | 75% | 80% | 85% | 90% | 95% | 97.5% | 99% | 99.5% | 99.75% | 99.9% | 99.95% |
---|---|---|---|---|---|---|---|---|---|---|---|
I dyanshëm | 50% | 60% | 70% | 80% | 90% | 95% | 98% | 99% | 99.5% | 99.8% | 99.9% |
1 | 1.000 | 1.376 | 1.963 | 3.078 | 6.314 | 12.706 | 31.821 | 63.657 | 127.321 | 318.309 | 636.619 |
2 | 0.816 | 1.061 | 1.386 | 1.886 | 2.920 | 4.303 | 6.965 | 9.925 | 14.089 | 22.327 | 31.599 |
3 | 0.765 | 0.978 | 1.250 | 1.638 | 2.353 | 3.182 | 4.541 | 5.841 | 7.453 | 10.215 | 12.924 |
4 | 0.741 | 0.941 | 1.190 | 1.533 | 2.132 | 2.776 | 3.747 | 4.604 | 5.598 | 7.173 | 8.610 |
5 | 0.727 | 0.920 | 1.156 | 1.476 | 2.015 | 2.571 | 3.365 | 4.032 | 4.773 | 5.893 | 6.869 |
6 | 0.718 | 0.906 | 1.134 | 1.440 | 1.943 | 2.447 | 3.143 | 3.707 | 4.317 | 5.208 | 5.959 |
7 | 0.711 | 0.896 | 1.119 | 1.415 | 1.895 | 2.365 | 2.998 | 3.499 | 4.029 | 4.785 | 5.408 |
8 | 0.706 | 0.889 | 1.108 | 1.397 | 1.860 | 2.306 | 2.896 | 3.355 | 3.833 | 4.501 | 5.041 |
9 | 0.703 | 0.883 | 1.100 | 1.383 | 1.833 | 2.262 | 2.821 | 3.250 | 3.690 | 4.297 | 4.781 |
10 | 0.700 | 0.879 | 1.093 | 1.372 | 1.812 | 2.228 | 2.764 | 3.169 | 3.581 | 4.144 | 4.587 |
11 | 0.697 | 0.876 | 1.088 | 1.363 | 1.796 | 2.201 | 2.718 | 3.106 | 3.497 | 4.025 | 4.437 |
12 | 0.695 | 0.873 | 1.083 | 1.356 | 1.782 | 2.179 | 2.681 | 3.055 | 3.428 | 3.930 | 4.318 |
13 | 0.694 | 0.870 | 1.079 | 1.350 | 1.771 | 2.160 | 2.650 | 3.012 | 3.372 | 3.852 | 4.221 |
14 | 0.692 | 0.868 | 1.076 | 1.345 | 1.761 | 2.145 | 2.624 | 2.977 | 3.326 | 3.787 | 4.140 |
15 | 0.691 | 0.866 | 1.074 | 1.341 | 1.753 | 2.131 | 2.602 | 2.947 | 3.286 | 3.733 | 4.073 |
16 | 0.690 | 0.865 | 1.071 | 1.337 | 1.746 | 2.120 | 2.583 | 2.921 | 3.252 | 3.686 | 4.015 |
17 | 0.689 | 0.863 | 1.069 | 1.333 | 1.740 | 2.110 | 2.567 | 2.898 | 3.222 | 3.646 | 3.965 |
18 | 0.688 | 0.862 | 1.067 | 1.330 | 1.734 | 2.101 | 2.552 | 2.878 | 3.197 | 3.610 | 3.922 |
19 | 0.688 | 0.861 | 1.066 | 1.328 | 1.729 | 2.093 | 2.539 | 2.861 | 3.174 | 3.579 | 3.883 |
20 | 0.687 | 0.860 | 1.064 | 1.325 | 1.725 | 2.086 | 2.528 | 2.845 | 3.153 | 3.552 | 3.850 |
21 | 0.686 | 0.859 | 1.063 | 1.323 | 1.721 | 2.080 | 2.518 | 2.831 | 3.135 | 3.527 | 3.819 |
22 | 0.686 | 0.858 | 1.061 | 1.321 | 1.717 | 2.074 | 2.508 | 2.819 | 3.119 | 3.505 | 3.792 |
23 | 0.685 | 0.858 | 1.060 | 1.319 | 1.714 | 2.069 | 2.500 | 2.807 | 3.104 | 3.485 | 3.767 |
24 | 0.685 | 0.857 | 1.059 | 1.318 | 1.711 | 2.064 | 2.492 | 2.797 | 3.091 | 3.467 | 3.745 |
25 | 0.684 | 0.856 | 1.058 | 1.316 | 1.708 | 2.060 | 2.485 | 2.787 | 3.078 | 3.450 | 3.725 |
26 | 0.684 | 0.856 | 1.058 | 1.315 | 1.706 | 2.056 | 2.479 | 2.779 | 3.067 | 3.435 | 3.707 |
27 | 0.684 | 0.855 | 1.057 | 1.314 | 1.703 | 2.052 | 2.473 | 2.771 | 3.057 | 3.421 | 3.690 |
28 | 0.683 | 0.855 | 1.056 | 1.313 | 1.701 | 2.048 | 2.467 | 2.763 | 3.047 | 3.408 | 3.674 |
29 | 0.683 | 0.854 | 1.055 | 1.311 | 1.699 | 2.045 | 2.462 | 2.756 | 3.038 | 3.396 | 3.659 |
30 | 0.683 | 0.854 | 1.055 | 1.310 | 1.697 | 2.042 | 2.457 | 2.750 | 3.030 | 3.385 | 3.646 |
40 | 0.681 | 0.851 | 1.050 | 1.303 | 1.684 | 2.021 | 2.423 | 2.704 | 2.971 | 3.307 | 3.551 |
50 | 0.679 | 0.849 | 1.047 | 1.299 | 1.676 | 2.009 | 2.403 | 2.678 | 2.937 | 3.261 | 3.496 |
60 | 0.679 | 0.848 | 1.045 | 1.296 | 1.671 | 2.000 | 2.390 | 2.660 | 2.915 | 3.232 | 3.460 |
80 | 0.678 | 0.846 | 1.043 | 1.292 | 1.664 | 1.990 | 2.374 | 2.639 | 2.887 | 3.195 | 3.416 |
100 | 0.677 | 0.845 | 1.042 | 1.290 | 1.660 | 1.984 | 2.364 | 2.626 | 2.871 | 3.174 | 3.390 |
120 | 0.677 | 0.845 | 1.041 | 1.289 | 1.658 | 1.980 | 2.358 | 2.617 | 2.860 | 3.160 | 3.373 |
∞ | 0.674 | 0.842 | 1.036 | 1.282 | 1.645 | 1.960 | 2.326 | 2.576 | 2.807 | 3.090 | 3.291 |
I njëanshëm | 75% | 80% | 85% | 90% | 95% | 97.5% | 99% | 99.5% | 99.75% | 99.9% | 99.95% |
I dyanshëm | 50% | 60% | 70% | 80% | 90% | 95% | 98% | 99% | 99.5% | 99.8% | 99.9% |
Llogaritja e intervalit të besimit
Le të themi se kemi një mostër me madhësi 11, mesatare të kampionit 10 dhe variancë të mostrës 2. Për shkallën e besimit 90% me 10 gradë lirie, vlera e njëanshme t nga tabela është 1.372. Pastaj me interval besimi të llogaritur nga
ne përcaktojmë se me 90% besim kemi një mesatare të vërtetë që ndodhet poshtë
Me fjalë të tjera, 90% e rasteve kur një prag i sipërm llogaritet me këtë metodë nga mostra të veçanta, ky prag i sipërm tejkalon mesataren e vërtetë.
Dhe me 90% besim ne kemi një mesatare të vërtetë që ndodhet më lart
Me fjalë të tjera, 90% e rasteve kur një prag më i ulët llogaritet me këtë metodë nga mostra të veçanta, ky prag më i ulët qëndron nën mesataren e vërtetë.
Kështu që me 80% besim (llogaritur nga 100% − 2 × (1 − 90%) = 80%), kemi një mesatare të vërtetë që shtrihet brenda intervalit
- ^ Kruschke JK (2015). Doing Bayesian Data Analysis (bot. 2nd). Academic Press. ISBN 9780124058880. OCLC 959632184.
{{cite book}}
: Mungon ose është bosh parametri|language=
(Ndihmë!)