Shpërndarja e Studentit

Shpërndarja e Studentit
	Probability density function
	Cumulative distribution function
Parametrat	Shkallët e lirisë (real)
FDGJ
FGSH	ku 2F1 është funksioni hipergjeometrik
Vlera e pritur	0 për , ndryshe
Mediana	0
Moda	0
Varianca	për , ∞ për , përndryshe e papërcaktuar
Shtrirja	0 për , përndryshe e papërcaktuar
Kurtoza e tepërt	për , ∞ për , përndryshe e papërcaktuar

Në teorinë e probabilitetit dhe statistikë, shpërndarja t e Studentit (ose thjesht shpërndarja t ) $t_{\nu }$ është një shpërndarje e vazhdueshme probabiliteti që përgjithëson shpërndarjen normale standarde . Ashtu si kjo e fundit, ajo është simetrike rreth zeros dhe në formë këmbane.

Megjithatë, $t_{\nu }$ ka bishta më të rëndë dhe sasia e masës së probabilitetit në bishta kontrollohet nga parametri $\nu$ . Për $\nu =1$ shpërndarja e t Studentit $t_{\nu }$ bëhet shpërndarje standarde Cauchy, ndërsa për $\nu \rightarrow \infty$ bëhet shpërndarje normale standarde $N(0,1)$ .

Shpërndarja e studentit luan një rol në një numër analizash statistikore të përdorura gjerësisht, duke përfshirë testin t Student për vlerësimin e rëndësisë statistikore të ndryshesës midis dy mesatareve të mostrës, ndërtimin e intervaleve të besimit për ndryshesën midis dy mesatareve të popullsisë dhe në analiza e regresit linear.

Në formën e shkallës-vendndodhje shpërndarja t $lst(\mu ,\tau ^{2},\nu )$ ajo përgjithëson shpërndarjen normale dhe gjithashtu lind në analizën Bejesiane të të dhënave nga një familje normale si një shpërndarje e përbërë kur margjinalizohet mbi parametrin e variancës.

ku

Përkufizimi

Funksioni i dendësisë së probabilitetit

Shpërndarja t e studentit ka funksionin e dendësisë së probabilitetit (PDF) të dhënë nga

f(t)={\frac {\Gamma ({\frac {\nu +1}{2}})}{{\sqrt {\nu \pi }}\,\Gamma ({\frac {\nu }{2}})}}\left(1+{\frac {t^{2}}{\nu }}\right)^{-(\nu +1)/2},

ku $\nu$ është numri i shkallëve të lirisë dhe $\Gamma$ është funksioni gama. Kjo mund të shkruhet edhe si

f(t)={\frac {1}{{\sqrt {\nu }}\,\mathrm {B} ({\frac {1}{2}},{\frac {\nu }{2}})}}\left(1+{\frac {t^{2}}{\nu }}\right)^{-(\nu +1)/2},

ku B është funksioni Beta. Në veçanti për shkallët e lirisë me vlerë të plotë $\nu$ ne kemi:

Për $\nu >1$ çift,

{\frac {\Gamma ({\frac {\nu +1}{2}})}{{\sqrt {\nu \pi }}\,\Gamma ({\frac {\nu }{2}})}}={\frac {(\nu -1)(\nu -3)\cdots 5\cdot 3}{2{\sqrt {\nu }}(\nu -2)(\nu -4)\cdots 4\cdot 2\,}}\cdot

Për $\nu >1$ tek,

{\frac {\Gamma ({\frac {\nu +1}{2}})}{{\sqrt {\nu \pi }}\,\Gamma ({\frac {\nu }{2}})}}={\frac {(\nu -1)(\nu -3)\cdots 4\cdot 2}{\pi {\sqrt {\nu }}(\nu -2)(\nu -4)\cdots 5\cdot 3\,}}\cdot \!

Funksioni i dendësisë së probabilitetit është simetrik, dhe forma e tij e përgjithshme i ngjan formës së këmbanës me mesatare 0 dhe variancë 1, përveç se është pak më e ulët dhe më e gjerë. Ndërsa numri i shkallëve të lirisë rritet, shpërndarja t i afrohet shpërndarjes normale me mesataren 0 dhe variancën 1. Per kete arsye ${\nu }$ njihet edhe si parametri i normalitetit. ^[1]

Funksioni mbledhës i shpërndarjes

Funksioni i shpërndarjes mbledhëse (FSHM) mund të shkruhet në termat e I, funksioni beta jo i plotë i rregulluar. Për t > 0,

F(t)=\int _{-\infty }^{t}f(u)\,du=1-{\tfrac {1}{2}}I_{x(t)}\left({\tfrac {\nu }{2}},{\tfrac {1}{2}}\right),

Shpërndarja e Studentit lind në një sërë problemesh të vlerësimit statistikor ku qëllimi është të vlerësohet një parametër i panjohur, si një vlerë mesatare, në një mjedis ku të dhënat vëzhgohen me gabime mbledhëse. Nëse (si në pothuajse të gjitha punët praktike statistikore) devijimi standard i popullatës i këtyre gabimeve është i panjohur dhe duhet të vlerësohet nga të dhënat, shpërndarja t përdoret shpesh për të llogaritur pasigurinë shtesë që rezulton nga ky vlerësim. Në shumicën e problemeve të tilla, nëse dihej shmangia standarde e gabimeve, do të përdorej një shpërndarje normale në vend të shpërndarjes t .

x(t)={\frac {\nu }{t^{2}+\nu }}.

Raste të veçanta

Vlerat e caktuara të $\nu$ jepni një formë të thjeshtë për shpërndarjen së Studentit.

$\nu$	PDF	CDF	shënime
1	${\frac {1}{\pi (1+t^{2})}}$	${\frac {1}{2}}+{\frac {1}{\pi }}\arctan(t)$	Shih shpërndarjen Cauchy
2	${\frac {1}{2{\sqrt {2}}\left(1+{\frac {t^{2}}{2}}\right)^{3/2}}}$	${\frac {1}{2}}+{\frac {t}{2{\sqrt {2}}{\sqrt {1+{\frac {t^{2}}{2}}}}}}$
3	${\frac {2}{\pi {\sqrt {3}}\left(1+{\frac {t^{2}}{3}}\right)^{2}}}$	${\frac {1}{2}}+{\frac {1}{\pi }}{\left[{\frac {1}{\sqrt {3}}}{\frac {t}{1+{\frac {t^{2}}{3}}}}+\arctan \left({\frac {t}{\sqrt {3}}}\right)\right]}$
4	${\frac {3}{8\left(1+{\frac {t^{2}}{4}}\right)^{5/2}}}$	${\frac {1}{2}}+{\frac {3}{8}}{\frac {t}{\sqrt {1+{\frac {t^{2}}{4}}}}}{\left[1-{\frac {1}{12}}{\frac {t^{2}}{1+{\frac {t^{2}}{4}}}}\right]}$
5	${\frac {8}{3\pi {\sqrt {5}}\left(1+{\frac {t^{2}}{5}}\right)^{3}}}$	${\frac {1}{2}}+{\frac {1}{\pi }}{\left[{\frac {t}{{\sqrt {5}}\left(1+{\frac {t^{2}}{5}}\right)}}\left(1+{\frac {2}{3\left(1+{\frac {t^{2}}{5}}\right)}}\right)+\arctan \left({\frac {t}{\sqrt {5}}}\right)\right]}$
$\infty$	${\frac {1}{\sqrt {2\pi }}}e^{-t^{2}/2}$	${\frac {1}{2}}{\left[1+\operatorname {erf} \left({\frac {t}{\sqrt {2}}}\right)\right]}$	Shikoni Shpërndarja normale, Funksioni i gabimit

Vendndodhja-shkalla e shpërndarjes t

Shndërrimi i shkallës-vendndodhje

Shpërndarja t e studentit përgjithësohet në shpërndarjen e tre parametrave vendndodhje-shkalla t $lst(\mu ,\tau ^{2},\nu )$ duke futur një parametër vendndodhjeje $\mu$ dhe një parametër shkallë $\tau$ . Me

T\sim t_{\nu }

dhe transformimi i familjes në shkallë vendi

X=\mu +\tau T

marrim

X\sim lst(\mu ,\tau ^{2},\nu )

Raste të veçanta

Nëse $X$ ndjek një shpërndarje Studenti shkallë-vendndodhje $X\sim \mathrm {lst} \left(\mu ,\tau ^{2},\nu \right)$ pastaj për $\nu \rightarrow \infty$ $X$ shpërndahet normalisht $X\sim \mathrm {N} \left(\mu ,\tau ^{2}\right)$ me mesatare $\mu$ dhe variancë $\tau ^{2}$ .
Shpërndarja e Studentit shkallë-vendndodhje $\mathrm {lst} \left(\mu ,\tau ^{2},\nu =1\right)$ me shkallë lirie $\nu =1$ është e njëvlerëshme me shpërndarjen Cauchy $\mathrm {Cau} \left(\mu ,\tau \right)$ .
Shpërndarja t -shkallë-vendndodhje $\mathrm {lst} \left(\mu =0,\tau ^{2}=1,\nu \right)$ me $\mu =0$ dhe $\tau ^{2}=1$ reduktohet në shpërndarjen e Studentit $t_{\nu }$

Si lind shpërndarja t (karakterizimi)

Shpërndarja e mostrës së statistikës Student

Shpërndarja t lind si shpërndarja e mostrës së statistikës t . Më poshtë diskutohet statistika t në një kampion, për statistikën t korresponduese me dy mostra shihni T-testin e Studentit .

Vlerësimi i paanshëm i variancës

Le $x_{1},\ldots ,x_{n}\sim N(\mu ,\sigma ^{2})$ të jenë mostra të pavarura dhe të shpërndara identikisht nga një shpërndarje normale me mesatare $\mu$ dhe variancë $\sigma ^{2}$ . Varianca mesatare dhe e paanshme e kampionit jepen nga:

{\begin{aligned}{\bar {x}}&={\frac {x_{1}+\cdots +x_{n}}{n}},\\[5pt]s^{2}&={\frac {1}{n-1}}\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}.\end{aligned}}

Statistika t që rezulton (një mostër) jepet nga

t={\frac {{\bar {x}}-\mu }{\sqrt {s^{2}/n}}}\sim t_{n-1}.

dhe shpërndahet sipas një shpërndarjeje që ndjek ligjin e Studentit me $n-1$ shkallët e lirisë.

Vlerësimi i variancës PM

Në vend të vlerësimit të paanshëm $s^{2}$ ne gjithashtu mund të përdorim vlerësuesin e përgjasisë maksimale

s_{ML}^{2}={\frac {1}{n}}\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}

duke dhënë statistikën

t_{ML}={\frac {{\bar {x}}-\mu }{\sqrt {s_{ML}^{2}/n}}}={\sqrt {\frac {n}{n-1}}}t.

Kjo shpërndahet sipas shpërndarjes t shkallës-vendndodhje:

t_{ML}\sim lst(0,\tau ^{2}=n/(n-1),n-1).

Përdorimet

Në përfundimin statistikor frekuentist

Shpërndarja e Studentit lind në një sërë problemesh të vlerësimit statistikor ku qëllimi është të vlerësohet një parametër i panjohur, si një vlerë mesatare, në një mjedis ku të dhënat vëzhgohen me gabime mbledhëse. Nëse (si në pothuajse të gjitha punët praktike statistikore) shmangia standard i popullatës i këtyre gabimeve është i panjohur dhe duhet të vlerësohet nga të dhënat, shpërndarja t përdoret shpesh për të llogaritur pasigurinë shtesë që rezulton nga ky vlerësim. Në shumicën e problemeve të tilla, nëse do të dihej shmangia standarde e gabimeve, do të përdorej një shpërndarje normale në vend të shpërndarjes së Studentit .

Intervalet e besimit dhe testet e hipotezave janë dy procedura statistikore në të cilat kërkohen kuantiljet e shpërndarjes së mostrës së një statistike të caktuar (p.sh. rezultati standard ). Në çdo situatë ku kjo statistikë është një funksion linear i të dhënave, pjesëtuar me vlerësimin e zakonshëm të shmangies standarde, sasia që rezulton mund të rishkallëzohet dhe të përqendrohet për të ndjekur shpërndarjen e Studentit. Analizat statistikore që përfshijnë mesataret, mesataret e ponderuara dhe koeficientët e regresionit të gjitha çojnë në statistika që kanë këtë formë.

Testimi i hipotezave

Një numër statistikash mund të tregohet se kanë shpërndarje t-Studenti për mostrat me madhësi mesatare nën hipotezat zero që janë me interes, në mënyrë që shpërndarja e Studentit të formojë bazën për testet e rëndësisë. Për shembull, shpërndarja e koeficientit të korrelacionit të Spearman ρ, në rastin zero (korrelacion zero) përafrohet mirë me shpërndarjen t për madhësitë e mostrës mbi 20.

Intervalet e besimit

Supozoni se numri A është zgjedhur i tillë që

\Pr(-A<T<A)=0.9,

kur T ka një shpërndarje Studenti me n − 1 shkallë lirie. Nga simetria, kjo është njësoj si të thuash që A kënaq kushtin

\Pr(T<A)=0.95,

pra A është "përqindja 95" e kësaj shpërndarjeje probabiliteti, ose $A=t_{(0.05,n-1)}$ . Atëherë

\Pr \left(-A<{\frac {{\overline {X}}_{n}-\mu }{S_{n}/{\sqrt {n}}}}<A\right)=0.9,

dhe kjo është e njëvlerëshme me

\Pr \left({\overline {X}}_{n}-A{\frac {S_{n}}{\sqrt {n}}}<\mu <{\overline {X}}_{n}+A{\frac {S_{n}}{\sqrt {n}}}\right)=0.9.

Prandaj, intervali, pikat fundore të të cilit janë

{\overline {X}}_{n}\pm A{\frac {S_{n}}{\sqrt {n}}}

është një interval besimi 90% për μ. Prandaj, nëse gjejmë mesataren e një grupi vëzhgimesh që mund të presim në mënyrë të arsyeshme të kemi një shpërndarje normale, mund të përdorim shpërndarjen e Studentit për të shqyrtuar nëse kufijtë e besimit në atë mesatare përfshijnë disa vlera të parashikuara teorikisht - siç është vlera e parashikuar nën një hipotezë zero .

Është ky rezultat që përdoret në testet e Studentit : meqenëse ndryshesa midis mesatareve të mostrave nga dy shpërndarje normale shpërndahet normalisht, shpërndarja t-Student mund të përdoret për të ekzaminuar nëse kjo diferencë mund të supozohet në mënyrë të arsyeshme të jetë zero. .

Tabelë e vlerave të zgjedhura

Tabela e mëposhtme liston vlerat për shpërndarjet t-Student me ν shkallë lirie për një sërë zonash kritike të njëanshme ose të dyanshme. Kolona e parë është ν, përqindjet përgjatë majës janë nivele besimi dhe numrat në trupin e tabelës janë $t_{\alpha ,n-1}$ faktorët e përshkruar në seksionin mbi intervalet e besimit .

I njëanshëm	75%	80%	85%	90%	95%	97.5%	99%	99.5%	99.75%	99.9%	99.95%
I dyanshëm	50%	60%	70%	80%	90%	95%	98%	99%	99.5%	99.8%	99.9%
1	1.000	1.376	1.963	3.078	6.314	12.706	31.821	63.657	127.321	318.309	636.619
2	0.816	1.061	1.386	1.886	2.920	4.303	6.965	9.925	14.089	22.327	31.599
3	0.765	0.978	1.250	1.638	2.353	3.182	4.541	5.841	7.453	10.215	12.924
4	0.741	0.941	1.190	1.533	2.132	2.776	3.747	4.604	5.598	7.173	8.610
5	0.727	0.920	1.156	1.476	2.015	2.571	3.365	4.032	4.773	5.893	6.869
6	0.718	0.906	1.134	1.440	1.943	2.447	3.143	3.707	4.317	5.208	5.959
7	0.711	0.896	1.119	1.415	1.895	2.365	2.998	3.499	4.029	4.785	5.408
8	0.706	0.889	1.108	1.397	1.860	2.306	2.896	3.355	3.833	4.501	5.041
9	0.703	0.883	1.100	1.383	1.833	2.262	2.821	3.250	3.690	4.297	4.781
10	0.700	0.879	1.093	1.372	1.812	2.228	2.764	3.169	3.581	4.144	4.587
11	0.697	0.876	1.088	1.363	1.796	2.201	2.718	3.106	3.497	4.025	4.437
12	0.695	0.873	1.083	1.356	1.782	2.179	2.681	3.055	3.428	3.930	4.318
13	0.694	0.870	1.079	1.350	1.771	2.160	2.650	3.012	3.372	3.852	4.221
14	0.692	0.868	1.076	1.345	1.761	2.145	2.624	2.977	3.326	3.787	4.140
15	0.691	0.866	1.074	1.341	1.753	2.131	2.602	2.947	3.286	3.733	4.073
16	0.690	0.865	1.071	1.337	1.746	2.120	2.583	2.921	3.252	3.686	4.015
17	0.689	0.863	1.069	1.333	1.740	2.110	2.567	2.898	3.222	3.646	3.965
18	0.688	0.862	1.067	1.330	1.734	2.101	2.552	2.878	3.197	3.610	3.922
19	0.688	0.861	1.066	1.328	1.729	2.093	2.539	2.861	3.174	3.579	3.883
20	0.687	0.860	1.064	1.325	1.725	2.086	2.528	2.845	3.153	3.552	3.850
21	0.686	0.859	1.063	1.323	1.721	2.080	2.518	2.831	3.135	3.527	3.819
22	0.686	0.858	1.061	1.321	1.717	2.074	2.508	2.819	3.119	3.505	3.792
23	0.685	0.858	1.060	1.319	1.714	2.069	2.500	2.807	3.104	3.485	3.767
24	0.685	0.857	1.059	1.318	1.711	2.064	2.492	2.797	3.091	3.467	3.745
25	0.684	0.856	1.058	1.316	1.708	2.060	2.485	2.787	3.078	3.450	3.725
26	0.684	0.856	1.058	1.315	1.706	2.056	2.479	2.779	3.067	3.435	3.707
27	0.684	0.855	1.057	1.314	1.703	2.052	2.473	2.771	3.057	3.421	3.690
28	0.683	0.855	1.056	1.313	1.701	2.048	2.467	2.763	3.047	3.408	3.674
29	0.683	0.854	1.055	1.311	1.699	2.045	2.462	2.756	3.038	3.396	3.659
30	0.683	0.854	1.055	1.310	1.697	2.042	2.457	2.750	3.030	3.385	3.646
40	0.681	0.851	1.050	1.303	1.684	2.021	2.423	2.704	2.971	3.307	3.551
50	0.679	0.849	1.047	1.299	1.676	2.009	2.403	2.678	2.937	3.261	3.496
60	0.679	0.848	1.045	1.296	1.671	2.000	2.390	2.660	2.915	3.232	3.460
80	0.678	0.846	1.043	1.292	1.664	1.990	2.374	2.639	2.887	3.195	3.416
100	0.677	0.845	1.042	1.290	1.660	1.984	2.364	2.626	2.871	3.174	3.390
120	0.677	0.845	1.041	1.289	1.658	1.980	2.358	2.617	2.860	3.160	3.373
∞	0.674	0.842	1.036	1.282	1.645	1.960	2.326	2.576	2.807	3.090	3.291
I njëanshëm	75%	80%	85%	90%	95%	97.5%	99%	99.5%	99.75%	99.9%	99.95%
I dyanshëm	50%	60%	70%	80%	90%	95%	98%	99%	99.5%	99.8%	99.9%

Llogaritja e intervalit të besimit

Le të themi se kemi një mostër me madhësi 11, mesatare të kampionit 10 dhe variancë të mostrës 2. Për shkallën e besimit 90% me 10 gradë lirie, vlera e njëanshme t nga tabela është 1.372. Pastaj me interval besimi të llogaritur nga

{\overline {X}}_{n}\pm t_{\alpha ,\nu }{\frac {S_{n}}{\sqrt {n}}},

ne përcaktojmë se me 90% besim kemi një mesatare të vërtetë që ndodhet poshtë

10+1.372{\frac {\sqrt {2}}{\sqrt {11}}}=10.585.

Me fjalë të tjera, 90% e rasteve kur një prag i sipërm llogaritet me këtë metodë nga mostra të veçanta, ky prag i sipërm tejkalon mesataren e vërtetë.

Dhe me 90% besim ne kemi një mesatare të vërtetë që ndodhet më lart

10-1.372{\frac {\sqrt {2}}{\sqrt {11}}}=9.414.

Me fjalë të tjera, 90% e rasteve kur një prag më i ulët llogaritet me këtë metodë nga mostra të veçanta, ky prag më i ulët qëndron nën mesataren e vërtetë.

Kështu që me 80% besim (llogaritur nga 100% − 2 × (1 − 90%) = 80%), kemi një mesatare të vërtetë që shtrihet brenda intervalit

\left(10-1.372{\frac {\sqrt {2}}{\sqrt {11}}},10+1.372{\frac {\sqrt {2}}{\sqrt {11}}}\right)=(9.414,10.585).

^ Kruschke JK (2015). Doing Bayesian Data Analysis (bot. 2nd). Academic Press. ISBN 9780124058880. OCLC 959632184. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)

[1] Kruschke JK (2015). Doing Bayesian Data Analysis (bot. 2nd). Academic Press. ISBN 9780124058880. OCLC 959632184. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)

[1]