සංඛ්‍යානමය කල්පිත පරීක්ෂාව

श्रीलंका सरकार आतंकवादी हैं

සංඛ්‍යානමය කල්පිත පරීක්ෂාව, පරික්ෂා දත්ත භාවිතා කොට සංඛ්‍යානමය තීරණ ගැනීම සඳහා භාවිතා වන ක්‍රමවේදයකි. එය ඇතැම් විට ස්ථීරකාරක දත්ත විශලේෂණය (confirmatory data analysis) ලෙසද හැඳින්වේ. එහි විලෝමය ගවේෂණාත්මක දත්ත විශ්ලේෂණයයි (exploratory data analysis). සංඛ්‍යාත සම්භාවිතාවයෙහි (freqency probability), සැමවිටම පාහේ මෙම තීරණ වලට එළඹෙන්නේ අප්‍රතිෂ්ඨෙය කල්පිත පරික්ෂා(null-hypothesis tests) භාවිතයෙනි. එනම් අප්‍රතිෂ්ඨෙය කල්පිතය සත්‍යයැයි උපකල්පනය කර අසන "සත්‍ය වශයෙන් නිරීක්ෂිත අගය තරම් වත් සීමාන්තික පරික්ෂා සංඛ්යාතියේ අගය නිරීෂණය කිරීම සඳහා සම්භාවිතාව කුමක්ද?" යන ප්‍රශ්නයට(Assuming that the null hypothesis is true, what is the probability of observing a value for the test statistic that is at least as extreme as the value that was actually observed?) පිළිතුරු සපයන අප්‍රතිෂ්ඨෙය කල්පිතයි.^[1] සම්ප්‍රදායික මතය පිළිඹඳ කුකුසක් ඇති කිරීමට තරම් තොරතුරු පරීක්ෂාත්මක ප්‍රතිඵල තුල තිබේ දැයි තීරණය කල හැකි වීම කල්පිත පරීක්ෂාවන් ගේ ප්‍රයෝජනයකි

උදාහරණය

As an example, consider determining whether a suitcase contains some radioactive material. Placed under a Geiger counter, it produces 10 counts per minute. The null hypothesis is that no radioactive material is in the suitcase and that all measured counts are due to ambient radioactivity typical of the surrounding air and harmless objects. We can then calculate how likely it is that the null hypothesis produces 10 counts per minute. If the null hypothesis predicts (say) on average 9 counts per minute and a standard deviation of 1 count per minute, then we say that the suitcase is compatible with the null hypothesis. (This does not guarantee that there is no radioactive material, just that we have no reason to believe it); on the other hand, if the null hypothesis predicts 3 counts per minute and a standard deviation of 1 count per minute, then the suitcase is not compatible with the null hypothesis, and there are likely other factors responsible to produce the measurements.

The test described here is more fully the null-hypothesis statistical significance test. The null hypothesis is a conjecture made solely to be falsified by the sample. Statistical significance is a possible finding of the test – that the sample is unlikely to have occurred by chance given the truth of the null hypothesis. The name of the test describes its formulation and its possible outcome. One characteristic of the test is its crisp decision: reject or do not reject (which is not the same as accept). A calculated value is compared to a threshold, which is determined from the tolerable risk of error.

විස්තරය

නිරීක්ෂණය කල හැකි ප්‍රතිඵල මත පමණක් පදනම් ව ඇති අවිනිශ්චිත කල්පිතයක් (uncertain hypothesis) පිළිබඳ නිශ්චිත තීරණයක් ගැනිමේ ගැටළුවට යමෙකුට මුහුණ පෑ හැක. සංඛ්‍යාතීය කල්පිත පරීක්ෂාවක් (statistical hypothesis test) යනු මෙවන් කල්පිතයක් සඳහා විකල්ප (පිලිගැනීම හෝ බැහැර කිරීම) තෝරා ගැනීමේ දී සමහර අවදානම් අඩුකළ හැකි ඇල්ගොරිතමයක් වන අතර මෙය කෙටියෙන් කල්පිත පරීක්ෂාවක් (hypothesis test) ලෙස හඳුන්වනු ලැබේ.

මෙම ලිපිය මගින් බහුලව භාවිතා වන කල්පිත පරීක්ෂා කිරීමේ සංඛ්‍යානමය ක්‍රමය (Frequentist inference) විස්තර කෙරේ. බේසියානු මතවාදයට (Bayesian inference) අනුව ප්‍රමිතීය තීරණවාදයේ (normative decision theory) විශේෂ අවස්ථාවක් ලෙස (විශේෂයෙන්ම ආදර්ශ (model) තෝරා ගැනී‍මේ ගැටළුවක් ලෙස) කල්පිත පරීක්ෂණ සැලකිය හැකි අතර කල්පිතයකට පක්ෂව (හෝ ඊට එරෙහිව) සාක්ෂි රැස්කිරීම, යමක් සිදුවීමේ සම්භාවිතා සාධක(බෙස් සාධක (Bayes factors)) ඇසුරෙන් කළ හැක.

මෙවන් පරීක්ෂණයක දත්ත නීරීක්ෂණයට ප්‍රථම පහත ආකාරයට සුදානම් විය යුතුය.

කල්පිතය නිවැරදි යයි උපකල්පනය කරමින් වියහැකි නියැදි (possible samples) වල සම්භාවිතාව ගණනය කල හැකි වන පරිදි අප්‍රතිෂ්ඨෙය කල්පිතය (Null Hypothesis) ගණිතමය / සංඛ්‍යාතමය ආකාරයට ප්‍රකාශයට පත් කල යුතුය. උදාහරණයක් ලෙස :- පරීක්ෂා කරන ප්‍රතිකාර ක්‍රමය සඳහා මධ්‍යන්‍ය ප්‍රතිචාරය(mean response) ව්‍යාප්ත ප්‍රතිකාරය(placebo) සඳහා පාලන කණ්ඩායමේ (control group) මධ්‍යන්‍ය ප්‍රතිචාරයට සමවේ. කණ්ඩායම් යුගලයම මෙම නොදන්නා මධ්‍යන්‍යය සහිත ප්‍රමත ව්‍යාප්තියක් (normal distribution) පෙන්වන අතර කණ්ඩායම් දෙක සඳහාම දන්නා එකම සම්මත අපගමනයක් පවතී.
කල්පිතයට අදාල වන නියැදියේ තොරතුරු සාරාංශ කර දැක්විය හැකි, සුදුසු පරීක්ෂණ සංඛ්‍යාතියක්(test statistics) තෝරා ගත යුතුය. ඉහත උදාහරණයක් සඳහා මෙය සාම්පල දෙකෙහි මධ්‍යන්‍යයන් අතර සංඛ්‍යාත්මක වෙනස $(m1-m2)$ ලෙස ගත හැක.
පරීක්ෂණ සංඛ්‍යාතියේ ව්‍යාප්තිය(distribution) භාවිතයෙන්, ලැබිය හැකි හැකි අගයයන් සඳහා සම්භාවිතා කුලක(probability sets) ගණනය කරයි (සාමාන්‍යයෙන් ප්‍රාන්තරය( an interval) හෝ ප්‍රාන්තර වල මේලය (union of intervals). ඉහත උදාහරණය සඳහා, නියැදි විශාලත්වයන් n₁ හා n₂ වන විට සාම්පල මධ්‍යයන් අතර වෙනස, පොදු සම්මත අපගමනයේ ${\sqrt {{\frac {1}{n_{1}}}+{\frac {1}{n_{2}}}}}$ ගුණකයට සමාන සම්මත අපගමනයක් සහිත ප්‍රමත ව්‍යාප්තියක් දක්වනු ඇත.
ලැබිය හැකි අගයන් සහිත සියලුම කුලක අතරින් අප තෝරාගත යුත්තේ, කල්පිතයට එරෙහිව වඩාත් ප්‍රභලම සාක්ෂි පිළිඹිබු කරන්නේ යැයි සිතන කුලකයයි. පරීක්ෂාසංඛ්‍යාතිය අවධි පෙදෙස(critical region)ලෙස හැඳින්වෙන්නේ මෙයයි. අප්‍රතිෂ්ඨෙය කල්පිතය සත්‍ය වු කල්හි පරීක්ෂාසංඛ්‍යාතිය අවධි පෙදෙසට අයත් වීමේ සම්භාවිතාව, පරීක්ෂණයේ ඇල්ෆා අගය (නොහොත් විශාලත්වය) ලෙස හැඳින්වේ.
විලක්ප කල්පිතය(alternative hypothesis) සඳහා $\theta$ නම්, පරාමිතිය $\theta$ වු කල්හි නියැදියක් අවධි පෙදෙසට අයත් වීමේ සම්භාවිතාව, $\theta$ හිදී පරීක්ෂණයේ බලය (power of the test at $\theta$ ) නම් වේ. අවධි පෙදෙසක බල ශ්‍රිතය (power function) යනු $\theta$ සහ $\theta$ හි බලය අතර අනුරූපණය කරන ශ්‍රිතයයි(the function that maps $\theta$ to the power of $\theta$ ).

දත්ත රැස්කිරීමෙන් අනතුරුව පරීක්ෂණසංඛ්‍යාතිය ගණනය කර එය අවධි පෙදෙස අයත් වන හෝ නොවන බව තීරණය කරනු ලැබේ.

නිගමන

පරීක්ෂණසංඛ්‍යාතිය අවධි පෙදෙස තුල වේ නම් අපගේ නිගමනය පහත ඒවායින් එකකි:

අප්‍රතිෂ්ඨෙය කල්පිතය ප්‍රතික්ෂේප කිරීම. මේ නිසා අවධි පෙදෙස ප්‍රතික්ෂේප පෙදෙස(rejection region) ලෙසත් එහි අනුපුරකය පිලිගත් පෙදෙ‍ස (acceptance region) ලෙසත් ඇතැම් විට හැඳින්වේ.
ඇල්ෆාට සමාන හෝ ඇල්ෆා ට වඩා අඩු සම්භාවිතාවයක් ඇති සිද්ධියක් සිදු වී ඇත.

පරීක්ෂකයාට මෙම තාර්කික විකල්ප යුගලෙන් එකක් තෝරා ගැනීමට සිදුවේ. උදාහරණය සැලකු කල, ප්‍රතිකාරය සඳහා නිරීක්ෂිත ප්‍රතිචාරය(observed response) සංඛ්‍යාන වශයෙන් වෙසෙසි (statistically significant) යැයි අපට ප්‍රකාශ කළ හැක.

පරීක්ෂණසංඛ්‍යාතිය අවධි පෙදෙසින් පිටත නම්, අප්‍රතිෂ්ඨ කල්පිතය ප්‍රතික්ෂේප කිරීමට ප්‍රමාණවත් සාක්ෂි නොමැති බව පමණක් නිගමනය කළ හැක. මෙය අප්‍රතිෂ්ඨ කල්පිතය පිළිගතහැකි සාක්ෂි තිබෙන අවස්ථාවට සමාන නොවේ. එනම් අප්‍රතිෂ්ඨ කල්පිතයක් වෙනුවෙන් සාක්ෂි ලැබීම හා එයට විරුද්ධව සාක්ෂි නොලැබීම එකිනෙකින් පරිභාහිර සිද්ධීන් වේ. එනම් කල්පිතයට විරුද්ධ සාක්ෂි නොලැබීම එය සඳහා සාක්ෂියක් කරගත නොහැක. කල්පිතයක් සදහා සාක්ෂි මෙම තර්ක මත ලබාගත නොහැකිය. මෙම ක්‍රමය මත පදනම්ව සංඛ්‍යාත ක්‍රම යොදා ගන්නා පරීක්ෂණ ප්‍රගමනය වන අතර එහිදී සත්‍ය සොයාගැනීම් වෙනුවට වැරදි / සාවද්‍ය කරුණු ඉවත් කිරීම තුලින් ප්‍රගමනය සිදුවේ.

වාග්මාලාව ^[2]

Inferential Statistics – අනුමිතික සංඛ්‍යානය
Hypothesis – උපකල්පනය
Hypothesis Testing – කල්පිත පරීක්ෂාව
Confidence Intervals – විශ්‍රම්භ ප්‍රාන්තර
Null Hypothesis (H0) - අප්‍රතිෂ්ඨෙය කල්පිතය
Alternative Hypothesis (H1) – වෛකල්පික කල්පිතය
Type I Error – පළමු ප්‍රරූප දෝෂය
Type II Error – දෙවන ප්‍රරූප දෝෂය
Level of Significance – වෙසෙසි මට්ටම
Critical Value – අවධි අගය
p-Value – p-අගය
Test Statistic – පරීක්ෂාසංඛ්‍යාතිය
One Tail Test – තනිවලග පරීක්ෂාව
Two Tail Test – ද්විවලග පරීක්ෂාව
Non Rejection Region – පිළිගැනුම් පෙදෙස

ආශ්‍රිත

^ The Sage Dictionary of Statistics, pg. 76, Duncan Cramer, Dennis Howitt, 2004, ISBN 076194138X
^ https://www.youtube.com/watch?v=MrPsdYusdBQ

[Sage-1] The Sage Dictionary of Statistics, pg. 76, Duncan Cramer, Dennis Howitt, 2004, ISBN 076194138X

[:1-2] ttps://www.youtube.com/watch?v=MrPsdYusdBQ

[1]

[2]