අරුණි ශපීරෝ‍ වෙතින්

පරීක්ෂණාත්මක සැලසුම් නිර්මාණය සහ වටහා ගැනීමේ අවදානම් පෙන්වන සංඥා

Posted in Uncategorized by arunishapiro on දෙසැම්බර් 9, 2020

මෙම සටහන මවිසින් 2013 මාර්තු 25 වැනිදා ලංකාවේ ඉන්ටෙනෙට් මඟින් පවත්වාගෙන ගිය සිංහල අධ්‍යාපන අඩවියක් සඳහා පරිවර්තනය කරන ලද්දකි. එම අඩවිය දැන් මට සොයාගත නොහැකි බැවින් මෙතැනට ගෙනාවෙමි.

විද්‍යාත්මක ක්‍රමයෙන් ඉෂ්ට කරන කාර්යා භාරය හඳුනා ගන්නට ක්‍රමවත් අධ්‍යාපනයක් ලබාගන්නට නොහැකි අයට, ඒ සම්බන්ධයෙන් ජීවිතයට අවශ්‍ය තොරතුරු සපයන්නට අවශ්‍ය මාධ්‍යවේදීන් ඔවුන්ගේ වගකීම් පැහැර හරිද්දී ජනතාවගේ සුවසෙත සඳහා අනෙක් අයට ඉදිරියට එන්නට සිද්ධ වේ.

Peter Norvig පරිගණක විද්‍යාඥයෙකි. ගූගල් කොම්පැණියේ හිටපු පර්යේෂණ අධ්‍යක්ෂකවරයාය. මේ ඔහු තවත් කිහිප දෙනෙකුගේ සහායෙන් සකස් කරන ලද ලිපියේ සිංහල අනුවාදයයි. අධ්‍යයන කටයුතුවල දී ව්‍යාපෘති කිරීම බහුලව සිද්ධ වෙන කාලයක ඒ සඳහා දත්ත/තොරතුරු එකතු කරද්දී වැදගත් කරුණු ගැන අවධානය යොමු කරන්නේ කෙසේදැයි මේ සටහන පෙන්වයි. එසේම විද්‍යාත්මක සහ විද්‍යාත්මක යැයි කියැවෙන ලිපි කියවද්දී දත්ත/තොරතුරු ගැන සඳහන් කරන ආකාරය නිරීක්ෂණයට ද මෙයින් යම් දැනුමක් ලැබේ.

යම් පරීක්ෂණාත්මක අධ්‍යයනයක් මෙසේ කියද්දී, “X පිරියම ලබා දුන් කණ්ඩයාම සැලකිය යුතු ලෙසින් අඩු රෝග මට්ටමක් දිස් කළේය (p=1%)”, බොහෝ දෙනෙක් එය වටහා ගන්නේ මේ හා සමාන අර්ථයකින් කියුවා සේ ය, එනම්, “X පිරියම කළොත් මට ලැබෙන රෝගය වැළඳීම වළක්වන ප්‍රස්ථාව 99% කි.” මේ රචනාව පැහැදිලි කරන්නේ මේ වාක්‍යය එක හා සමාන වෙන්නේ නැත්තේ මන්ද කියාය. එවැනි පර්යේෂණයක දී, පහත සියල්ල සිදුවිය හැකියි:

* X යනු එය කියා පාන අන්දමේ ඵලදායීත්වය අත්කර දෙන පිරියමකි.
* X යනු සමහර අයට පමණක් ඵලදායී වන, මම මේ පර්යේෂණයට හඳුනාගත නොහැකි ලෙසින් වෙනස් වූ අයෙක් නිසා මට එසේ ඵලදායී නොවන්නකි.
* X යනු ඵලදායී නැත, එය සසම්භාවී ප්‍රස්ථාවක් (random chance) නිසා ඵලදායී ලෙසින් පෙනී ගියා වූවක් පමණි.
* X යනු ඵලදායී නැත, එසේම පරීක්ෂකයන් ද/හෝ පර්යේෂණයේ ප්‍රතිඵල කියැවූ අය එහි ප්‍රතිඵල වැරදියට වටහා ගෙන එය ඵලදායී යැයි කියන ලදි.

මෙයින් කුමන භාව්‍යතාවය (possibility) සත්‍යය දැයි දැනගන්නට කිසිදු ක්‍රමයක් නැත. එහෙත් යම් පරීක්ෂණයක විශ්වාසනීයත්වය (credibility) දියාරු කරන අවදානම් දක්වන සංඥා ඇත. මෙහි පළමු කොටසේ දී අපි පරීක්ෂණාත්මක සැලසුම් නිර්මාණයක දී එයින් තොරතුරු ලබාගත නොහැකි බවක් ඇති කරන අවදානම් සංඥා සලකා බලමු. දෙවැනි කොටසේ දී පරීක්ෂණයක් වටහා ගැනීමේ දී ඇති අවදානම් සංඥා දිහා බලා ඒවායෙන් ප්‍රතිඵල කියවන අයට එයින් ලැබිය යුතු පමණට වඩා විශ්වාසනීය තත්වයක් දෙන හැටි ගැන සලකමු. මේවායෙන් එක අවදානම් සංඥාවක පැවතීම පමණක් නිසා අධ්‍යයනයක් අවලංගු නොවේ. සත්‍යය හා පිළිගත හැකි බැවින් යුතු අධ්‍යයන බොහොමයක් සසම්භාවී නොවන ලෙසින් සකස් වී තිබීම උදාහරණයක් ලෙස දැක්විය හැකියි. එහෙත් අවදානම් සංඥා වැඩි වැඩියෙන් දකින්නට හැකි නම් එවිට ඔබ වැඩි වැඩියෙන් සංශයවාදී (skeptical) විය යුතුය.

පළමු කොටස: පරීක්ෂණාත්මක සැලසුම් නිර්මාණයේ සාමාන්‍ය අවදානම් සංඥා

අවදානම් සංඥා D1: සසම්භාවී ලෙසින් පාලිත නැහැසුමක් (controlled trial) නොමැති වීම

වෛද්‍ය පිරියමක් අගැයුම් කිරීමක දී වඩාත්ම විශ්වාස කළ හැකි බව ලබා දෙන්නේ සසම්භාවි ලෙසින් පාලිත නැහැසුමකි. ඊට භාජනය වෙන ජනගහණය සසම්භාවී ලෙසින් බෙදා ඇත්තේ පිරියම ලබන පරීක්ෂණ කණ්ඩායමකට ද, පිරියම ලබන්නේ නැති පාලිත කණ්ඩයාමකට ද වේ.

පාලිත තත්වයන් වැදගත් ඔබට සාධාරණ සැසඳීමක් අවශ්‍ය නිසාය. අසාමාන්‍ය ලෙස නිරෝගී වූවෙක් පරීක්ෂමාන්‍යයෙක් (experimental subject) ලෙසින් තෝරා ගෙන පිරියම ලබා දෙන්නේ ද, එවිට ඔබට අසාමාන්‍ය ලෙසින් ධනාත්මක වූ ප්‍රතිඵල ලැබෙනු ඇත. එහෙත් එයින් ඔබට පිරියම ගැන වැඩිපුර දැයක් දැනගන්නට නොහැකියි. පාලිත කළ යුතු සියළු විචල්‍යයන් ගැන ඔබ සිතා බැලිය යුතුයි: උෂ්ණත්වය, පීඩනය, පරීක්ෂමාන්‍යයාගේ වයස, රෝග ඉතිහාසය යනාදිය දැනගෙන පරීක්ෂමාන්‍යයා සහ ඔබේ පාලිත ඒ විචල්‍යයන් අනුව තුලනයක් කළ යුතුයි. ඔබ හිතන්නට පුළුවනි ඔබට සමහර අවස්ථා වල දී, සාමාන්‍ය ජනගහණයේ දී, x% ක් D නම් රෝගයට ගොදුරු විය හැකි අයයි කියා, ඔවුන් සාමාන්‍යයෙන් y දින ගණනේ දී සුවය ලබනවා යැයි දන්නා නිසා යනාදී ඵෛතිහාසික අගැයුම් පාවිච්චියට ගත හැකියි කියා. එහෙත් එවැනි ඵෛතිහාසික දත්ත පාවිච්චිය අවදානමෙන් පිරි වූවකි. මන්ද ඔබේ පරීක්ෂකමාන්‍යයන් පිරිස හෝ ඔබේ පරීක්ෂණයන්හි කොන්දේසි තත්වයන් ඒ ඵෛතිහාසික තත්වයන් වෙතින් වෙනස් වෙන්නේ කෙසේදැයි කියා ඔබ නොදන්නා නිසාය. ඉතින් ඒ නිසා සත්‍ය පාලිත කණ්ඩායමක් හා පරික්ෂණ කණ්ඩායමක් යොදා ගැනීම වඩා ආරක්ෂිතය. නැතලී ඇන්ගියර් (Natalie Angier) උපුටන පරිදි ජාන විද්‍යාඥ ජෙරල්ඩ් ෆින්ක් (Gerald Fink) කියා ඇත්තේ මෙසේය: “විද්‍යාඥයෙක් ලෙස වූ මගේ ජීවිතයේ දී, මම වැඩියෙන්ම සිත් කරදර කරගන්නා කාරණය නම්, මොනවා ද නිසි පාලිතයන්? යන්නයි. පර්යේෂණ ලිපියක් ප්‍රකාශණයට යැව්වාම, සැකයෙන් පිරිලා ඉන්නෙ: මම ඒක කළා ද? මම නිසි පාලිතයන් භාවිතා කළා ද? කියායි.”

කොහොම ද පාලිත හා පර්යේෂණ කණ්ඩායම් අතර නිසි සමබරතාවයක් පවත්වා ගන්නේ? එක හොඳ ක්‍රමයක් තමයි සසම්භාවී ලෙසින් පරීක්ෂමාන්‍යයන් යොදා ගැනීම. සසම්භාවී ලෙසින් එක කණ්ඩායමකට හෝ අනෙක් කණ්ඩායමට ඔවුන්ව බෙදා එය කරන්නට හැකියි. පර්යේෂකයා විසින් පරීක්ෂමාන්‍යයන් මුණ ගැසීමෙන් පසුව එය කළ නොයුතුයි. මන්ද දැනුවත්ව හෝ නොදැනුවත්වම වඩා නිරෝගී අයව එක කණ්ඩායමකට දාන්නට පෙළඹෙන්නට ඉඩ තියෙන නිසා.

සමහර අවස්ථා වල දී, ඔබට පුලුවන් සියළුම පරීක්ෂමාන්‍යයන් කණ්ඩායම් දෙකටම ඇතුල් කරන්න. ප්‍රතිචාර කාලය මැන බලන මනෝවිද්‍යා පර්යේෂණ වල දී ඔබට පුලුවන් සසම්භාවී ලෙසින් හැම පරීක්ෂමාන්‍යයෙක්ටම හැම පරීක්ෂණ කොන්දේසියක්ම අත්දකින්නට සලස්වන්න. මොකද එක නැහැසුමක් හා තවෙකක් අතර වැඩි බලපෑමක් නැති නිසා. පැහැදිලිවම එක අවස්ථාවක් පමණක් තෝරාගන්න සිද්ධ වෙන, හෘද සැත්කමක් වැන්නක දී හැම පරීක්ෂමාන්‍යයෙක් ලවා ම එය අත්දකින්න සලස්වන්න බැහැ තමයි.

ඔව් පැහැදිලිව ම තියෙනවා සසම්භාවී පාලිත නැහැසුම් පාවිච්චි කළ නොහැකි අවස්ථාවන්. ආචාර ධාර්මිකව බැහැ දුම් බීමේ ආදීනව හොයන්න යැයි කියා පාලිත කණ්ඩායමක් ලවා දුම් පානය කරවන්න. ඒ වගේ අවස්ථා වල දී ඔබට සිද්ධ වෙනවා සසම්භාවී-නොවන අධ්‍යයනයක් පවත්වන්නට. ඒ වගේ අවස්ථා සඳහා විවිධ සංඛ්‍යාතීය විධි ක්‍රම තියෙනවා. ඒත් ඔබ දකිනවා නම් යම් ප්‍රකාශිත අධ්‍යයනයක්, සසම්භාවී පාලිත නැහැසුමක් පාවිච්චි කළ හැකි වූවක් එසේ නොකරන ලද අවස්ථාවක්, අන්න ඒ අවස්ථාවේ දී ඔබට ලබා දෙන්නේ යම් වැරැද්දක් ඇතැයි කියා පාන අවදානම් සංඥාවක්.

අවදානම් සංඥා D2: ද්විත්ව-අන්ධ අධ්‍යයන නොමැතියාව

අන්ධ අධ්‍යයනයක් (blind study) යනු එහි සාමාජිකයන් තමන් ඉන්නේ කුමන වර්ගීකරණයන් වල දැයි නොදන්නා වූවකි. ද්විත්ව-අන්ධ අධ්‍යයනයක් යනු එය පර්යේෂකයන් ද නොදන්නා වූවකි. ඇයි මෙය වැදගත්? අපි ප්ලේසිබෝ ඵලය නොහොත් රෝගීන්ට ප්‍රතිකාරයක් ලැබුනා යැයි දැනීම නිසා සුවය වැඩිවෙන ආකාරය දැක ඇත්තෙමු. එනම් ඔවුන්ගේ සුවයට ඔවුන්ගේ අපෙක්ෂාව සාධකයක් විය. අපි කරන්නේ යම් පිරියමක ප්‍රතිඵල අධ්‍යයනය කිරීම මිසෙක රෝගීන්ගේ අපේක්ෂාව අධ්‍යයනය නොකරන බව පහදා ගැනීම සඳහා අපි සියළු රෝගීන්ට එකම අපේක්ෂාව ලබාදිය යුතුයි. ඉතින් අපි පිරියමට පාත්‍ර වන රෝගීන්ට කියනවා “මේ පෙත්ත ගන්න, එය පර්යේෂණ ඖෂධ X වෙන්නත් පුලුවනි, නැත්නම් එය සීනි පෙත්තක් වෙන්නත් පුලුවනි,” කියා. එහි දී පර්යේෂකයා ද නොදන්නේ නම්, ඔවුනට ද පරීක්ෂකමාන්‍යයෙක් ඉන්නේ මොන අධ්‍යයන කොටසේ දැයි වැරදීමකින් හෝ කියන අවස්ථාව නැති වී යයි. එවිට එක කොටසක් අනෙක් කොටසට වඩා වෙනස් ලෙසකින් සැලකිල්ලට පාත්‍ර වීම හෝ ලැබෙන ප්‍රතිඵල වෙනස් ලෙසකින් විමර්ශනයට පාත්‍ර වීම ද වැළකේ.

අවදානම් සංඥා D3: පරීක්ෂකමාන්‍යයන් අවශ්‍ය පමණට වඩා අඩු වීම

සසම්භාවී ලෙසින් හොඳින් සකස් කරන ලද පාලිත නැහැසුමක දී විධිමත් පක්ෂපාතීත්වයන් ඉවත් වෙයි. එහෙත් එය අහඹු ප්‍රභේදනයන්ට විවෘතය. යම් අහඹු ලෙසකින් සියළු නිරෝගී පරීක්ෂකමාන්‍යයන් විභාගයට ලක්වන කොටසකටත් සියළු රෝගී පරීක්ෂකමාන්‍යයන් පාලිත කොටසක් වැටෙන්නට ඉඩ ඇත. එයින් වැදගත්කමක් නැති පිරියමක් ඉතා හොඳ වූවක් ලෙසින් පෙනී යා හැකියි. මේ ඉඩකඩ සම්පූර්ණයෙන් ඉවත් කළ නොහැකි නිසා, සංඛ්‍යානඥයන් විසින් එවැනි අවස්ථාවක ඇති වීම මැන බලන්නට විදියක් හදති. “මේ පිරියම කාර්යක්ෂම වෙන්නේ p=1% සංඛ්‍යාන වැදගත්කම අනුව” යැයි කියද්දී එයින් අදහස් වෙන්නේ පිරියමට ලක් වූ කොටස හා පාලිත කොටස අතර වෙනත් කිසිම වෙනසක් නැති කල, මෙවැනි ප්‍රතිඵල (පිරියමට ලක් වූ පිරිසට වාසි පිණිස වූ) 1% කාලයක් දකින්නට අපේක්ෂා කළ හැකි බවයි. ඒ අහඹු ලෙසින් පරීක්ෂකමාන්‍යයන් එක කොටසකට හෝ අනෙක් කොටසට ඇතුලත් කරන ලද නිසයි. මෙහි ඉඩකඩ ඉහළ යන්නේ ඒ මිනුම් වලට සාපේක්ෂකව ගන්නා පරීක්ෂකමාන්‍යයන් අවශ්‍ය පමණට වඩා අඩු වූ විටයි.

මනෝවිද්‍යාඥ සෙත් රොබරට්ස් (Seth Roberts), තමන්ව පර්යේෂණයන්ට ලක් කළ අයෙක් N=1 පරීක්ෂකමාන්‍යයා (තමන්) ලෙසින් සුප්‍රසිද්ධ වූ, පෙන්වා දෙන්නේ වැඩියෙන් පරීක්ෂකමාන්‍යයන් සිටීම නිසා ද වැරදි සිද්ධ විය හැකි බවයි. කුඩා පර්යේෂණ වලින් වැඩියෙන් හොඳ අදහස් ගෙන ඒවා පසුව සහතික කරගන්නවා වෙනුවෙට දැවැන්ත පර්යේෂණයකින් කාලය නාස්ති වේ යැයි ඔහු පෙන්වා දෙයි. මෙය ගැටළුවක් පැන නැඟිය හැකි බවට ඔහු පෙන්වීම වැදගත් වූවකි. බොහෝ විද්‍යාඥයන් තම එදිනෙදා විද්‍යාත්මක ජීවිතයේ දී, එක්කෝ වැඩිපුර සලකා බලන හෝ එක්කෝ පමණට වඩා අඩුවෙන් සලකා බලන පරීක්ෂකමාන්‍යයන් නිසා වැරදි සිද්ධ කරති. මෙම සටහනේ අනෙකුත් කරුණු ද එවැනි ය. සමහර විට විද්‍යාඥයන් පමණට වඩා ප්‍රවේසම් වෙනවා ඇති සහසම්බන්ධනයෙන් (correlation) හේතුඵල සම්බන්ධයට (causation) යන්නට. එහෙත් ප්‍රකාශිත අධ්‍යයනයක් අගයන්නට කියවන්නාට ලැබෙද්දී, අපි කරන්නේ විද්‍යාඥයා අදහස් ගෙනෙන්නට උත්සාහ කළ කාර්යයට වඩා වෙනස් වූවකි. මෙහි දී අපිට දකින්නට ලැබෙන්නේ පරීක්ෂකමාන්‍යයන් පමණට වඩා අඩුවෙන් නම් එය අවදානම් සංඥාවකි.

අවදානම් සංඥා D4: වැරදි පරීක්ෂකමාන්‍යයන්

1936 දී සාහිත්‍ය සංග්‍රහය (Literary Digest) සඟරාව මිලියන 10 ක් ජනතාව වෙතින් චන්ද විමසුමකින් ජනාධිපතිවරණය 57% ක ජනප්‍රිය චන්දයෙන් ඇල්ෆ් ලැන්ඩන් (Alf Landon) විසින් දිනාගනු ඇතැයි අනාවැකි පළ කළේය. මිලියන 10 ක් වෙතින් ලැබුණු ප්‍රතිචාර නිසා ඔවුන් කිසිම ලෙසකින් “පමණට වඩා අඩු පරීක්ෂකමාන්‍යයන්” දෝෂය නොකළහ. එහෙත් කිසිවෙකුට ජනාධිපති ලැන්ඩන් මතක නැත. ඔහු 32 වෙනි ජනාධිපති වූ ෆ්‍රෑන්ක්ලින් ඩෙලානෝ රූසවෙල්ට්ට ප්‍රාන්ත 48 න් 46 ක් පරාජය විය. සඟරාවට වැරදුනේ කොතැන ද? ඔවුන්ගේ පරීක්ෂකමාන්‍යයන් ඔවුනට ලැබුනේ මූලාශ තුනකින්: ඔවුන්ගේ සඟරාව කියවන අය, වාහන ලියාපදිංචි ලැයිස්තු වලින්, දුරකතන හිමිවූවන්. එහෙත් දරුණු ආර්ථික අවපාතයෙන් රට ගොඩ එද්දී 1936 දී සාහිත්‍ය සඟරාවක්, වාහන හෝ දුරකතන මිල දී ගන්නට හැකියාව තිබුනේ සුළු පිරිසකට ය. ඒවා මිල දී ගන්නට නොහැකි වූ අය වැඩියෙන් රූස්වෙල්ට්ට චන්දය දෙන්නට කැමති වූ අය වූහ. අද වැනි දුරකතන හිමිකම් ලොව බහුතරයක් සතු යුගයක දී වුවත්, සත්‍ය චන්දදායක නියෝජනයක් ලබා ගැනීම අසීරුය. දහවල් කාලයේ දී නිවාසයක අංකයකට කතා කරන්නේ නම් ලැබෙන්නේ රැකියාවල් නොකරන අයයි. සෙල් ෆෝන් වලට ජනමත විමසුම් සඳහා කතා කරන්නට අවසර නොමැති නිසා, බොහෝ තරුණ පිරිසක් මඟ හැරී යයි. චන්ද විමසන අය මේ තත්වය සමබර කරන්නට විධි සොයාගත්ත ද, ඒ සාම්පල් සම්පූර්ණයෙන් අපක්ෂපාතී වූවක් නොවෙයි.

තවත් උදාහරණයක් හැටියට, මනෝවිද්‍යා පර්යේෂණ බොහොමයක් පැවත්වෙන්නේ ස්වේච්ඡාවෙන් සහභාගී වෙන විශ්ව විද්‍යාල ශිෂ්‍ය සමූහය අතරයි. පර්යේෂකයෙක් එයින් ලැබෙන ප්‍රතිඵලයක් සියළු ජනතාව අතර සත්‍යය යැයි කියද්දී, පසුව දැනගන්නේ එම ප්‍රතිඵලය සත්‍යය (a) වයස 20 අය අතර (b) කැම්පස් අධ්‍යාපනය ලබන තරම් දැනුම සතු අය අතර (c) නැත්නම් ස්වෙච්ඡාවෙන් ඉදිරිපත් වෙන්නට කැමති වූවන් අය අතර බවයි.

අවදානම් සංඥා D5: වැරදි ප්‍රශ්නය

පරෙස්සමෙන් හදන අධ්‍යයනයක් වුවත් වැරදි දැයක් මැනීම කරනු ඇත. X පිරියම ආතතිය අඩු කරන්නට සමත් වේ යැයි දක්වන අධ්‍යයනයක් කරන්නට හදා ඇතැයි ඔබ විශ්වාස කරනු ඇත. එහෙත් එය සත්‍ය ලෝකයේ ආතති තත්වයන් නොව විද්‍යාගාරයේ කෘතීම ලෙසින් සකස් කරන ලද ආතති තත්වයන් මඟ හරවා ගන්නට සමත් වූවක් පමණක් යැයි ඔබට පසුව වැටහෙනු ඇත. නැත්නම් ඔබ විවිධ වගා භූමි කොටස් සඳහා විවිධ පොහොර යොදා ගනිමින් කරන ලද්දක දී, භූමි කොටස් #4 කාර්යක්ෂම යැයි දැක්කාට, එහි දී සත්‍යයෙන් සිද්ධ වී ඇත්තේ සුළං හා වතුර කාන්දු වීමෙන් භූමි කොටස් #3 පොහොර වඩා කාර්යක්ෂම වූව යැයි සොයා ගනු ඇත.

සමහර පර්යේෂකයන් වංචා සහගත ලෙසින් ඔවුන් අපේක්ෂා කරන පිළිතුර ලබාගන්නට ප්‍රශ්න අසති. 1987 දී ජෝන් කැනෙල් (John Cannell) විසින් ඇමෙරිකාවේ ප්‍රාන්ත 50 ක පාසැල් ළමුන් සාමාන්‍ය මට්ටමට වඩා ඉහළින් ඉන්නේ යැයි පාසැල් අධ්‍යයනයකින් පෙන්වීය. ඔහු එම අධ්‍යයනය හැඳින්වූයේ ‘දොම්නස්දුරලන (woebegone) වැවේ ප්‍රතිඵලය’ කියාය. එය ඉටු කළේ කෙසේ ද? යම් පාසැල් දිස්ත්‍රික්කයක් විභාග සඳහා ශිෂ්‍යයන් ඉදිරිපත් කිරිමේ දී, ඔවුන් සංසන්දනය කර බලනු පිණිස පිරිසකගේ ලකුණු වලට ද අයිතිය මිල දී ගනියි. එහි දී පෙනී ගියේ විභාග පවත්වන වෙළෙඳ ආයතන තරඟ කර ඇත්තේ ශිෂ්‍ය පිරිසට වඩා අඩු ලකුණු වලින් වූ සංසන්දන පිරිසක් පෙන්වීම සඳහා කියායි.

අවදානම් සංඥා D6: වැරදි සංඛ්‍යාන

පර්යේෂකයෙක් හැටියට ඔබ මුලින්ම කල යුත්තේ ඔබ එකතු කරගත් දත්ත දිහා පරීක්ෂාකාරීව බැලීමයි. දත්ත ලකුණුකරණයයි. මධ්‍යයනයන් හා මධ්‍යනයෙන් අපගමනය ගණනය කිරීමයි. බාහිරව ඇති දත්ත තියෙනවා ද? එසේ නම් මිනුම් සත්‍යය ද? දත්ත එකතු කිරීමේ දී හෝ වාර්තා කිරීමේ දී වැරදි සිදු වී ඇත් ද? දත්ත සාමාන්‍ය ලෙසින් බෙදාහැර තිබෙනවා ද? එසේ නැත්නම් සාමාන්‍ය ලෙසින් ඇතැයි අභ්‍යුපගමනය කරන දත්ත විභාගයක් මත ඔබ රැඳී ඉන්නවා ද? දත්ත රේඛීය (linear) ද? එසේ නැත්නම් රේඛීය ප්‍රතිපායනයක් මෙහෙයවන්න එපා. දත්ත ලක්ෂ්‍යයන් (Data points) ස්වාධීන ද? උදාහරණයක් වශයෙන්, සියයක් පරීක්ෂකමාන්‍යයන් වෙතින් ඔබ සියයක් මිනුම් ගත්තා ද? නැත්නම් මිනුම් 10 ක් බැගින්, එකක් එක දවසකට බැගින්, දහයක් පරීක්ෂකමාන්‍යයන් වෙතින් ගත්තා ද? ඔවුන් ස්වාධීන නැත්නම් එය හඳුනාගන්න විභාගයක් පැවැත්විය යුතුයි.

අවදානම් සංඥා D7: උපන්‍යාසයක් නැතිකම, හෝ පමණට වැඩි උද්‍යේගයකින් සංගෘහිත දත්ත ආශ්‍රයෙන් නව දත්ත නිෂ්පාදනය (data mining)

විවිධ මොබයිල් ටෙලිෆෝන් කුළුණු හතක් අසල පිලිකා පොකුරු කේන්ද්‍රීය වීම නිසා, මොබයිල් ෆෝන් විකිරණ විහිදුවීමෙන් පිළිකා හටගැනීමේ අවදානම ගැන ලන්ඩනයේ ඉරිදා ටයිම්ස් (Sunday Times) හි මෑතක දී පළවුන ලිපියකින් වාර්තා විය. කෙසේ වුවද, එංගලන්තයේ මොබයිල් ෆෝන් කුළුණු 47,000 ක් ඇත. ඒ ලිපියේ සිරස්තලය “ෆෝන් කුළුණු අසල පිළිකා පොකුරු” නම් විය. ඒත් එහි අඩංගු වූ සියළු කරුණු සලකද්දී, එම සිරස්තලය, “සෙල් ෆෝන් කුළුණු වලින් පිළිකා පොකුරු 99.985% කින් වළක්වනු ලබයි,” යැයි ලියුවා නම් වැඩියෙන් හොඳයි. එම පිළිකා පොකුරු හත ගැන සැලකිල්ලක් දැක්වීම සැබැවින්ම යුක්ති සහගත කාරණයකි. නමුත් සෙල් ෆෝන් එයට හේතු වෙනවා යැයි නිගමනය කරන්නට පෙර, අපිට තව දත්ත අවශ්‍ය වෙයි: අනෙකුත් කුළුණු 47,000 න් කොතරම් ප්‍රමාණයක් අසල පිළිකා පොකුරු දකින්නට ලැබෙනවාද? ඒ සංඛ්‍යාව අපි අහඹු ලෙසින් බලාපොරොත්තු වෙන සංඛ්‍යාව සමඟ සංසන්දනය වෙන්නේ කෙසේද?

මිනිසා රටාවන් හඳුනා ගැනීමට ඉතා දක්ෂයෙකි, ඒත් ඔහු සසම්භාවිත්වය (randomness) හඳුනාගැනීමට බොහෝ වශයෙන් අපොහොසත් වෙන්නෙකි. පිළිකාව වැනි සසම්භාවි සිද්ධීන් සමජනනීය (homogeneously) ලෙසින් පැතිර යෑමක් අපි බලාපොරොත්තු වෙමු. ඒත් සැබෑ සසම්භාවි සිද්ධීන් ඇතිවෙන්නේ සසම්භාවි පොකුරු තුලින් මිසෙක සමජනනීයත්වයෙන් නොවේ. සසම්භාවි සහ සසම්භාවි නොවන පොකරු අතර වෙනස හඳුනාගන්නට අපිට ප්‍රවේශමින් හැදූ සංඛ්‍යානමය දත්ත අවශ්‍යයයි. එයාකාරයෙන්ම, අපි සෑම subject වෙනුවෙන්ම විවිධ විචල්‍ය 40 ක් බැගින් එකතු කළොත්, වැදගත් නොවන ප්‍රතිඵල පෙන්වන මිනුම් නොසලකා හැර, වැදගත් වෙන ඒවා පමණක් වාර්තා කිරීම එහි දී දෝෂ සගහත වෙයි. විවිධ විචල්‍ය 40 න් ඔබ අපේක්ෂා කරනුයේ 2 කට p=5% වන වැදගත් ඵලයන් ඇතැයි කියායි. එවැනි විචල්‍ය 2 ක් පෙන්වන වාර්තාවක් නිෂ්ඵල වූවකි: එය සසම්භාවී අහඹුවකින් වෙනස්කර හඳුනාගත නොහැකියි.

නියාමාකාර පර්යේෂණයක් එය සඳහා සාක්ෂි එකතු කරන්නට පෙර උපන්‍යාසය කුමක්දැයි සඳහන් කර අනතුරුව එම උපන්‍යාසය විභාගයට ලක් කරයි. හත්වැනි පංතියේ විද්‍යා උළෙල සඳහා කළ ඔබේ පර්යේෂණය මතකද: ඔබ මුලින්ම ඔබේ උපන්‍යාසය ඉදිරිපත් කළේය (“වීටීස් කනවාට වැඩියෙන් ලකී චාම්ස් කෑම නිසා හැම්ස්ටර් සත්තු මහත් වෙනු ඇත”). ඉතින් ඊට පසුව ඔබ පර්යේෂණය පැවැත්වූයේ මේ උපන්‍යාසය තහවුරු හෝ නිශ්ප්‍රභා කරන්නටයි. සියල්ල සිදු වූවාට පසු දත්ත වලට හරියන්නට උපන්‍යාසයක් හැදීමට ඔබට නොහැකියි. ෆුට්බෝල් කණ්ඩායමක් ලකුණු දිනා ගනිද්දී සිද්ධ වෙන්නක් සමඟ මෙය සංසන්දයක් කරමු, ක්‍රීඩකයෙන් පිට්ටනියෙන් පිටතට පා තබා තිබුණෙන් ඔවුන් දිනාගන්නා ලද ලකුණ කණ්ඩායමට අහිමි වී යයි. එහි දී අපි අවසන් ලකුණු බාගයක් යැයි ගණන් කරන්නේ නැත; අපි එය බිංදුව යැයි ගණන් කරමු, නැත්නම් එය රීති උල්ලංඝණය කරන නිසයි. එසේ සිද්ධ වීම කණ්ඩායමේ දැඩි තරඟකාරීත්වය පෙන්වන සාක්ෂියක් හැටියට කණ්ඩායමේ රසිකයන්ට සලකන්නට නිදහස ඇත. ඒ නිසා සැකයක් නැතිව ඔවුන් ආයෙත් ලකුණු දිනා ගනීවි යැයි පෙන්වන්නටද හැකියාව ලැබේ. එසේම එය අහම්බෙන් ලැබිච්ච වාසියක් යැයි සහ එසේ වූයේ ක්‍රීඩකයා පිට්ටනියෙන් පිටට ගිය නිසා යැයි ද කියමින් ඒ නිසා ආයෙත් ලකුණු දිනාගන්නේ ඔවුන් යැයි කියා විරුද්ධ කණ්ඩායමේ රසිකයන්ට කියන්නත් පුළුවනි. ඉතින් මේ මත දෙකේ ඇති වෙනස තීන්දු වෙන්නේ තරඟයේ ඉතිරි හරිය ක්‍රීඩා කිරීමෙන් කවුරුන්ද සැබැවින්ම ලකුණු දිනාගන්නේ කියා පෙන්වීමෙන්. එයාකාරයෙන්ම, විචල්‍යයක නිරීක්ෂණය වූ සංඛ්‍යානමය වශයෙන් වැදගත් ප්‍රතිඵලයක්, එහි ප්‍රාරම්භ උපන්‍යාසයේ කොටස් නොවෙද්දී, එය බිංදුවක් හැටියට සැලකේ. එය භාවිතා කිරීම යනු විද්‍යාවේ රීති කැඩීමයි. විචල්‍ය ඇත්තෙන්ම වැදගත් යැයි සහාය දක්වන්නන්ට තර්ක කරන්න පුළුවන්. ඒත් ඒ අය තරඟය අවසන් කරන්න ඕන. එය ඔප්පු කිරීම සඳහා මේ අවස්ථාවේ දී කරන්න ඕන තවත් පර්යේෂණයක් පැවැත්වීමෙන්.

පර්යේෂණ වල දී දකින අනපේක්ෂිත සහ තෘප්තජනක සොයා ගැනීම් සැලකීමෙන් බැහැර කිරීම ඇත්තෙන්ම සාධාරණ ද? “වෛද්‍ය සංඛ්‍යාන ශාස්ත්‍රඥයෙක් යන නිර්වචනය ලැබෙන්නේ, trial සැලසුමේ දී ඉන්දියාව හොයද්දි කොළම්බස් ඇමෙරිකාව හොයාගන්න ලැබුණා කියල පිළිගන්නේ නැති අයෙකුට,” යැයි ස්ටීවන් සෙන් (Stephen Senn) නැමති සංඛ්‍යාන ශාස්ත්‍රඥයා වරක් පැමිණි කළේය. ඔහු දක්වන කාරණාවක් ඇත. ඔබ කැමති ලෙසකින් ඔබේ විනිශ්චය කරන්නට ඔබට නිදහස තිබිය යුතු යැයි මම සිතමි: පර්යේෂණයක් සඳහා වූ ප්‍රාරම්භ protocol හි කොටසක් නොවූ ප්‍රතිඵලයක් විශ්වාස කරන්නට ඔබට හොඳ හේතුවක් තියේ යැයි සිතනවා නම්, එය විශ්වාස කරන්න. ඒත් එය කිසිදු reasonable සැකයක් නැතිව ඔප්පු කළා යැයි සලකන්න එපා. එසේම ඔබ ස්වාධීන අධ්‍යයන කර එය තහවුරු කරන තෙක් අනිත් අය එය විශ්වාස කළ යුතු යැයි උදක්ම ඉල්ලා සිටින්නටත් එපා.

සෙල් ෆෝන් කුළුණු අසල පිළිකා පොකුරු වැනි, දත්ත වල රටා දකින්නට මිනිස්සු මෙතරම් පෙළඹෙන්නේ ඇයි කියා සලකා බැලීම සිත් ගන්නා සුලුයි. මිනිසා සහ අනෙකුත් ක්ෂීරපායී සත්තු රටාවලට සංවේදීත්වයක් දක්වති. ඒවා පවතිද්දී ඒවා ඉක්මණින් හඳුනා ගනිති. සමහර විට රටා නොමැති තැනද රටා දකිති. අනෙක් අතට සසම්භාවිත්වය හඳුනා ගැනීම මිනිසාට අසීරු වූවකි. පහත ඇති ප්‍රස්තාර (plot) 3 සලකා බලන්න. එහි එකක ඇති නිල් තිත් සමස්ත චතුරශ්‍රය පුරාම සමාන සම්භාවිතාවකින් සාම්පල් කර ඇත. එය කුමන එකද?

බොහෝ අය කියන්නේ “වඩාත්ම සසම්භාවි” වනුයේ දකුණේ ඇති ප්‍රස්තාරය කියායි. සංඛ්‍යාන ගැන යම් දැනුමක් ඇති අය එය සසම්භාවි වැඩි යැයි සැක කරනු ඇත. ඒ නිසා මැද ප්‍රස්තාරය තෝරාගනු ඇත. ඒත් සැබැවින්ම එක චතුරශ්‍රයක ලක්ෂ 250 තිබෙන සමානුගාමී සසම්භාවි සාම්පලය වමේ තිබෙන්නයි. මැද ප්‍රස්තාරයේ කොටු රටාව (grid) සැහැල්ලු ඉරි වලින් පෙන්වන පරිදි චතුරශ්‍ර 25 ක බෙදා, ලක්ෂ දහය බැගින් (සසම්භාවි සමානුගාමී බෙදාහැරීම) ඒ චතුරශ්‍ර 25 අතර තබා ඇත. දකුණත ඇති ප්‍රස්තාරයද එසේම හදා ඇති වුවත් එය හැදෙන්නේ (ඉරි වලින් නොපෙන්වන) කුඩා චතුරශ්‍ර 64 කිනි, ඒ හැම එකක් තුලම ලක්ෂ 4 ක් බැගින් සසම්භාවි ලෙස තබා ඇත. වමේ ඇති ප්‍රස්තාරයට මිනිස්සු අකමැති වෙන්නේ එහි ලක්ෂ පොකුරු කිහිපයක් ඇති බැවින් සසම්භාවි නොවන ලෙසින් පෙනී යාම නිසයි. නමුත් ඇත්තෙන්ම, අව්‍යාජ සසම්භාවිත්වය හැදෙන්නේ පොකුරු සහ පොකුරු-නොවන මිශ්‍රණයෙනි. සසම්භාවිත්වය යන්න සමජනනීය යන්නෙන් වෙනස්.

මෙන්න තවත් උදාහරණයක්: වමේ සිට දකුණට උඩ සිට පහළට යන ක්‍රමය අනුව එයට කළින් ඇති ටික් සලකුණට ස්වාධීනව සෑම ටික් සලකුණක්ම උත්පාදනය කරන ලද්දේ මේ චතුරශ්‍ර හතරෙන් කුමන එකේද?

මම 10 දෙනෙකුගෙන් ඇසුවෙමි; 2 ක් කීවේ A, 6 ක් කීවේ B, 2 ක් කීවේ C, සහ කිසිවෙක් D යැයි නොකීය. හැමෝම එකඟ වූයේ D වල පමණට වැඩියෙන් දිගට දුවන තිරස් හෝ හරස් සලකුණු ඇතැයි කියායි. අනෙකුත් ඒවා ගැන ඔවුන් අතර විසංවාදයක් තිබිණ, ඒත් බහුතරය කිව්වේ B නිවැරදි බවක් දක්වනවා කියායි: අනවශ්‍ය තරම් දිගට දුවන්නේ නැත, සහ එතරම් අඩු නැත කියායි. ඇත්තෙන්ම, නිවැරදි උත්තරය C වෙයි; C තුල සෑම ටික් ලකුණක්ම එයට පෙර ඇති ටික් ලකුණ හා 1/2 සම්භාවිතාවකින් සමානයි. A තුළ ලකුණු එක පැත්තකින් අනෙක් පැත්තට 3/4 වතාවක් හැරෙයි. B තුළ එය 2/3 වතාවක් ද, D තුළ එය 1/4 වතාවක් ද සිද්ධ වෙයි. බොහෝ දුරට මගේ subjects C අකමැති වූයේ එක දිගට දුවන ටික් ලකුණු පේලි 6 ක් 7 ක් තිබීම නිසායි. ඒත් ටික් 7 ක ලකුණු ඇතිවිය හැකි සම්භාවිතාව 1/64 කි, ටික් ලකුණු 300 ක් පවතින සාම්පලයක, ඉතින් එ්වා 4 ක් 5 ක් දැකීම ඔබ අපේක්ෂා කළ යුතුයි. නමුත් එය ඇති වූ විට, මිනිස්සු එය දකින්නේ රටාවක් හැටියට මිසෙක සසම්භාවිත්වයක් හැටියට නොවේ.

අවදානම් සංඥා D8: න්‍යායක් නොමැතියාව

එක්සත් ජනපදයේ ජාතික විකිරණවේදී ආරක්ෂණ මණ්ඩලය, පිළිකා සම්බන්ධව මොබයිල් ෆෝන් භාවිතය ආරක්ෂිත යැයි කියා තිබුණි. “ජාන ද්‍රව්‍යයන්ට ඍජුවම හානි කරත හැකි තරම් ප්‍රමාණවත් ජවයක් රේඩියෝ තරංග වලට නැත, ඒ නිසා ඒවාට පිළිකා ඇති කරන්නට නොහැකියි.” රේඩියෝ තරංග පිළිකා ඇති කරත හැකි ගැන ඔවුනට න්‍යායක් ඇත. (මේ න්‍යාය (සාපේක්ෂකතාව නොවේ) තමයි අයන්ස්ටයින්ට නෝබෙල් තෑග්ගේ ජයග්‍රහණය අත් කර දුන්නේ), ඉතින් අයන්ස්ටයින් සෙල් ෆෝන් නිසා පිළිකා ඇතිවෙන්නේ නැතැයි ඔප්පු කරන ලදැයි කියැවෙනව.) ඉතින් මේ න්‍යාය නිවැරදි තාක් කල්, පිළිකා පොකුරු සහ සෙල් ෆෝන් කුළුණු ගැන සංඛ්‍යානමය correlations ඵලක් නැත. (ඔව් සැබැවින්ම, සංඛ්‍යානමය ප්‍රතිඵල නිසා මණ්ඩලයට හෝ වෙනත් අයට න්‍යාය නැවත අගැයුම් කර බලන්නට හේතු ගෙනෙත හැකියි.) න්‍යයායක් තිබීම යනු විශේෂිත උපන්‍යාසයක් තිබීමේ එක කොටසකි. ඇත්තෙන්ම අඩුම වශයෙන් සැකිල්ලක් හැටියෙන් හෝ න්‍යායක් නැත්නම් නියමාකාර පර්යේෂණයක් කරන්නට කොහෙත්ම නොහැකියි. එසේ නොහැකි මන්ද? X පර්යේෂණය D රෝගය සඳහා ඵලදායක ද යන උපන්‍යාසය විභාග කරන්නට පර්යේෂණයකට නොහැකිද? ඒත් මම නොදනිමි? සැබැවින්ම, “X විසින් D රෝගය අනෙකුත් ප්‍රතිකාර ආකාරයෙන්ම වළක්වනු ලබයි,” යන්න යෝජනා කිරීමට හොඳින් පුළුවනි. එය සැලකෙන්නේ න්‍යායක කොටසක් හැටියටයි. අපි හිතමු ඔබ X ප්‍රතිකාරය ගැන trial එකක් කර කිසිදු ඵලයක් සොයා ගත්තේ නැතැයි කියා. ඒත් විවේචකයෙක් කියයි, “එසේ වූයේ ඔබ පර්යේෂණය බ්‍රහස්පතින්දා කරපු නිසා, X වැඩ කරන්නෑ බ්‍රහස්පතින්දා දවස්වල දී.” නැත්නම් “X වැඩ කරන්නේ දම්පාට සපත්තු දැමූ subjects අතර පමණයි එසේම ඔවුන්ගේ මැද නමේ ප්‍රාණාක්ෂර ඉරට්ටේ සංඛ්‍යාවක් ඇත්නම් පමණි.” විවේචකයාට ප්‍රතිකාරය වැඩ කරන හැටි ගැන සහ ඒ නිසා පාලනය කළ යුතු විචල්‍යයන් ගැන වෙනත් න්‍යායක් ඇත. යම් කිසි න්‍යායක් නැතිව, ඔබට ‘කිසිදු’ පර්යේෂණයක් කළ නොහැකියි.

පාලන නොමැතියාව

හරි, අපි දන්නවා සසම්භාවි නැහැසුම් (controlled trial) තමයි හොඳම කියල. ඒත් අපි පාලනය කළ යුත්තේ හරියටම කුමක්ද? ඒක තමයි දුෂ්කරම ප්‍රශ්නය. එයට උත්තර ලැබෙන්නෙ අත්දැකීම් වලින්. කාර්ගෝ කල්ට් විද්‍යාව ගැන රිචඩ් ෆෙයින්මන් (Richard Feynman) 1974 දී පැවැත්වූ මේ උපාධි ප්‍රදානෝත්සව දේශනය සලකන්න:

මීයන් විවිධාකාර වූ වටාරම් (mazes) වල දුවවන ලද පර්යේෂණ බොහොමයක් තියෙනව, එසේ කෙරෙන .. පැහැදිලි ප්‍රතිඵල එතරම් නැති. ඒත් 1937 දී යන්ග් (Young) කියල මිනිසෙක් ඉතා අපූරු එකක් කළා. එයාට තිබුණ මීයන් ඇතුලට එන එක පැත්තක පමණක් සේරම දොරවල් තියෙන දිග කොරිඩෝවක්, සහ ආහාර තිබුණ පැත්තේ අනෙක් දොරවල් තියන. කොතැනක සිට හෝ ඔවුන්ව නිදහස් කළාම තුන්වැනි දොරෙන් ඇතුලට මීයන් යවන්න පුහුණු කරවන්න පුළුවන්ද කියල සොයා බලන්න උවමනාවක් ඔහුට තිබුණ. නැහැ. මීයන් වහාම ගියෙ කළින් ආහාර තිබ්බ දොර වෙතටයි. ප්‍රශ්නය වුනේ, මීයන් එය කළින් දොරම කියල දැන සිටියෙ කොහොමද කියන එක? මොකද කොරිඩෝව හරි ලස්සනට සහ සමජනනීය ලෙසින් හදලා තිබුණේ. පැහැදිලිවම පෙනෙන පරිදි ඒ දොර අනෙකුත් දොරවල් වලට වඩා මොකකින් හරි වෙනස්. ඉතින් එයා කළේ දොරවල් වලට තීන්ත ගෑම. හැම දොරක්ම එක වගේ මතුපිට පෙනුම එන විදියට. ඒත් මීයන්ට තාමත් කියන්න පුළුවන්. ඒ ගමන එයා හිතුව සමහර විට මීයන්ට ආහාර සුවඳ දැනෙනව කියල. ඉතින් සෑම දිවිල්ලකටම පසුව එයා රසායන දාලා සුවඳ වෙනස් කළා. ඒත් තාමත් මීයන්ට හරියට කියන්න පුළුවන්. ඒ ගමන එයාට වැටහුණා ඉතින් සාමාන්‍ය දැනීමක් තියෙන ඕනෑම පුද්ගලයෙක් වගේ ලැබ් එකේ ලයිට් වලින් මීයන්ට කියන්න පුළුවන් ඇති කියල. ඉතින් එයා කොරිඩෝව ආවරණය කළා. ඒත් මීයන්ට තාමත් කියන්න පුළුවන්. අවසානයේ ඔහු හොයාගත්තා මීයන් දුවද්දී බිමේ සද්දයෙන් උන්ට එය හොයාගන්න පුළුවන් බව. ඒ සඳහා කළ යුත්ත වූයේ කොරිඩෝව වැලි වලින් වැසීම. ඒ වගේ සොයාගත හැකි විය හැකි සෑම ඔත්තුවක්ම අනුව පියවර අරගෙන අවසානයේ ඔවුන්ව තුන්වැනි දොරෙන් ඇතුලට යවන්න ඔහු පුහුණු කළා. ඒ කොන්දේසි එක් හෝ ලිහිල් කළා නම්, මීයන්ට කියන්න පුළුවන් වුණා. ඉතින් විද්‍යාත්මක පැත්තෙන් මෙය අති විශිෂ්ඨ අංක එකේ පර්යේෂණයක්. මීයන්-දුවවන පර්යේෂණ විචාරවත් කරන්නේ මේ පර්යේෂණයයි. මොකද උන් භාවිතා කරනවා යැයි ඔබ හිතන ඒවා නොව, මීයන් සැබැවින්ම භාවිතා කරන ඔත්තු සියල්ල එයින් හෙළිකරන නිසා. ඒ පර්යේෂණයයි පෙන්වන්නේ සුපරීක්ෂාකාරීව සහ පාලනයෙන් යුතුව මීයන්-දුවවන පර්යේෂණයක කොන්දේසි නිශ්චිතවම මොනවාද විය යුතු යැයි කියා. මම මේ පර්යේෂණයේ පසු ඉතිහාසය සොයා බැලුව. ඊ ළඟ පර්යේෂණය, කිසිවිටෙක යන්ග් මහතා ගැන සඳහන් කළේ නැහැ. ඔවුන් සුපරීක්ෂාකාරී වීම හෝ ඔහුගේ වැලි දැමීමේ පිළිවෙත අනුගමනය කළේ නැහැ. එකම විදියට මීයන් දුවවන එක පමණක ඔවුන් නියැළුනා. යන්ග් මහතාගේ විශිෂ්ඨ සොයා ගැනීම් ගැන කිසි සැලකිල්ලක් දැක්වූයේ නැහැ. ඔහුගේ ලිපි ගැන සඳහන් කළේ නැහැ. මන්ද, ඔහු මීයන් ගැන කිසිවක් සොයා නොගත් නිසා. සැබැවින්ම, ඔහු සොයාගත්තේ මීයන් සම්බන්ධයෙන් යමක් සොයා ගන්නට කළ යුතු සියල්ල ගැනයි. ඒත්, එවැනි පර්යේෂණ වලට අවධානය යොමු නොකිරීම කාර්ගෝ කල්ට් විද්‍යාවේ ගති ලක්ෂණ උදාහරණයක්.

ෆේයන්මන් කියන්නේ යන්ග් විසින් හොඳ මීයන්-වටාරම් පර්යේෂණයක් සඳහා පාලන කළ යුතු සියල්ල පහදාගත් බවයි. අවාසනාවට, බොහෝ පර්යේෂකයන් මේ පාලන පිළිපැදීමට අසමත් වෙති.

ප්‍රථම උපාධි අපේක්ෂකයෙන් ලෙසින් මනෝවිද්‍යා පාඨමාලාව හැදැරීම මට සිහිවෙනව. එහි එක අපේක්ෂාවක් වූයේ පර්යේෂණයක subject වීම. මට අමතකයි මොකක්ද කාර්යය වූයේ කියා, ඒත්, ස්ක්‍රීන් එකක දිගහැරෙන යම් stimulus එකක් අනුව බොත්තම් හතරකින් නිවැරදි උත්තරය හැකි ඉක්මණින් ඔබන්නයි ඕන. ඒ කාලේ යාන්ත්‍රණය සම්පූර්ණයෙන් කොම්පියුටර් පාලනයෙන් සිද්ධ වූයේ නැහැ. ඉතින් එක පර්යේෂකයෙක් නැහැසුම් අංකය කළින් දැනුම් දෙනව, එතකොට stimuli ප්‍රදර්ශනය කරනව, මම ප්‍රතිචාර දක්වනව, අනෙක් පර්යේෂකයා ප්‍රතිඵලය අතින් ක්ලිප්බෝර්ඩ් එකක ලියමින් වාර්තා කරනව. ඒත් හොඳින් සසම්භාවි කරපු නැහැසුම් අංක කිහිපයක් ඇසීමෙන් පසුව: 17, 32, 3, 26, … මට වැටහුණා නිවැරදි බොත්තම හැම විටම නැහැසුම් අංක modulo 4 බව. ඉතින් එතැන් පටන් මට stimuli දිහා බලන්න උවමනාවකුත් තිබ්බෙ නැහැ. මට නැහැසුම් අංකය අහලා, අපි කියමු 34 කියල, එතකොට ඉක්මණින් 43=3 mod 4 කියල ගණනය කරල stimuli ආපු ගමන් තුන්වැනි බොත්තම ඔබන්න පුළුවන් වුණා. පර්යේෂකයන් හිතුවේ ඔවුන් නැහැසුම් පිළිගන්වන ක්‍රමය නිවැරදිව සසම්භාවි කර ඇතැයි කියල. නමුත් පටන් ගනිද්දි නැහැසුම් අංකය නිවේදනය කිරීම නිසා ඔක්කොම අප්සෙට් යනව කියන එකට ඔවුන් අවධානයෙන් ගිලිහිලා තිබුණ. (මම බොත්තම එබුවට පස්සේ පළමු පර්යේෂකයා නැහැසුම් අංකය නිවේදනය කළා නම් වැඩේ හරි.)

දෙවැනි කොටස:
පරීක්ෂණ අර්ථ දැක්වීමේ දී ඇති පොදු අවදානම් සංඥා

අවදානම් සංඥා I1: නැවත නැවතත් කිරීමේ සහ නැවත නිමැවීමේ නොහැකියාව

පර්යේෂණයක් තුළින් යම් ප්‍රපංචයක් සැබැවින්ම සත්‍යය යැයි දක්වන්නේ නම්, එවිට පර්යේෂකයාට පර්යේෂණය නැවත කර එයාකාර ප්‍රතිඵල ලබාගත හැකි විය යුතුයි. ඊට වැදගත් ලෙසින්, අනෙක් පර්යේෂකයන්ටත් පර්යේෂණය නැවත නිමැවීමෙන් එයාකාර ප්‍රතිඵල ලබාගත හැකි විය යුතුයි. ඉක්මණින් රැවටෙන පුද්ගලයන් මුල්ම ප්‍රතිඵලයෙන් දැඩි සෙයින් ප්‍රබෝධමත් වෙති, ඒත් ප්‍රඥාවන්තයින් නැවත නිමැවීමෙන් ලැබෙන සාක්ෂි ලැබෙන තුරු බලා සිටිති, ඔවුන් බොරු දැන්වීම් වලින් නිතර නොරැවටෙති.

අවදානම් සංඥා I2: විද්‍යා සඟරාවේ පාක්ෂිකත්වය නොසලකා හැරීම

මෙන්න මගේ අරුම පුදුම ප්‍රකාශය: දැඩි පාලක යටතේ, මගේ උවමනාව පමණක් යෙදවීමෙන් (අහඹු අංක උපදවන යන්ත්‍රයක් යොදා ගනිමින්) 25 වතාවක් එක දිගටම හිස ලැබෙන සේ භෞතිකව බලපෑමක් කරමින් ඉලෙක්ට්‍රොනික් කාසි පෙරළීමට මට හැකි වී තිබෙනවා. එක දිගට 25 වතාවක් කාසියේ හිස පැත්ත ලබාගැනීමේ සම්භාවිතාව මිලියන 33 කට 1 කි. දැන් ඔබට ඒ ගැන විරුද්ධත්වය දක්වන කාරණා ගණනාවක් ඇති: අහඹු අංක උපදවන යන්ත්‍රය හිස තේරීමට වැඩියෙන් නැඹුරු වූවක් ද? නැහැ. එය දීර්ඝ කාලයක් එකම කරන්නට වැඩියෙන් නැඹුරු වූවක් ද? නැහැ. මම බොරු කියනවාද? නැහැ. මට ටෙලිකිනෙටික් බලයක් ඇත්ද? නැහැ. එහි යම් ප්‍රයෝගයක් තියෙනවද? ඔව්. ප්‍රයෝගය තමයි මම පර්යේෂණය මිලියන 100 වතාවක් නැවත නැවතත් කළා, මම ඔබට කීවේ මගේ හොඳම ප්‍රතිඵලය පමණයි. මිලියන 50 වතාවක් පමණ මම එක දිගට කාසියේ හිස ලබාගත්තේ නැහැ. සමහර විටෙක මම වාසනාවන්ත ලෙසින් පෙනී ගියා/ටෙලිකිනෙටික්: සාමාන්‍යයෙන් වෑයම් මිලියන 16 ක් පමණක් යනවා යැයි කියැවෙද්දී, එක දිගටම 24 වතාවක් හිස ලබාගන්නට මට වැය වූයේ වෑයම් මිලියන 2.3 ක් පමණයි. ඒත් අවසානයේ දී, මම අවසානාවන්ත ලෙසින් පෙනී ගියා: මගේ හොඳම ප්‍රතිඵලය එක දිගට 25 ක් පමණයි, බලාපොරොත්තු වූ 26 නෙමෙයි.

ඔට්ටු අනුපාතය ජයගත්තා යැයි කියන බොහෝ පර්යේෂණ යොදා ගන්නේ මගේ ප්‍රයෝගයේ එක් ආකාරයක්. මගේ අරමුණ උවමනාවෙන්ම නොමඟ යැවීම වුනත්, අනෙක් අය එය කරන්නේ කිසිම අහිතක් අරමුණු නොකර. එය විවිධ මට්ටම් වලින් සිද්ධ වෙනවා: පර්යේෂණයක් හරි යන්නේ නැතැයි දකින්නට ලැබෙද්දී පර්යේෂකයන් ඒවා සම්පූර්ණ කරන්නේ නැහැ, එසේම ඔවුන් ඒවා ප්‍රකාශය සඳහා ලියන්නටත් යන්නේ නැහැ (ලිපිගොනු බහාලන ලාච්චුවක වැටෙන ඵලවිපාකය) බොහෝ අය සෙයින් එය මගේ කලින් සහායකයෙක් වූ ජෙෆ් ස්කාගල් විසින් ද ලස්සන අධ්‍යයන ලිපියකින් විමර්ශනය කරලා තියෙනව, නැත්නම් අධ්‍යයන සඟරාවක් විසින් ප්‍රතික්ෂේප කරන ඒවා. සම්පූර්ණ ක්‍රමය තුළ ධනාත්මක ප්‍රතිඵල වලට ලැබෙන ප්‍රකාශන පක්ෂපාතීත්වය වැඩියි ඍනාත්මක ප්‍රතිඵල වලට වඩා. ඉතින් යම් ප්‍රකාශිත අධ්‍යයන ලිපියකින්, “සංඛ්‍යාතමය ලෙසින් මෙය අහඹුවෙන් සිද්ධ විය හැකියාව ඇත්තේ විසි වතාවකින් එක් වතාවක් පමණයි” යැයි කියැවෙද්දී, එයාකාර පර්යේෂණ විසිවතාවක් කිසිදු ධනාත්මක ප්‍රතිඵලයක් නැතිව සිද්ධ වූවා යන්න, ඒවා ප්‍රකාශනය වූයේ නැතැයි යන්න, සැබැවින්ම සැලකිය හැකියි.

අවදානම් සංඥා I3: අනෙකුත් පාක්ෂික ප්‍රභවයන් නොසලකා හැරීම

ඕනෑම සංඛ්‍යානමය නියැදියක දෝෂ හටගත හැකි ප්‍රභවයන් දෙකකි: විචල්‍යතාවය සහ පාක්ෂිකත්වය. විචල්‍යතාවය යනු අපිට සමස්ත ජනගහනයේ ඉතාමක් කුඩා කොටසක් පමණක් නියැදියට ගත හැකිවීම යන පරිසිද්ධිය නිසා ඇතිවන සසම්භාවී අඩුවැඩිවීමයි. අපි විචල්‍යතාවයේ වරද ගැන සම්භාව්‍යතාවය මනින්නේ p අගයකිනි (ඒ ගැන අවදානම් සංඥා I5 න් සහ I6 න් තව දුරටත්). පාක්ෂික දෝෂ ඇතිවෙන තවත් ප්‍රභව බොහොමයකි (උදාහරණයක් හැටියට, බලන්න අවදානම් සංඥා D4), ඒත් ඒවා අංක අගයකින් සුරුවමට ප්‍රමාණනය කළ නොහැකියි, ඒ නිසා ඒවා නොසලකා හැරීමේ ප්‍රවණතාවයක් පවතී. ඒත් පාක්ෂිකත්වය තවමත් පවතී, එය නොසලකා හැරීම යනු පිළිගත නොයුතු ප්‍රතිඵල වැඩියෙන් පිළිගැනීමට ලක්වීමයි. සැබැවින්ම, බොහෝ ප්‍රකාශිත පර්යේෂණ සොයා ගැනීම් බොරු යැයි ජෝන් පී. ඒ. අයොනිඩිස් පළකර සිටියේය. ඒ කතුවැකිය එහි සිරස්තලය තුළින් නොමඟ යවන්නකි, මන්ද වැරදි යැයි සොයා ගත් අධ්‍යයන සංඛ්‍යාව හරියටම කොපමණක්ද යන්න එයින් සඳහන් කර නැත. සැබැවින්ම, පර්යේෂණ වල කාර්යක්ෂම බව හෝ වැඩ බාල බව ගැන එහි කිසිදු ප්‍රකාශයක් නැත. ඒ වෙනුවට එයින් පෙන්නුම් කරන්නේ ගණිතමය ප්‍රකාශයකි, සමහර අභ්‍යූපගමන යටතේ ලැබෙන පාක්ෂික මට්ටම් ගැන සහ සැබෑ සහසම්බන්ධයන්ගේ ප්‍රතිශතයන්, යම් අධ්‍යයන ක්ෂේත්‍රයක විය හැකි සහසම්බන්ධයන් මුළු සංඛ්‍යාව හා සසඳන විට, එවිට ඉදිරිපත් කරන p අගය සඳහා ඔබට ප්‍රකාශිත ප්‍රතිඵල කොතරම් ප්‍රමාණයක් සැබැවින් සත්‍යය දැයි ඇස්තමේන්තු කළ හැකියි. භින්නෝන්මාදය සමඟ සම්බන්ධ gene polymorphisms 100,000 ක කාණ්ඩයක් දිහා බලන උදාහරණයක් ඔහු සපයයි. සහේතුක අභ්‍යූපගමනයකින් යුතු කාණ්ඩයක් යටතේ, පාක්ෂික බව 10% ක් නම්, එවිට p=5% හි සැලකිය යුතු යැයි වාර්තා කරන්න සමඟ සම්බන්ධවීමේ සම්භාවිතාව සැබැවින්ම 0.044% ක් පමණි. මෙය අපේ අවදානම් සංඥා D7 හා සමාන වූවකි, පමණට වැඩියෙන් දත්ත ලබාගැනීම: තෝරාගත හැකි අවස්ථාවන් 10,000 ක් තිබීමෙන්, ඒත් ඒවා බොහොමයකින් කිසිදු ඵලයක් නැතිවීමෙන්, සැබෑ ඵලයක් නිසා ලැබෙනවා වෙනුවට සසම්භාවී අහඹුවක් නිසා ප්‍රතිඵලයක් ලැබීමේ හැකියාව පෑදීමයි.

පරිවර්තක සටහන:
මෙහි ඉතිරිය හැකි ඉක්මණින් පරිවර්තනය කළ පසු, පුරුදු පරිදි PDF එකක් හැටියට දකුණු පැත්තට ගෙනෙන්නම්.

One Response

Subscribe to comments with RSS.

  1. mppgunasinghe said, on දෙසැම්බර් 22, 2020 at 3:30 පෙ.ව.

    ඉතාම වටිනා දැනුමක් ලදිමි ස්තුතියි අරුණි සෆිරෝට


ප්‍රතිචාරයක් ලබාදෙන්න

Fill in your details below or click an icon to log in:

WordPress.com Logo

ඔබ අදහස් දක්වන්නේ ඔබේ WordPress.com ගිණුම හරහා ය. පිට වන්න /  වෙනස් කරන්න )

Google photo

ඔබ අදහස් දක්වන්නේ ඔබේ Google ගිණුම හරහා ය. පිට වන්න /  වෙනස් කරන්න )

Twitter picture

ඔබ අදහස් දක්වන්නේ ඔබේ Twitter ගිණුම හරහා ය. පිට වන්න /  වෙනස් කරන්න )

Facebook photo

ඔබ අදහස් දක්වන්නේ ඔබේ Facebook ගිණුම හරහා ය. පිට වන්න /  වෙනස් කරන්න )