فاطمه8

نمونه گیری زمانی: روش بازآزمایی:

همانطور که گفته شد برآورد پایایی به روش بازآزمایی برای بررسی خطای مربوط به اجرای یک آزمون در دو زمان متفاوت بکار می رود. این نوع از تحلیل  فقط هنگامی ارزشمند است که یک اندازه از صفت یاویژگی  برای مدت زمانی طولانی تغییر نکند. برای مثال، فرض کنید که آزمون هوش یک توانایی کلی ثابت را اندازه گیری می کند. همانطور که اگر آزمون هوش در دو زمان اجرا شود نمرات متفاوتی بدست می دهد. ممکن است فقدان این تطابق ناشی از خطای اندازه گیری تصادفی بدانید و معمولاً فرض نمی کنند که فرد باهوشتر شده یا هوش خود را از دست داده است. بعضی از آزمونها برای بررسی از طریق بازآزمایی، بدلیل تغییر بعضی از ویژگیهای ثابت آنها مناسب نیستند. برای مثال، تفاوت بین نمره آزمون رورشاخ در دو زمان به یکی از دو چیز مربوط است.

1-    تغییر در نمره حقیقی اندازه گرفته شده یا 2- خطای اندازه گیری

روش بازآزمایی فقط برای اندازه گیری های صفات استوار کاربرد دارد. ارزیابی پایایی بازآزمایی نسبتاً آسان است یک آزمون را در دو نوبت مشخص اجرا وسپس همبستگی نمرات دو نوبت را بدست می آوریم. اگر همبستگی مساوی یک بود، پایایی کامل است. و به عبارت دیگر نمره های مشاهده شده در یک آزمون با نمره های مشاهده شده در دومین آزمون بصورت کامل و خطی همبسته هستند وپایایی برآورد شده برابر یک است و اگر نمرات اولین و دومین اجرا همبسته نباشند برآورد پایایی مساوی صفر می شود.

در بررسی روش محاسبه ضریب پایایی بازآزمایی، باید به مسائل زیر توجه نمود:

 

استعداد انتقال اثر:

این اثر هنگامی که اولین جلسه آزمون نمرات جلسه دوم آزمون را تحت تأثیر قرار دهد و همین طور هنگامی که جوابهای آزمون اول را آزمودنی به خاطر بسپارد، اتفاق می افتد. فرض کنید در مورد موضوع بی اهمیتی از شما سوال شو، به عنوان مثال سوال شود چه کسی درب حیاط همسایه شما را ساخته است؟ اگر همین سوال در دو روز بعد مطرح شود ممکن است پاسخ نوبت دوم به سوال از روز قبل تأثیر بپذیرد. هنگامی که استعداد انتقال اثر وجود داشته باشد. همبستگی بازآزمایی معمولاً پایایی حقیقی را بیش از حد برآورد می کند.

 

اثر تمرین:

یک نوع مهم استعداد انتقال اثر، اثر تمرین است.بعضی از مهارتها با تمرین بهبود می یابد. بنابراین نمرات آزمودنی در نوبت دوم به دلیل بدست آوردن مهارت موثر، از آزمون نوبت اول بهتر می شود. به عنوان مثال این اثر تمرین در آزمون چالاکی دست ها اتفاق می افتد. تجربه بدست آمده است آزمون اول می تواند مهارت چالاکی دست ها را افزایش دهد. بطور کلی نمره حاصل از اجرای آزمون دوم از آزمون اول بیشتراست.

به دلیل مسائل فوق زمان اجرای بین دو آزمون باید به دقت بررسی شود. اگر زمان بین اجرای دو آزمون محدود باشد خطر نسبتاً بیشتری برای اثر تمرین و استعداد انتقال اثر وجود دارد.

به هر حال به همان اندازه که زمان بین دو نوبت آزمون افزایش می یابد بسیاری از فاکتورهای دیگر بر روی نمره آزمون اثر می گذارد و به همین جهت گاهی اوقات همبستگی ضعیف بازآزمایی به مفهوم غیرمعتبر بودن آزمون نیست. بلکه مبین این نکته می باشد که ویژگی تحت مطالعه تغییر کرده است.

 

پایایی فرمهای موازی:

دو فرم معادل یک آزمون را که یک ویژگی یکسان  را می سنجد مقایسه می کند. در دو فرم سوالهای متفاوت بکار گرفته می شود . در حالیکه سوالها از یک سطح دشواری یکسان انتخاب شده اند. هنگامیکه دو فرم یک آزمون در دسترس باشد عملکرد در یک فرم را می توان با عملکرد فرم دیگر مقایسه نمود. بیشتر کتابها این فرایند را پایایی فرمهای معادل می نامند و عده ای بطور ساده به آن فرم موازی گویند. گاهی دو فرم در یک روز برای گروه یکسانی از افراد اجرا می شود. ضریب همبستگی گشتاوری پیرسون برای برآورد این نوع پایایی بکار گرفته می شود.

تنها منابع واریانس، خطای تصادفی و تفاوت بین دو فرم آزمون است. گاهی دو فرم آزمون در دو زمان متفاوت تهیه می شود . در این مورد خطای نمونه گیری زمانی نیز در برآورد پایایی دخالت دارد. بطور کلی یکی از مشکل ترین بررسی های پایایی، توسط دو فرم موازی فراهم می شود. به همین دلیل فرمهای موازی از مقبولیت کمتری برخوردار است. چون مشکلات عملی بهتر در فرم یکسان از یک آزمون مشکل است. بازآزمایی گروه یکسانی از افراد را دچار مشکل می کند. در مقابل بسیاری از سازندگان آزمون ترجیح می دهند که پایایی آزمون را بر اساس یک فرم منفرد آزمون برآورد کنند.

 

مدل نمونه گیری حیطه:

در الگوی نمونه گیری حیطه ، مسئله استفاده از سوالهای محدود به عنوان معرفی از حیطه وسیعتری از خصیصه مورد اندازه گیری می شود. به عنوان مثال اگر بخواهیم توانایی افراد را در درک معنای لغات فارسی اندازه گیری کنیم، باید آزمودنی بسازیم که سوالهایی درباره معنای تمامی لغات فارسی موجود در یک فرهنگ لغات فارسی در آن مطرح شده باشد. بدیهی است با این آزمون توانایی درک معنای لغات فارسی آزمون بدون هیچ گونه خطایی قابل اندازه گیری است و نمره آزمودنی در این آزمون نشانگر نمره واقعی او است. اما چون تهیه و اجرای چنین آزمونی در عمل ناممکن است ، می توان از همه لغات مطرح شده در فرهنگ لغات فارسی، یک نمونه 100تایی انتخاب و آزمون را بر اساس آن تدوین کرد. نمره که آزمودنی از این آزمون بدست می آورد، نمر مشاهده شده اوست. اکنون این سوال مطرح می شود که با استفاده از آزمون کوتاه 100 سوالی به عنوان ملاکی برای برآورد نمره واقعی آزمودنی، با چه دقتی می توان نمره واقعی او را بدست آورد؟ در الگوی نمونه گیری حیطه، خطای ناشی از نمونه گیری سوالها به جای استفاده از همه سوالهای ممکن مورد توجه است. هر چه این نمونه بزرگتر باشد، بیشتر معرف حیطه مورد اندازه گیری خواهد بود در نتیجه هرچه تعداد سوالها، بیشتر باشد، ضریب پایایی آزمون بیشتر خواهد شد.(شریفی، 1377).

 

برآورد پایایی از طریق هماهنگی درونی: روش دو نیمه کردن

این روش دارای مزایای عملی بسیار زیادی است، زیرا

1-                       مستلزم تهیه تنها یک فرم آزمون است.

2-    جلب همکاری آزمون شوندگان نیز تنها برای اجرای یک نوبت آزمون لازم است.

این مزایای عملی موجب شده است که آزمون سازان روشهای تجزیه و تحلیل درونی را با وجود محدودیتهای نسبتاً جدی نظری آنها، فراوان مورد استفاده قرار دهند. البته یک محدودیت آن است که همه عملیات سنجش در یک دوره زمانی واحد و کوتاه انجام می شود و بنابراین درباره تغییر پذیری در طی زمان، یعنی تغییرات کارکر فرد از یک موقعیت به موقعیت دیگر هیچ زمینه و شاهدی نمی توان بدست آورد. محدودیت دیگر آن است که وقتی آزمون مورد نظر از نوع سرعت باشد، برآوردهای پایایی بیش از پیش متورم می شود.(ثراندایک، ترجمه هومن، 1369).

در روش دو نیمه کردن ، یک آزمون به دو نیمه مستقیم و بصورت جداگانه نمره گذاری می شود و نتیجه یک نیمه از آزمون با نیمه دیگر مقایسه می شود. برای دو نیمه کردن آزمون روشهای متفاوتی وجود دارد. اگر آزمون طولانی باشد، بهترین روش تقسیم سوالها بصورت تصادفی در دو نیمه می باشد. در این روش هنگامی که سوالهای یک نیمه از نیمه دیگرمشکل تر است ایجاد اشکال می کند. اگر سوالها به تدریج مشکل می شود بهترین روش استفاده از سیستم نمونه زوج است. برای برآور پایایی باید همبستگی بین دو نیمه را بدست آورد. البته این پایایی بدلیل اینکه هر پاره آزمون فقط نیمی از یک آزمون کامل است کمتر از حد برآورد می شود . افزایش نمرات آزمون همانند افزایش تعداد سوالات پایایی آزمون را افزایش می دهد. و برآورد پایایی بر اساس دو نیمه کردن بدلیل اینکه هر نیمه دارای پایایی کمتری در مقایسه با کل آزمون دارد کاهش می یابد. همبستگی بین دو نیمه آزمون، یک برآورد منطقی از پایایی یک نیمه آزمون است. برای تصحیح طول نیمه می توان از فرمول اسپیرمن- براون استفاده کرد. این فرمول همبستگی بین دو نیمه آزمون را برآورد می کند بصورتی که هر نیمه دارای طول کل آزمون باشد. این فرمول بصورت زیر می باشد:

برای مثال هنگامی که آزمون خاصی به دو قسمت مساوی تقسیم می شود و همبستگی دو نیمه آزمون برابر با 78% بدست آید. بر طبق فرمول برآورد پایایی اسپیرمن-براون برابر با 876/0 می شود:

با کابرد فرمول اسپیرمن-براون پایایی آزمون افزایش می یابد ستون سمت چپ جدول 5-1 چندین برآورد پایایی را که از فرمول تصحیح اسپیرمن-براون استفاده نکرده اند نشان می دهد ستون میانی مقدار مشابه را بعد از تصحیح نشان می دهد و ستون سمت راست مقدار تصحیح بوجود آمده  را نشان می دهد. همانطور که می بینید فرایند اسپیرمن-براون در دامنه میانی مقیاس دارای یک تأثیر مهم برای برآورد پایایی است.

قبل از تصحیح

بعد از تصحیح

مقدار تغییر

015/0

15/0

25/0

35/0

45/0

55/0

65/0

75/0

85/0

95/0

09/0

26/0

40/0

52/0

62/0

71/0

79/0

86/0

92/0

97/0

04/0

11/0

15/0

17/0

17/0

16/0

14/0

11/0

07/0

02/0

 

 

در دو حالت نمی توان از فرمول اسپیرمن-براون استفاده نمود:

1-    هنگامیکه دو نیمه آزمون دارای واریانس نابرابر است.

2-                       هنگامیکه دو نیمه به صورت هم ارز ظاهر نشوند.

دراین شرایط می توان پایایی را با استفاده از ضریب آلفا(گرونباخ، 1951) برآورد کرد.

آلفا بعنوان یک ضریب پایایی کلی، پائین ترین برآورد پایایی را که مورد انتظار است فراهم می کند. اگر آلفا خیلی بالا باشد ممکن است فرض شود که پایایی آزمون قابل پذیرفتن است. زیرا پائین ترین حد پایایی هنوز خیلی بالاست. پایایی نمی تواند در زیر آلفا قرار بگیرد. یک سطح آلفای پائین اطلاعات کمتری فراهم می کند ، زیرا ضریب آلفا فقط حد پائین پایایی را نشان می دهد. پایایی واقعی ممکن است هنوز بالا باشد. بنابراین اگر واریانس برای دو نیمه آزمون نابرابر باشد، ضریب آلفا، پایایی واقعی آزمون را می تواند تائید کند ولی نمی تواند بگوند که آزمون نامعتبر است( کاپلان وساکوزو 1997). فرمول ضریب آفا چنین است:

در این فرمول :

= ضریب آلفا برای برآورد  پایایی دو نیمه

= واریانس کل آزمون

= واریانس دو نیمه جداگانه آزمون

هنگامیکه واریانس دو نیمه آزمون برابر باشد ضریب اسپیرمن- براون وآلفا برابر هستند که شرایط دیگر هر دو فرایند، پایایی حقیقی را کمتر از حد ممکن برآورد می کنند.(آلن وین، ترجمه دلاور، 1374)

 

اندازه کلی ثبات درونی:

علاوه بر تکنیک دونیمه کردن، روشهای بسیار زیاد دیگری برای برآورد ثبات درونی یک آزمون وجود دارد.سالها قبل کودر و ریچاردسون با توسعه روشهای ارزیابی پایایی توسط یکبار اجرای آزمون پیشرفت مهمی را در بررسی پایایی فراهم نمودند.رویکرد این افراد مستقل ازروش دو نیمه کردن آزمون است. تصمیم گیری در مورد دو نیمه کردن آزمون موجب مسایل بالقوه ایی برای پایایی دو نیمه کردن می شد. دو نیمه ممکن بود دارای واریانس متفاوتی باشند ازطرفی روش دو نیمه کردن مستلزم نمره گذاری هر نیمه بصورت جداگانه بود که موجب کارهای اضافی می شد. تکنیک کودر- ریچاردسون به عنوان یک تکنیک کلی فاقد این مشکلات است . فرمول KR20 که برای اولین بار در مقاله مشهور کودر-ریچاردسون تحت عنوان کودر-ریچاردسون 20 یا KR20 بیان شد برای برآورد پایایی سوالهای دو مقوله ای (سوالهایی که بصورت صفر ویک نمره گذاری شده اند). بکار میرود.

این فرمول چنین است:

در این فرمول :

KR20= پایایی برآورد شده

N= تعداد سوالهای آزمون

S= واریانس نمره کل

P= احتمال بدست آوردن نمره درست برای هر فرد

q= احتمال بدست آوردن نمره نادرست برای هر فرد

= حاصل جمع pو q هر سوال آزمون

 

کودر و ریچارسون دارای فرمول KR21 نیز می باشند که در آن فرمول، نیاز به محاسبه ، p,q هر سوال نیست و در مقابل KR21 از تقریب جمع فرآورده pq ، متوسط نمره آزمون استفاده می کند.

KR21 بر چند مفروضه مهم تاکید دارد. مهمترین مفروضه آن این است که تمام سوالات باید دارای درجه دشواری یکسان باشند. یا متوسط سطح دشواری سوالها 5/0 باشد. این مفروضه منطقی به نظر می رسد و معمولاً در می یابیم که فرمول KR21 در مقایسه با پایایی دو نیمه کردن دارای زیر برآوردی از پایایی می باشد.

فرمول KR21 چنین می باشد:

از آنجا که فرایند کودر-ریچاردسون کلی است معمولاً دارای پایایی خیلی بیشتری در مقایسه با روش دو نیمه کردن است. فرمول کودر-ریچاردسون در بعضی موارد نامناسب است. در فرمول KR20 لازم است نسبت p هر سوال محاسبه شود. و در آزمونهایی که جواب سوالها بصورت درست یا نادرست نیست . همانند مقیاس شخصیتی و نگرش این فرمول کارآمد نیست در این مورد کرونباخ یک برآورد پایایی خیلی کلی را توسعه داده که ضریب آلفا نام دارد.

وبصورت زیر نوشته می شود:

همانطور که توجه دارید این فرمول خیلی به فرمول KR20 شبیه است. تنها تفاوت آن این است که  جانشین شده است. واریانس سوالهای منفرد و  واریانس نمره کل آزمون است. ضریب آلفا بدلیل اینکه با انواع فرمت سوال کارآمد است در مقایسه با KR20 کلی تر می باشد. بنابراین ضریب آلفا عمومی ترین مورد ثبات درونی است.

 

ارتباط منابع خطا با روش بررسی پایایی:

روان شناسان روشهای متفاوت بررسی پایایی را برای توصیف منابع خطای اندازه گیری به کار می برند. هر یک از این روشها مفهوم متفاوتی دارد. همانطور که در جدول 6-1 نشان داده شده است. یکی از منابع خطای اندازه گیری ، نمونه گیری زمانی است. انجام آزمون در دو زمان متفاوت ممکن است نمرات متفاوتی بدست دهد. حتی اگر آزمودنی ها در هر دو زمان ثابت باشند. این منابع خطا مشخصاً با روش بازآزمایی بررسی می شود. منبع دیگر خطا نمونه گیری سوال است. ویژگی یا سازه یکسان با بکارگیری حوزه وسیعی از سوالها بررسی میشود. برای مثال یک سوال برای بررسی هوش انسان بکار نمی رود.بلکه سوالهای متفاوتی که برای این سازه کلی بکار می رود ممکن نیست همیشه بازتاب یکسانی از توانایی حقیقی بدست دهد. این نوع از خطا با استفاده از پایایی فرمهای موازی و همتا بررسی می شود. مشخصاً بین دو فرم یک آزمون که توسط نمونه گیری تصادفی از یک حوزه بزرگ سوال که یک سازه ویژه را بررسی می کند همبستگی ایجاد می شود .این همبستگی همانند برآورد  این نوع پایایی مورد استفاده قرار می گیرد.

ثبات درونی یک آزمون به همبستگی درونی سوالها مربوط است. اگر آزمون برای اندازه گیری یک سازه تهیه شده باشد و تمام سوالها بطور مساوی برای اندازه گیری آن ویژگی انتخاب شوند سپس در بین سوالها یک همبستگی درونی بالایی وجود خواهد داشت. این ثبات درونی با استفاده از پایایی دو نیمه کردن ، KR20 و یا ضریب آلفا بررسی می شود. پایایی به چندین روش به بررسی منابع مختلف خطا می پردازد.

 

 


مطالب مشابه :


خطای استاندارد برآورد و تفسیر آن

سنجش و اندازه گیری - خطای استاندارد برآورد و تفسیر آن - پارادایم پژوهش بین رشته‏ ای (09122263167)




استاندارد کردن اسید و باز- تیتراسیون خنثی سازی

فقط شیمی - استاندارد کردن اسید و باز- تیتراسیون خنثی سازی - دانشکده ی علوم پایه ی




آمار استنباطی:

خطای استاندارد میانگین یا نمونه گیری – از فرمول زیر استفاده می شود :




آزمون خطای استاندارد میانگین

آزمون خطای استاندارد میانگین. آزمون z – آزمون خطای استاندارد میانگین یکی از آزمون‌های آمار




فاطمه8

خطای استاندارد اندازه گیری برای تعیین فاصله اطمینان اطراف نمره مشاهده شده خاص بکار می رود.




بررسی تطبیقی شاخص های دو نظریه کلاسیک آزمون و پرسش و پاسخ (IRT)

خطای استاندارد اندازه گیری هم همانگونه که در شکل 1-1 نیز نشان داده شده است، از طریق معکوس




سیستم های ابزار دقیق ، کالیبراسیون و خطا

برای تخمین عدم قطعیت در فرایند اندازه گیری ، بایستی شکل خطای پدید آمده را بدانیم.




سیستم های ابزار دقیق ، کالیبراسیون و خطا

این فاصله ، به عنوان خطای استاندارد Sm نامیده می شود و از رابطه محاسبه می شود.




نمونه سوال آمار استنباطی

اگر خطای استاندارد یک نمونه ی 18 نفره برابر با 4 باشد ، خطای استاندارد انحراف استاندارد




برچسب :