" مقاله-پروژه و پایان نامه | مفاهیم و اصطلاحات در GT

“

برآورد توانایی آزمودنیها به سوالات آزمون وابسته است. ‌به این معنی که نمونه های متفاوت

سوال به برآوردهای متفاوتی از توانایی افراد مورد سنجش منجر می شود. در چارچوب نظریه کلاسیک آزمون، مفهوم توانایی به وسیله نمره واقعی بیان می شود. هم نمره مشاهده شده و هم نمره واقعی هر دو وابسته به آزمون مورد استفاده هستند. وقتی که آزمون دشوار است، به نظر میرسد که آزمودنی توانایی پایینی دارد و وقتی که آزمون آسان است به نظر می‌رسد که آزمودنی دارای توانایی بالایی باشد. ‌بنابرین‏ نمی توان یک مقدار توانایی ثابتی را در روی پیوستار صفت مکنون برای آزمودنی به دست آورد. در نتیجه مقایسه آزمودنیهایی که در آزمونهای مختلف شرکت کرده اند، خیلی دشوار است.

مفاهیم و تعاریف نظریه CTT غیر قابل آزمایش هستند. در واقع راهی وجود ندارد تا معین شود

چه اندازه مفروضههای نظریه کلاسیک آزمون با واقعیات در ارتباط است.

یکی از نتایج نظری مدل کلاسیک آزمون، ساخت فرمهای موازی آزمون است. این امر از

لحاظ نظری قابل دفاع است لیکن در عمل، ساخت آزمونهای موازی واقعی غیرممکن است. زیرا نمرات

واقعی و خطا، ساخت نظری غیر قابل مشاهده دارند و موازی بودن فرمها قابل تبیین و توجیه نیست.

نظریه کلاسیک آزمون، آزمون مدار^[۴۲] است. در قالب این نظریه، نمره کل را برای تفسیر در نظر

می گیرند. نمره کلها می توانند با هم مشابه باشند در حالی که توانایی و مهارت های افراد با هم متفاوت باشد. این نظریه توجهی به اینکه یک آزمودنی چطور به سوال پاسخ میدهد ندارد. به عبارت دقیقتر، این نظریه ما را به پیش بینی نحوه عملکرد یک فرد یا یک گروه از آزمودنیها در مواجه با یک سوال خاص قادر نمیسازد.

نظریه کلاسیک آزمون به اندازه کافی برای توزیعهای نمره مشاهده شده آزمون که اثرات پایه

و سقف دارند دلیل موجهی نمیآورد، جایی که نسبت بزرگی از نمره آزمودنیها در هر دو انتهای پایین و بالای دامنه نمره آزمون قرار دارند.

مجموعه متنوع و گسترده ای از عوامل می تواند نمرات مشاهده شده را تحتتأثیر قرار دهد،

از جمله چگونگی ساخت سؤالات، اجرای آزمونها، نمره گذاری سوالات. در CTT همه این عوامل فقط در اصطلاح خطای تصادفی در مدل آماری گنجانیده شده است.

اعتبار در نظریه کلاسیک اندازه گیری به عنوان ” همبستگی میان فرمهای موازی یک آزمون”

تعریف می شود. در عمل مرتفع کردن شرایط تعریف آزمونهای موازی اگر غیرممکن نباشد، دشوار است. ضرایب اعتبار موجود، برآورد حد پایین اعتبار را به دست می دهند یا برآوردی از اعتبار با سوگیری نامعلوم را فراهم میسازند.

خطای استاندارد اندازه گیری^[۴۳] که تابعی از واریانس و ضریب اعتبار آزمون ‌می‌باشد، فرض

می شود که برای همه آزمودنیها در همه سطوح توانایی یکسان است. در حالی که، برحسب سطوح مختلف نمرات حقیقی و موقعیت آزمودنیها بر روی پیوستار صفت مکنون، خطای اندازه گیری متفاوت است و معمولاً آزمودنیهای با توانایی کمتر دارای خطاهای استاندارد اندازه گیری بیشتری هستند تا آزمودنیهای قویتر و با نمرات حقیقی بالاتر. علاوه بر آن، خطای معیار اندازه گیری به گروه نمونه وابسته است زیرا نمی توان آن را جدا از اعتبار آزمون تعیین کرد.

نظریه تعمیم پذیری(GT)

عوامل مختلفی، نمرات مشاهده شده آزمون را تحت تأثیر قرار میدهد. در نظریه کلاسیک آزمون، همه

این عوامل تحت یک عبارت خطای تصادفی نامتمایز در مدل آماری گنجانیده می شود. روانسنجان برای لحاظ کردن این عوامل و تفکیک آن ها در مدلهای آماریشان، نظریه تعمیمپذیری را گسترش دادند. بنا به گفتهی برنان (a2010)، نظریه تعمیمپذیری چارچوب مفهومی گسترده و مجموعه محکمی از روشهای آماری را برای پرداختن به مسائل اندازه گیری متعدد فراهم ‌کرده‌است تا حدی که، این نظریه را ‌می‌توان به دلیل به کار بستن روشهای تحلیل واریانس^[۴۴](ANOVA) به عنوان بسطی از نظریه کلاسیک آزمون تلقی کرد. نظریه کلاسیک آزمون و ANOVA را ‌می‌توان به عنوان والدین نظریه تعمیمپذیری پنداشت، اما این کودک هم بیشتر و هم کمتر از پیوند سادهی والدینش است. اگر چه نظریه تعمیمپذیری، نظریه کلاسیک آزمون را گسترش داده است، اما همه ابعاد نظریه کلاسیک آزمون در نظریه تعمیمپذیری وارد نشده است. علاوه بر این، مسائل ANOVA که در نظریه تعمیمپذیری بر آن تأکید می شود متفاوت از مسائلی است که در بسیاری از طرحهای آزمایشی و متون ANOVA غالب است. نظریه تعمیمپذیری به طور خاص بر روی مؤلفه های واریانس^[۴۵] و برآوردشان تمرکز می کند.

در این نظریه با تجزیه واریانس نمره کل به رویه های^[۴۶] چندگانه، امکان برآورد درصد واریانس ناشی از هر رویه به وجود می آید و از این طریق ‌می‌توان رویه ای (منبع خطا) که مقدار مؤلفه واریانس آن و یا مقدار مؤلفه های واریانس اثرهای متقابل آن زیاد است را شناسایی کرد و در ادامه با اقدامات مؤثر مقدار واریانس خطا را کاهش داد و فرایند اندازه گیری را بهبود بخشید. فرض کنید در بررسی که انجام دادهاید، رویه ارزیاب مؤلفه واریانس بزرگتری دارد. در اینجا ‌می‌توان با افزایش سطوح این رویه (افزایش تعداد ارزیابان) و یا آموزش بهتر برای ارزیابان، به ثبات بهتری در بین ارزیابان رسید. همانطور که فن و سان^[۴۷] (۲۰۱۳) بیان نموده اند؛ این نظریه با مطالعات D برای طرحهای اندازه گیری مختلف، به محققین این امکان را میدهد که تأثیر سطوح اندازه گیری^[۴۸] را بر روی اندازه اعتبار بسنجند و اندازه اعتبار را در مطالعه واقعیشان پیش بینی کنند. در این راستا محققین می توانند با بهره گرفتن از قابلیت انعطاف پذیری و پیش بینی این نظریه و با در نظر گرفتن ملاحظات عملی، پروتکل اندازه گیری بهینهای را طراحی کنند.

در GT، اعتبار مسئلهای است از نظر درجهای که ‌می‌توان از یک مشاهده به جهانی از مشاهدات تعمیم

داد (کرونباخ، گلیسر، ناندا و راجاراتنام، ۱۹۷۲، به نقل از براون^[۴۹]، ۲۰۰۵). از آنجا که یک اندازه خاص ممکن است به جهانهای بسیار متفاوتی تعمیم داده شود، ‌بنابرین‏ با ضرایب اعتبار مختلفی همراه خواهد بود. ضریب تعمیمپذیری (اعتبار) یک آزمون، ویژگی تغییرناپذیر آن نیست بلکه تحت تأثیر شرایط اجرای آزمون قرار دارد. بر اساس این نظریه، یک آزمون می تواند برای برخی مقاصد معتبر باشد ولی برای مقاصد دیگر کاملاً نامعتبر باشد. GT قابلیت کاربرد گسترده ای دارد و در زمینه های متعددی به کار گرفته شده است.

مفاهیم و اصطلاحات در GT

بنا به گفتهی برنان (a2010) مهمترین وجه و ویژگی منحصر به فرد GT چارچوب مفهومی آن است.

لذا برای ارتباط برقرار کردن با این نظریه و درک چارچوب مفهومی آن، مفاهیم و اصطلاحات رایج در این نظریه جداگانه و با بهره گرفتن از مثال زیر شرح داده می شود.

“

موضوعات: بدون موضوع لینک ثابت

فرم در حال بارگذاری ...

فید نظر برای این مطلب