پايان نامه بررسي روايي و اعتبار آزمون دروس زيست شناسي و ادبيات فارسي در امتحانات نهايي نظام آموزشي متوسطه

تحقیق و پروژه و پایان نامه و مقاله دانشجویی

پايان نامه بررسي روايي و اعتبار آزمون دروس زيست شناسي و ادبيات فارسي در امتحانات نهايي نظام آموزشي متوسطه یکی از پایان نامه و تحقیق های جامع و کامل و دارای منابع معتبر می باشد این پایان نامه دارای 197 صفحه به صورت فایل ورد و قابل ویرایش می باشد که جهت دریافت و دانلود متن کامل پايان نامه بررسي روايي و اعتبار آزمون دروس زيست شناسي و ادبيات فارسي در امتحانات نهايي نظام آموزشي متوسطه بر روی گزینه خرید انتهای ایمیل کلیک نمائید پس از وارد نمودن اطلاعات مربوطه و پرداخت قادر به دانلود متن کامل پایان نامه مربوطه می باشد همچنین لینک پایان نامه همان لحظه به ایمیل شما ارسال می گردد.

فهرست مطالب

فصل اول : کلیات تحقیق
مقدمه 1
بیان مسئله 2
اهداف تحقیق 3
هدف کلی 4
اهداف جزیی 4
سوالات تحقیق 4
اهمیت و ضرورت تحقیق 5
تعاریف واژه ها و اصطلاحات 6
فصل دوم : ادبیات تحقیق
مقدمه 9
فرآیند ارزشیابی پیشرفت تحصیلی 10
انواع سوال 11
انواع امتحانات قابل اجرا در سطح وزارت آموزش و پرورش 15
شیوه طراحی سوالات امتحانات نهایی 16
چگونگی تصحیح امتحانات نهایی 16
مبانی نظری 18
نظریه کلاسیک آزمون (CTT) 19
مفروضات نظریه کلاسیک آزمون 19
محدودیت های نظریه کلاسیک آزمون 20
نظریه تعمیم پذیری(GT) 22
مفاهیم و اصطلاحات در GT 24
انواع مطالعات 27
ملاحظات مطالعات G و D 27
جهان مشاهدات قابل قبول و مطالعات G 28
جهان تعمیم و مطالعات D 29
مدل های تصادفی و ترکیبی با جهان های تعمیم نامحدود و محدود 30
طرح های تعمیم پذیری 31
انواع تصمیم و واریانس های خطا 35
انواع ضرایب 37
نظریه پرسش – پاسخ(IRT) 37
مفروضات نظریه پرسش – پاسخ 38
تک بعدی بودن 38
استقلال موضعی 38
معرفی مفاهیم اساسی در نظریه پرسش – پاسخ 39
خم ویژه سوال (ICC) 39
پارامتر دشواری سوال 39
پارامتر تشخیص سوال 40
پارامتر حدس سوال 40
پارامتر آزمودنی 40
ویژگی نامتغیر بودن پارامترها 41
مدل ها در نظریه پرسش- پاسخ 41
مدل های پرسش – پاسخ لوجیستیک برای داده های دو ارزشی 42
مدل یک پارامتری 42
مدل دو پارامتری 42
مدل سه پارامتری 43
نظریه تعمیم پذیری در مقابل نظریه کلاسیک آزمون 43
نظریه کلاسیک آزمون و نظریه تعمیم پذیری در مقابل نظریه پرسش پاسخ 45
مفهوم اعتبار 47
تعاریف آماری اعتبار 47
روش های برآورد اعتبار 48
روش های برآورد اعتبار آزمون های هنجار مرجع 50
عوامل مؤثر بر اعتبار آزمون 56
خطای معیار اندازه¬گیری 57
مفهوم اعتبار در IRT 59
تعریف و مفهوم روایی 59
تاریخچه روایی 60
انواع روایی 60
ارتباط روایی و اعتبار 65
محتوا 65
تحلیل محتوا 66
تحقیقات انجام شده در داخل و خارج از ایران 66
فصل سوم : روش تحقیق
مقدمه 78
روش تحقیق 78
جامعه آماری 79
گروه نمونه و شیوه گزینش آن 80
روش گردآوری اطلاعات 81
روش اجرای تحقیق 83
روش تجزیه تحلیل اطلاعات 84
فصل چهارم : تجزیه و تحلیل داده ها
تجزیه تحلیل آماری 92
فصل پنجم : بحث و نتیجه گیری
مقدمه 151
بحث و نتیجه گیری 152
یافته های جانبی تحقیق در ارتباط با تصحیح اوراق امتحانات نهایی 163
محدودیت های تحقیق 166
پیشنهادهایی برای تحقیق های آینده 166
منابع
پیوست ها

منابع

آتشک، محمد.(1391). ارزشیابی عدالت جنسیتی در نظام آموزشی ایران. زن در توسعه و سیاست، 10 (4):127-151.

آلن، مری جی؛ ین، وندی ام.(1387). مقدمه ای بر نظریه های اندازه گیری( روانسنجی) (ترجمه ی علی دلاور)، چاپ سوم، تهران: سمت.

امبرتسون، سوزان­ای؛ رایس، استیون پی.(1388). نظریه­های جدید روان­سنجی برای روان شناسان (ترجمه­ی حسن پاشا شریفی، ولی ا.. فرزاد، مجتبی حبیبی عسگر­آباد و بلال ایزانلو)، چاپ اول،تهران: رشد.

بازرگان، عباس.(1391). مقدمه­ای بر روش­های تحقیق کیفی و آمیخته (رویکردهای متداول در علوم ­رفتاری). چاپ سوم، تهران: دیدار.

بوالحسنی، ماریا.(1390). بررسی اعتبار بخشی عملی آزمون کنکور کارشناسی ارشد سال 1389 رشته معماری با استفاده از مولفه های واریانس( نظریه ی تعمیم پذیری). پایان نامه کارشناسی ارشد،دانشگاه علامه طباطبایی.

بیکر، فرانک بی.(1381). پایه های اساسی تئوری سوال- پاسخ : نظریه جدید روانسنجی (ترجمه ی حیدر علی هومن و علی عسگری). تهران: پارسا.(تاریخ انتشار به زبان اصلی 2001).

جزایری، حسین.(1384). بررسی اعتبار نمره گذاری معلمان در امتحانات تشریحی هماهنگ و نهایی دوره آموزش عمومی استان لرستان در سال تحصیلی 83-1384. گزارش طرح پژوهشی مصوب سازمان آموزش و پرورش استان لرستان.

حسنی، محمد؛ سامری، مریم؛ عباس زاده، میرمحمد؛ موسوی، میرنجف.(1392). بررسی نابرابری در آموزش و پرورش دانش آموزان دختر و پسر مقطع متوسطه ی استان آذربایجان غربی. نشریه زن درتوسعه و سیاست، 11 (3): 332-315.

حشمتی، عبدالرضا، رافع، ابوالقاسم و جمشید نژاد، مهرداد.( 1383). تجزیه و تحلیل نتایج امتحانات نهایی سال سوم متوسطه خرداد 81 در سراسر کشور. گزارش طرح پژوهشی مصوب معاونت آموزش و پرورش نظری و مهارتی.

رحیمی، محمود.(1387). ارزيابي و تحليل سطوح حيطه شناختي و شاخص هاي روان سنجي سوالهاي امتحانات نهايي پايه سوم راهنمايي استان خوزستان در خرداد ماه 1386 . گزارش طرح پژوهشیمصوب سازمان آموزش و پرورش استان خوزستان.

رستگار، طاهره.(1388). ارزشیابی در خدمت آموزش: رویکردهای نو در سنجش و ارزشیابی با تاکید بر سنجش مستمر و پویا و بازخورد موثر به دانش آموزان در فرایند آموزش. تهران: انتشارات موسسه فرهنگی منادی تربیت.

رستگاری مقدم، خدایار. (1378). تحلیل نتایج امتحان کنکور کارشناسی ارشد رشته های معارف اسلامی، فلسفه و نمایش نامه نویسی شرکت کنندگان سال 1377 با استفاده از نظریه تعمیم پذیری. پایان نامه کارشناسی ارشد، دانشگاه علامه طباطبایی.

سادئی، علی. (1376). مقایسه تحلیلی امتحانات هماهنگ و داخلی دوره ی متوسطه و انطباق آن با ملاک­های علمی طراحی سوال و آزمون سازی. گزارش طرح پژوهشی مصوب شورای تحقیقات سازمان آموزش و پرورش استان خراسان .

ستاری، بهزاد.(1382). روانسنجی پیشرفته کاربردی. مشهد: به نشر.

سرمد، زهره؛ بازرگان، عباس؛ حجازی، الهه.(1391). روش های تحقیق در علوم رفتاری. تهران: آگه.

سلیمانی، علی.(1384). بررسی و تحلیل سوالات امتحانی دروس ریاضی مقطع متوسطه نظری مراکز آموزشی استان کرمانشاه در امتحانات پایانی خرداد ماه 83 . گزارش طرح پژوهشی مصوب  سازمانآموزش و پرورش استان کرمانشاه.

سیف، علی اکبر.(1391). اندازه گیری ،سنجش، و ارزشیابی آموزشی. تهران : دوران.

شاطریان، محمد. (1384). بررسی میزان روایی، پایایی و شاخص های دشواری و تمیز سوالاآزمون­های معلم ساخته دروس ریاضی، فیزیک، شیمی و عربی سال اول دوره متوسطه شهرستان قم  در سال تحصیلی 84-1383. گزارش طرح پژوهشی مصوب شورای تحقیقات سازمان آموزش و پرورشاستان قم .

فلسفی نژاد، محمد رضا.(1391). جزوه کلاس نظریه سوال پاسخ ( irt) . دانشکده روانشناسی و علوم تربیتی دانشگاه علامه طباطبایی.

کاپلان، روبرت ام؛ ساکوزو، دنیس پ. (1388). روان آزمایی (ترجمه ی علی دلاور، فریبرز درتاج و نور علی فرخی). تهران: ارسباران. ( تاریخ انتشار به زبان اصلی 2004).

کرسول، جان دبلیو.(1391). طرح تحقیق در علوم انسانی و اجتماعی (ترجمه­ی اسماعیل سعدی پور). تهران: دوران. ( تاریخ انتشار به زبان اصلی 2009).

کرلینجر، فرد آن.(1388). مبانی پژوهش در علوم رفتاری (ترجمه ی حسن پاشا شریفی و جعفر نجفی زند). تهران: آوای نور.( تاریخ انتشار به زبان اصلی 1986).

کروکر، لیندا؛ آلجینا، جیمز.(1388). مباحث نو در روانسنجی (ترجمه ی ولی الله فرزاد و حسین زارع).تهران: آییژ. (تاریخ انتشار به زبان اصلی 2008).

کیامنش، علیرضا؛ حسنی، محمد.(1388). نقد و بررسی نظام ارزشیابی تحصیلی ایران از منظر ارزشیابی

نظام آموزشی. فصلنامه نوآوری های آموزشی، 30، 101 – 75.

مگنوسون، دیوید.(1351). مبانی نظری آزمون های روانی ( ترجمه ی محمد نقی براهنی). تهران: انتشارات دانشگاه تهران. (تاریخ انتشار به زبان اصلی 1967).

واحدی، شهرام ؛ فزون مهر، نادر. (1384). بررسی میزان انطباق سوالات امتحانات نهایی و داخلی سال سوم راهنمایی بر اساس شاخص های روانسنجی در استان آذربایجان غربی. گزارش طرح پژوهشیمصوب سازمان آموزش و پرورش استان آذربایجان غربی .

همبلتون، رونالد ک؛ سوامیناتان، اچ ؛ جین راجرز، اچ. ( 1389). مبانی نظریه پرسش- پاسخ (ترجمه یمحمد رضا فلسفی نژاد). تهران: انتشارات دانشگاه علامه طباطبایی.

هومن، حیدر علی. ( 1384). اندازه گیری های روانی و تربیتی ( فن تهیه تست و پرسشنامه). تهران: پیک فرهنگ.

یونسکو.(1384). پرونده ای باز در مورد آموزش و پرورش فراگیر (ترجمه ی ابوالفضل سعیدی). تهران: پژوهشکده ی کودکان استثنایی.

Alzu’bi, M. A. (2014). The Extend of Adaptation Bloom’s Taxonomy of Cognitive Domain In English Questions Included in General Secondary Exams. Advances in Language and Literary Studies, 5(2): 67-72.

Azar, A. (2005). Analysis of turkish high-school physics-examination questions and university entarence exams questions according to Bloom’s taxonomy. Türk Fen Eğitimi Dergisi, 2(2): 144-150.

Baltes, P. B., Smelser , N.J. (2001). International encyclopedia of the social & behavioral sciences. Vol 11, Amsterdam/New York, NY: Elsevier.

Brennan, R. L. (2010a). Generalizability Theory. New York: Springer-Verlag.

Brennan, R. L. (2010b). Generalizability theory and classical test theory. Applied Measurement in Education, 24(1): 1-21.

چکیده پژوهش

هدف پژوهش حاضر، بررسی روایی و اعتبار دروس زیست شناسی و ادبیات فارسی در امتحانات نهایی نظام آموزشی متوسطه بوده است. جامعه، تمام سوالات امتحانات نهایی رشته­ی علوم تجربی سال سوم مقطع متوسطه در خرداد ماه 1390 بود که جهت بررسی ویژگی­های روان­سنجی این سوالات، عملکرد 600 نفر از دانش­آموزان ناحیه یک شهرستان خرم­آباد در دو درس مذکور، تحلیل شد. در این تحقیق ترکیبی، به منظور بررسی روایی، این امتحانات از نظر ساختار، محتوا، توزیع طبقه­بندی سوالات و میزان پوشش محتوای کتاب با استفاده از نظرات متخصصان موضوعی و در قالب پرسشنامه­های محقق ساخته مورد ارزیابی قرار گرفتند. با کمک طرح­های اندازه­گیری در GT، اعتبار امتحانات مذکور بررسی شد. همچنین، تحلیل سوالات آزمون با استفاده از مدل­های کلاسیک و IRT انجام گرفت. به منظور بررسی وضعیت قبولی آزمودنی­ها و مقایسه عملکرد آن­ها بر اساس جنسیت، از شاخص­های توصیفی و آزمون  tمستقل استفاده گردید. در درس ادبیات­فارسی، تقریباً 95 درصد سوالات بدون اشکال ساختاری بودند که بیانگر وضعیت بسیار مطلوبی است. بیشترین اشکالات ساختاری در درس زیست­شناسی، عدم تناسب بارم سوال با میزان دشواری و اهمیت سوال بود. بر اساس ملاک سهل­گیرانه (6/0)، در دو درس ادبیات فارسی و زیست­شناسی به ترتیب (31/26، 19/67) درصد سوالات ضروری تشخیص داده شدند. تقریباً 60 درصد سوالات در هر دو درس متعلق به سطح دانش بود. هم نمرات دانش­آموزان و هم سوالات از اعتبار بالایی برخوردار بوده اما ضریب تعمیم­پذیری مطلق برای مصححان، کمتر از 70/0 بود که نشان دهنده­ی نامطلوب بودن نمره­گذاری مصححان در هر دو درس می باشد. ضرایب تعمیم­پذیری نسبی بدست آمده برای مصححان نیز نشان داد که روند تصحیح مصححان در درس ادبیات­فارسی، متفاوت و در درس زیست­شناسی، مشابه بوده است. با استفاده از آلفای کرونباخ، ضریب اعتبار برآورد شده­ی آزمون زیست­شناسی و ادبیات­فارسی (97/0، 96/0) تعیین گردید. همچنین بر طبق دو مدل CTT و IRT، دروس از ویژگی­های روان­سنجی مطلوب برخوردار بودند. نمره­ی میانگین دختران در هر دو درس بیشتر از پسران بود. شواهد تجربی بیانگر نقش خنثی مصحح دوم در امتحانات­نهایی بود.

کلید واژه ها :  امتحانات نهایی، اعتبار، روایی، مدل کلاسیک، مدل های IRT، نظریه­ی تعمیم پذیری

فصل اول

کلیات تحقیق

 مقدمه

در طول پنجاه سال اخیر، در جامعه جهانی دیدگاهی نسبت به آموزش و پرورش به وجود آمده است که گزارش اخیر شورای بین المللی آموزش و پرورش برای قرن بیست و یکم (دلورس[1]، 1996) آن را ” آرمانی ضروری” تلقی می­کند. این گزارش با قاطعیت ادعا می­کند که آموزش و پرورش تنها یک سازوکار برای اکتساب دامنه­ی محدودی از مهارت های پایه نیست، بلکه عاملی ارزشمند برای توسعه­ی اجتماعی و فردی است. دارایی بی­مانندی است برای تلاش (نوع بشر) به سوی دستیابی به آرمان­های ” صلح، آزادی و عدالت” و یکی از راه­های اصلی در دسترسی برای پرورش الگویی عمیق­تر و هماهنگ­تر از توسعه­ی انسانی می­باشد و از طریق آن، فقر، تبعیض، جهل، استضعاف و جنگ را می­توان کاهش داد (یونسکو[2]، 2001، ترجمه سعیدی، 1384،ص 18). امروزه جوامع به آموزش و پرورش به عنوان یکی از مهمترین راه­های توسعه و پیشرفت همه جانبه می­نگرند و هزینه­های کلانی را در آن صرف می­کنند. جوامع دریافته­اند که برای تحقق اهداف گوناگون، نیازمند نیروی انسانی ماهر و کارآمد هستند که دو دستگاه آموزش و پرورش و آموزش عالی متولی این امر می­باشند. آنچه این دو را به هم پیوند می­دهد، فرایند گزینش دانشجو است که در جوامع مختلف، متفاوت و بر مبنای انگیزه­های گوناگونی شکل یافته است. اما در این میان سعی همه جوامع بر این است که امکانات آموزش عالی به شایسته­ترین و اصلح­ترین افراد تخصیص یابد.

در ایران دیر زمانی است که نظام پذیرش دانشجو از طریق کنکور صورت می­گیرد که در بین جوانان به معنای” سرنوشت” تعبیر می­شود و در کشور باعث تولید نوعی بحران شده است. از تحولات سال­های اخیر در زمینه نظام پذیرش دانشجو، مطرح کردن جایگزینی سوابق تحصیلی بجای کنکور است که در سال 1386 با عنوان قانون حذف کنکور به تصویب مجلس شورای اسلامی رسید و می­بایست از سال 90 اجرایی      می­شد که با توجه به مشکلات علمی، فنی و اجرایی به سرانجام نرسید. تا اینکه در مرداد ماه 1392 کلیات طرح جدید سنجش و پذیرش دانشجو به تصویب نمایندگان مجلس شورای اسلامی رسید که بر اساس آن، این مصوبه از کنکور سال آینده اجرا می­شود و تأثیر سوابق تحصیلی (دور دوم دوره متوسطه) از سال 93 به صورت پلکانی از تأثیر 25 درصد شروع می­شود تا در نهایت به 85 درصد طی 5 سال برسد.

با توجه به طرح جدید سنجش و پذیرش دانشجو، از امتحانات­ نهایی مقطع متوسطه می­توان به عنوان یکی از مهم­ترین و سرنوشت­سازترین ابزار سنجش علمی دانش­آموزان نام برد. آنچه در این میان مهم جلوه می­کند، کیفیت این آزمون­ها و استاندارد بودن سوالات آنهاست. از اولین گام­ها در کیفیت مستندسازی فنی ابزار اندازه­گیری، تعیین روایی[3] و اعتبار[4] نمراتی است که از یک ارزیابی به دست می­آیند.

با نگاهی به مجلات علمی کشورمان، می­توان دریافت در بسیاری از مطالعات صورت گرفته، نه تنها در زمینه­ی آموزش و پرورش بلکه در رشته­های گوناگون، با وجود منابع چندگانه­ی خطا  باز محققان ضرایب اعتبار کلاسیک را گزارش می­دهند. این در حالی است که در وضعیت­های اندازه­گیری پیچیده که منابع چندگانه­ای از خطای اندازه­گیری وجود دارد، نظریه کلاسیک آزمون[5](CTT) قادر به برآورد اعتبار نیست. از این رو، تحقیق حاضر در پی آن است که ضمن معرفی نظریه تعمیم­پذیری[6](GT)، اعتبار امتحانات نهایی سال سوم متوسطه رشته­ ی تجربی در دو درس ادبیات­فارسی و زیست­شناسی را با استفاده از طرح­های اندازه­گیری این نظریه تعیین نموده و همچنین روایی آن­ها را مورد بررسی قرار دهد.

علاوه بر این، این تحقیق می­کوشد ویژگی­های روان­سنجی سوالات امتحانات نهایی را بر اساس CTT با توجه به اهمیتی که این مدل در تحلیل سوالات آزمون­های مختلف روانی- تربیتی داشته است، در کنار مدل­های نظریه پرسش- پاسخ[7](IRT) مورد بررسی قرار دهد.

بیان مسئله

     ارزشیابی پیشرفت تحصیلی فرآیند منظمی است که با به کارگیری روش­های علمی، عملکرد یادگیرندگان و میزان آموخته­هایشان را می­سنجد و در مورد عملکرد آن­ها با توجه به اهداف آموزشی مورد نظر به قضاوت و داوری می­پردازد. امتحانات نهایی سال سوم متوسطه نوعی از ارزشیابی پیشرفت تحصیلی هستند که در پایان دوره­ی آموزشی اجرا می­شوند.­ از نتایج این امتحانات جهت سنجش آموخته­های دانش­آموزان، تصمیم­گیری در مورد رد یا قبول شدن آن­ها و نیز ارزشیابی اثر بخشی برنامه آموزشی و شیوه تدریس مدرس استفاده می­شود. همچنین با توجه به طرح جدید سنجش و پذیرش دانشجو در کشورمان، این امتحانات پلی برای ورود به دانشگاه محسوب می­شوند. این کارکرد اخیر، بیش از پیش بر حساسیت این امتحانات می­افزاید.

زمانی این امتحانات به عنوان ابزار گزینشی کارا و سودمند تلقی می­شوند و می­توان به نتایج آن­ها اعتماد کرد که کیفیت این آزمون­ها در سطح مطلوبی باشد. به بیانی دیگر، در فرایند طراحی سوالات امتحانی و تصحیح اوراق امتحانی ملاک­های علمی و اصول روان­سنجی رعایت شود. همچنین به دلیل هماهنگ بودن این امتحانات در سطح کشوری، صحت اجرا و امنیت آن نیز تضمین شود. به منظور برنامه ریزی، اتخاذ تصمیم در حدود اختیارات، اجرا، هماهنگی و نظارت بر حسن برگزاری امتحانات ستادی تحت عنوان ستاد امتحانات در سطح استان، شهرستان، منطقه، ناحیه برای انجام وظایف مورد نظر تشکیل می­گردد و افراد زیادی در قبل، حین و بعد از برگزاری این امتحانات درگیر هستند و انجام وظیفه می­کنند. همان­طور که حسنی و کیامنش (1388) نیز مطرح کرده­اند، سازوکار امتحانات نهایی تمامی بخش­های آموزش و پرورش از وزارتخانه تا منطقه و مدارس را درگیر می­کند. روشن است که همه این تشکیلات عریض و طویل که سراسر کشور را در بر می­گیرد، برای بالا بردن ضریب صحت اجرای امتحان است و با صحت نتایج آزمون و طراحی سوال کاملاً تفاوت دارد.

با اینکه برای طراحی سوالات این امتحانات از دبیران مجرب و آشنا با اصول طراحی سوال استفاده   می­شود  با این حال در خصوص کیفیت سوالات این امتحانات و دقت عمل مصححان هنوز تردیدهایی وجود دارد و نمی­توان با اطمینان گفت آیا اصول و قواعد آزمون سازی در مورد این سوالات رعایت      می­شود یا خیر. و آیا این امتحانات به عنوان ابزار گزینشی از روایی و اعتبار لازم برای شناسایی استعدادها برخوردارند یا نه. برای پاسخگویی به این سوالات، از علم روان سنجی و تئوری های آن استفاده می­شود. تئوری­های روان­سنجی به دو دسته تقسیم می شوند: دسته­ی اول نظریه­ی نمونه­برداری تصادفی، که این نظریه خود شامل نظریه کلاسیک آزمون و نظریه­ی تعمیم­پذیری و دسته دوم شامل نظریه­ی پرسش پاسخ است .

از فعالیت­های عمده و مهم متخصصان تعلیم و تربیت، ساخت و تفسیر آزمون و تحلیل سوالات آن­ها بر پایه تئوری­های جدید و پیشرفته روان­سنجی می­باشد که متأسفانه این مهم برای خیلی از متخصصان این عرصه ناشناخته است. در همین راستا، در این پژوهش ضمن بکارگیری نظریه­ های روان­سنجی، روایی و اعتبار امتحانات­ نهایی دروس زیست­ شناسی و ادبیات­ فارسی سال سوم متوسطه رشته تجربی مورد بررسی قرار می­گیرد. همچنین این پژوهش رسالت خود را معرفی یکی از چندین حیطه ی کاربردی نظریه­های کلاسیک، تعمیم­پذیری و پرسش – پاسخ برای شناساندن گوشه­ای از مزایای علمی آنها و نهایتاً ایجاد رغبت برای مطالعه، پژوهش و نیز باز کردن دریچه­ی دیگری بر روی پژوهشگران می­داند.

اهداف تحقیق

هدف کلی

بررسی روایی و اعتبار امتحانات نهایی دروس ادبیات فارسی و زیست شناسی رشته­ی تجربی سال سوم متوسطه در تعیین میزان حصول اهداف آموزشی و همچنین قابلیت استفاده از آن ها به عنوان ملاکی جهت گزینش داوطلبان ورود به موسسات و مراکز آموزش عالی بود. همچنین ارائه­ی پیشنهاداتی به منظور تسهیل فرایند نمره­گذاری و افزایش دقت آن­ها در تصمیم­سازی های آموزشی را می­توان از دیگر اهداف این تحقیق نام برد.

اهداف جزیی

تحلیل ساختاری و محتوایی امتحانات نهایی

برآورد اعتبار امتحانات نهایی با استفاده از طرح­های اندازه­گیری GT

تعیین ویژگی­های روان­سنجی سوالات بر اساس CTT برحسب داده­های خام و داده­های کدگذاری شده

محاسبه ویژگی­های روان­سنجی سوالات بر اساس مدل های IRT

بررسی وضعیت قبولی آزمودنی­ها و توزیع نمرات آنها در امتحانات­نهایی

مقایسه عملکرد دانش­آموزان دختر و پسر در امتحانات­نهایی

سوالات تحقیق

روایی امتحانات­ نهایی دروس ادبیات­فارسی و زیست­شناسی رشته تجربی سال سوم متوسطه چگونه است؟

آیا سوالات امتحانات نهایی از لحاظ ساختاری از مطلوبیت کافی برخوردار است؟

آیا سوالات امتحانات نهایی از نسبت روایی محتوایی مطلوب برخوردارند؟

توزیع طبقه­بندی سوالات امتحانات­نهایی بر اساس سطوح یادگیری چگونه است؟

آیا سوالات امتحانات نهایی، تمام فصل­های کتاب را به طور منطقی تحت پوشش قرار داده است؟

اعتبار امتحانات­نهایی دروس ادبیات­فارسی و زیست­شناسی رشته تجربی سال سوم متوسطه چگونه است؟

آیا امکان مقایسه نمرات دانش­آموزان به صورت معتبر وجود دارد؟

آیا می توان دشواری سوالات را به طور معتبری اندازه گیری کرد؟

آیا نمرات اختصاص داده شده توسط مصححان، اعتبار لازم را دارد؟

با تغییر تعداد سطوح رویه­ها، چه تغییری در اندازه­ی ضرایب تعمیم­پذیری بوجود می­آید؟

آیا سوالات امتحانات­نهایی بر اساس CTT از ویژگی­های روان­سنجی مطلوب برخوردارند؟

تجزیه و تحلیل شاخص­های سوال در مدل کلاسیک بر اساس داده­های خام به چه صورتی است؟

تجزیه و تحلیل شاخص­های سوال در مدل کلاسیک بر اساس داده­های کدگذاری شده به چه صورتی است؟

آیا سوالات امتحانات­نهایی بر اساس IRT از ویژگی­های روان­سنجی مطلوب برخوردارند؟

وضعیت قبولی آزمودنی­ها و توزیع نمرات آنها در هر یک از دروس مورد مطالعه چگونه است؟

آیا تفاوتی در عملکرد آزمودنی­های دختر و پسر در امتحانات­نهایی وجود دارد؟

اهمیت و ضرورت تحقیق

بدون تردید ایجاد هر تحول در سطح ملی نیاز به برنامه­ریزی اساسی و تفصیلی دارد که در آن تحولات جهان و نیازهای ملی، تفاوت­های اجتماعی، فرهنگی، مذهبی و ویژگی­های مشترک و غیر مشترک فراگیران به دقت مورد بررسی قرار گرفته است. به این دلیل به هر ایده­ای که قصد تحول در سیاست­های آموزشی و ارزشیابی دارد باید به همین دید نگریست(رستگار، 1388، ص153). شناسایی مناسب­ترین نظام گزینش دانشجو برای انتخاب شایسته­ترین افراد امری ضروری است تا پذیرفته شدگان بتوانند تحصیلات دانشگاهی خود را با علاقه و پشتکار طی نمایند و نیاز جامعه به داشتن نیروی انسانی متخصص و آموزش دیده برطرف شود. در این میان آنچه ضرورت دارد انجام مطالعات گسترده و علمی به منظور جایگزینی نظام جدید گزینش دانشجو می­باشد و در کنار گذاشتن شیوه­های سنتی نیز باید با احتیاط و سنجیده عمل کرد. در سال­های اخیر بحث تغییر و تحول نظام پذیرش دانشجو در کشورمان مطرح بوده است که طرح سنجش و پذیرش دانشجو، مصوبه مرداد 1392 نتیجه آن می­باشد. براساس این مصوبه، تأثیر سوابق تحصیلی در پذیرش دانشجو می­بایست به 85 درصد طی 5 سال برسد. آنچه که همگان در مورد آن اتفاق نظر دارند، افزایش تأثیر سوابق تحصیلی در پذیرش دانشجویان است و این خود بیانگر حساسیت و اهمیت بالای امتحانات نهایی نظام متوسطه است. امتحاناتی که زمانی تنها برای اخذ مدرکی بنام دیپلم مهم بودند و امروزه پل ورود به دانشگاه محسوب می شوند. این امتحانات ترکیبی از فرمت های مختلف سوال را داراست و تصحیح شان بر طبق راهنمای تصحیح و توسط دبیران انجام می پذیرد.

با توجه به اینکه کیفیت سوالات و نحوه­ی دقت عمل مصححان، نمرات دانش آموزان را متأثر می­سازند، لذا بررسی این امتحانات از جنبه­های مذکور از اهمیت خاصی برخوردار است. در بسیاری از تحقیقات، آزمون­های عینی[8]مورد تجزیه و تحلیل قرار گرفته­اند و این خود گام بزرگی برای بهبود کیفیت این آزمون­ها بوده است. اما متأسفانه به آزمون­های ذهنی [9]و روش­های تحلیل و تصحیح آنها کمتر توجه شده است. بنابراین انجام چنین تحقیقی کاملاً احساس می­شود.

     نتایج حاصل از این پژوهش با استفاده از نظریه پرسش پاسخ می­تواند به ارتقاء کیفیت سوالات آزمون، کاهش دغدغه­ی دانش­آموزان در خصوص کفایت و منصفانه بودن سوالات آزمون کمک کند. همچنین، با تکیه بر GT می­توان منابع مختلفی از خطا را به طور همزمان در نظر گرفت و به دنبال آن برآورد دقیق­تری از ضریب اعتبار امتحانات­نهایی به دست آورد و از آن جا که طرح سوال و روند تصحیح مستلزم صرف هزینه و زمان است با کمک نتایج به دست آمده از GT می­توان ترکیب مناسبی از سوال و مصحح را با توجه به اندازه اعتبار مورد نظر، به دست آورد و با در نظر گرفتن دیگر محدودیت­های عملی، طرح اندازه­گیری مطلوبی برای این امتحانات طراحی کرد.

همچنین، اطلاع یافتن از وضعیت تصحیح امتحانات­نهایی می­تواند به برنامه­ریزان و عوامل اجرایی حوزه­ی تصحیح در جهت برطرف کردن نقاط ضعف و تثبیت نقاط قوت روند تصحیح به منظور ارتقاء کیفیت تصحیح کمک کند تا تصمیمات درست­تر و دقیق­تری در خصوص عملکرد دانش­آموزان به منظور حفظ حقوق آن­ها گرفته شود. در مجموع، این پژوهش به افزایش دانش سنجش و اندازه­گیری در سطح وزارت آموزش و پرورش کمک می­کند.

تعاریف واژه ها و اصطلاحات

     نظریه کلاسیک اندازه گیری: این نظریه برای کمی­سازی خطاهای اندازه­گیری بوجود آمده است و به ما می­گوید که تا چه حد می­توان به نمرات به دست آمده از آزمون اعتماد کرد. این نظریه اساساً در ارتباط با اعتبار آزمون است.

نظریه پرسش- پاسخ: خانواده ای از مدل­های ریاضی است که برای تبیین رابطه تابعی بین یک صفت یا ویژگی مکنون که غالباً توانایی است با احتمال پاسخ صحیح به سوال مورد استفاده قرار می­گیرند(جزوه کلاسی فلسفی نژاد، 1391).

نظریه تعمیم­پذیری: نظریه تعمیم­پذیری تأکید بر تفکر چند­وجهی اعتبار، مدل تحلیل مؤلفه­های واریانس، و نظریه تصمیم­گیری دارد و به گونه کلی بیان می­کند که نتایج حاصل از یک رشته مشاهده( مثلاً نمره شخص در یک تست) را تا چه حد می توان تحت شرایط معینی به سلسله مشاهده­های دیگری از همان جامعه تعمیم داد(هومن،1384، ص225).

روایی : روایی اشاره به مناسب، با معنا، و مفید بودن استنباط ها و کاربرد­های خاصی دارد که از روی   نمرات مشاهده شده آزمون به عمل می­آید. تأیید این گونه استنباط­ها و کاربرد­ها، مستلزم جمع­آوری انواع متفاوتی از شواهد است.

اعتبار : اعتبار فرایند کمی­سازی خطاست و یک مفهوم کلی برای نامیدن مجموعه­ای از ویژگی­هاست و اشاره دارد به اینکه یک آزمون تا چه حد دقیق و حساس است و نتایج آن ثبات دارد و تکرار­پذیر          می­باشد(جزوه کلاسی فلسفی نژاد، 1391).

امتحانات­نهایی : منظور از امتحانات­نهایی در این پژوهش، امتحانات سال سوم مقطع متوسطه است که بصورت همزمان در سراسر کشور برگزار می­شود.

ضریب تعمیم­پذیری[10] : ضریب تعمیم­پذیری(G) زمانی به کار می­رود که تصمیم­ها نسبی هستند. این ضریب، همه منابع خطایی که جایگاه نسبی افراد را تحت تأثیر قرار می­دهد را در بر­می­گیرد.

شاخص اتکاپذیری[11] : شاخص اتکا­پذیری ( ) برای تصمیم­های مطلق به کار می­رود. این شاخص،      همه­ی مؤلفه­های واریانس به غیر از هدف اندازه­گیری[12] را در بر می­گیرد.

محتوا : مجموعه­ای از اصول، مفاهیم و مهارت­هایی است که از سوی برنامه­ریزان درسی بر اساس    هدف­های آموزشی معین، تهیه و تنظیم می­شود.

تحلیل محتوا : روش مطالعه و تجزیه و تحلیل ارتباط­ها به شیوه نظامدار، عینی و کمی برای اندازه­گیری متغیر­هاست( کرلینجر، 1986، ترجمه ی شریفی، 1388، ص 223).

عملکرد دانش­آموزان : نتایج امتحانات نهایی دانش­آمورزان در دو درس ادبیات­فارسی و زیست­شناسی در خرداد ماه 90 می­باشد.

1. Delores

2. Unesco

1. validity

[4]. reliability

[5]. classical test theory

[6]. generalizability theory

5. item response theory

[8]. objective tests

[9]. subjective tests

[10]. generalizability coefficient

[11]. index of dependability

[12]. object of measurement

همه پایان نامه و تحقیق و پروژه های به صورت فایل دانلودی می باشند و شما به محض پرداخت آنلاین مبلغ همان لحظه قادر به دریافت فایل خواهید بود. این عملیات کاملاً خودکار بوده و توسط سیستم انجام می پذیرد. ضمنا همان لحظه لینک دانلود به ایمیل شما ارسال می گردد.

 جهت پرداخت مبلغ شما به درگاه پرداخت یکی از بانک ها منتقل خواهید شد، برای پرداخت آنلاین از درگاه بانک این بانک ها، حتماً نیاز نیست که شما شماره کارت همان بانک را داشته باشید و بلکه شما میتوانید از طریق همه کارت های عضو شبکه بانکی، مبلغ  را پرداخت نمایید

مطالب پیشنهادی:
برچسب ها : , , , , , , , , , , , , , , ,
برای ثبت نظر خود کلیک کنید ...

به راهنمایی نیاز دارید؟ کلیک کنید

جستجو پیشرفته

دسته‌ها

آخرین بروز رسانی

    Fatal error: Call to undefined function jdate() in /home/bmaghale/domains/bmaghale.ir/public_html/wp-content/themes/digitaliran5/sidebar.php on line 122