طراحی و کاربرد روش سنجش انطباقی کامپیوتری برای اجرای آزمون تولیمو در سازمان سنجش آموزش کشور

سال انتشار: 1399
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 472

فایل این مقاله در 84 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_JRESE-10-29_003

تاریخ نمایه سازی: 11 تیر 1399

چکیده مقاله:

سنجش مهارت زبان انگلیسی در ارزیابی های خطیر به تعداد زیادی پرسش برای آزمون هایی به شیوه مداد-کاغذی (P&P) نیاز دارد؛ زیرا هر سال افراد بسیاری در این نوع آزمون های سرنوشت ساز شرکت می کنند. هدف از اجرای این پژوهش، طراحی و کاربرد سنجش انطباقی کامپیوتری (CAT) به عنوان گزینه ای برای سنجش مهارت زبان انگلیسی در سازمان سنجش آموزش کشور بود. CAT برخلاف آزمون های سنتی P&P که توالی گزینش پرسش ها در آن ثابت و یکنواخت است، از یک شیوه گزینش سوال بهینه و انطباقی استفاده می کند. CAT، برآورد توانایی موقت را به طور بهینه مورد هدف قرار می دهد و به یک ملاک همگرایی مناسب برای برآورد توانایی می رسد و در نتیجه، به یک فرایند سنجش کوتاه تر، قابل اطمینان تر و کارآمدتر می رسد. مورد مطالعه مهارت زبان انگلیسی در مطالعه حاضر، آزمون تولیمو است. این پژوهش در دو مرحله اجرا شده است: در مرحله اول، نمونه ای از اجراهای مداد-کاغذی آزمون تولیمو (دوره 114 تا 123)، انتخاب و سپس، سوال ها و توانایی آزمودنی ها مدرج سازی شد. در مرحله دوم، CATهای بهینه شبیه سازی شده به عنوان مبنایی برای ارزیابی صحت و کارایی CAT عملیاتی طراحی شدند. نتایج پژوهش نشان داد که برآورد پارامتر توانایی به روش بیشینه درست نمایی و ملاک توقف طول ثابت، بیشترین دقت در برآورد پارامتر توانایی آزمودنی ها را ایجاد می کنند. همچنین، آزمون CAT تولیمو که بر اساس خزانه سوال بهینه شبیه سازی شدند، نسبت به CAT عملیاتی که بر اساس خزانه سوال موجود طراحی شده است، به سوال های کمتری نیاز دارد، درحالی که به نتایج دقیق تری نسبت به CAT عملیاتی در برآورد پارامتر توانایی منجر می شود. بنابراین، باوجود مناسب بودن سوال های موجود در خزانه سوال مدرج سازی شده آزمون تولیمو، طراحی سوال هایی برای هدف اجرای آزمون به شیوه CAT، هم به صرفه تر است و هم دقیق تر پارامتر توانایی را برآورد می کند. همچنین، نتایج این مطالعه نشان داد که آزمون تولیمو هم به شیوه CAT شبیه سازی شده و CAT عملیاتی طراحی شده به شکلی کارآتر و دقیق تر نسبت به تولیمو مداد-کاغذی عمل می کند. یافته های این پژوهش، نشان می دهد که آزمون CAT تولیمو دارای پتانسیل بالایی در کارایی و دقت اندازه گیری توانایی زبان انگلیسی است.

کلیدواژه ها:

سنجش انطباقی کامپیوتری (CAT) ، آزمون تولیمو ، برآورد پارامتر توانایی ، خزانه سوال ، تعادل محتوایی و مواجهه سوال

نویسندگان

مریم مقدسین

استادیار گروه روان شناسی بالینی، دانشکده روان شناسی و علوم تربیتی، دانشگاه خوارزمی، تهران، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • تعیین مقایسه پذیری برآورد پارامتر توانایی در سنجش انطباقی کامپیوتری و مداد-کاغذی [مقاله ژورنالی]
  • تلفیق رویکرد ریکیسی و رویکرد برنامه نویسی ریاضی در طراحی خزانه های سوال بهینه برای سنجش انطباقی کامپیوتری [مقاله ژورنالی]
  • مقدسین، مریم؛ فلسفی نژاد، محمدرضا؛ دلاور، علی؛ جمالی، احسان؛ و ...
  • مینایی، اصغر؛ و فلسفی نژاد، محمدرضا (1389). روش های سنجش ... [مقاله ژورنالی]
  • Babcock, B., & Weiss, D. J. (2009). Termination criteria in ...
  • Barrada, J., Olea, J., Ponsada, V., Abad, F., Ponsoda, V., ...
  • Bergstrom, B. A., & Lunz, M. E. (1999). CAT for ...
  • Boyd, A. M., Dodd, B., & Fitzpatrick, S. (2013). A ...
  • Boyd, A. M., Dodd, B. G., & Choi, S. W. ...
  • Boyd, A. M. (2003). Strategies for controlling testlet exposure rates ...
  • Brooke, A., Kendrick, D., & Meeraus, A. (1988). GAMS: A ...
  • Chaimongkol, N., Pasiphol, S., & Kanjanawasee, S. (2016). Computerized Adaptive ...
  • Chalhoub-Deville (Ed.). Issues in computer-adaptive testing of reading proficiency. Cambridge: ...
  • Chang, H. H. (2004). Understanding computerized adaptive testing: From Robbins-Monro ...
  • Chang, H. H. (2014). Psychometrics behind computerized adaptive testing. Psychometrika. ...
  • Chang, H. H. (2015). Psychometrics behind computerized adaptive testing. Psychometrika, ...
  • Chang, S. W., & Twu, B. Y. (1998). A Comparative ...
  • Chang, Y. C. I., & Ying, Z. (2004). Sequential estimation ...
  • Chang, H. H., & Ying, Z. (1999). Alpha-stratified multistage computerized ...
  • Chang, H. H., & van der Linden, W. J. (2003). ...
  • Cheng, Y., & Chang, H. (2009). The maximum priority index ...
  • Chen, S. Y., Ankenmann, R. D., & Spray, J. A. ...
  • Chen, W. H., & Thissen, D. (1997). Local dependence indexes ...
  • Choi, S. W., Grady, M. W., & Dodd, B. G. ...
  • Christensen, K. B., Makransky, G., & Horton, M. (2017). Critical ...
  • CITO (1999). WISCAT. Een computergestuurd toetspakket voor rekenen en wiskunde. ...
  • CITO (2002). NT2cat. Een computergestuurd toetspakket voor Nederlands als tweede ...
  • CITO (2008). TURCAT. Een computergestuurd toetspakket voor Turks als tweede ...
  • Davey, T., & Nering, M. (2002). Controlling item exposure and ...
  • Davis, L. L. (2002). Strategies for controlling item exposure in computerized ...
  • De Ayala, R. J. (2009). The theory and practice of ...
  • Dodd, B. G., Koch, W. R., & De Ayala, R. ...
  • Dunkel, P. (1999). Research and development of a computer-adaptive test ...
  • Eggen, T. J. H. M. (2004). CATs for kids: easy ...
  • Flaugher, R. (2000). Item pools. In H. Wainer (Ed.), Computerized ...
  • French, B. F., & Thompson, T. D. (2003). The evaluation ...
  • Gardner, W., Shear, K., Kelleher, K. J., Pajer, K. A., ...
  • Georgiadou, E. G., Triantafillou, E., & Economides, A. A. (2007). ...
  • Gu, L. (2007). Designing optimal item pools for computerized adaptive ...
  • Gu, L. & Reckase, M. D. (2007). Designing optimal item ...
  • Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). ...
  • Han, K. T. (2012). An efficiency balanced information criterion for ...
  • Han, K. T. (2011). User’s manual: SimulCAT. Retrieved March, 1, 2013. ...
  • Hau, K. T., & Chang, H. H. (2001). Item selection ...
  • He, W., & Reckase, M.  (2010). Optimal item pool design ...
  • Kanjanawasee, S. (2012). Modern Test Theory (Ed.4). Bangkok: Chulalongkorn University ...
  • Kaya-Carton, E., Carton, A. S., & Dandonoli, P. (1991). Developing ...
  • Kalender, İ. (2011). Effects of different computerized adaptive testing strategies ...
  • Laufer, B., & Goldstein, Z. (2004). Testing vocabulary knowledge: Size, ...
  • Leung, C. K., Chang, H. H., & Hau, K. T. ...
  • Kingsbury, G. G., & Zara, A. R. (1989). Procedures for ...
  • Lee, H., & Dodd, B. G. (2012). Comparison of exposure ...
  • Madsen, H. S. (1991). Computer-adaptive testing of listening and reading ...
  • McBride, J. R., & Weiss, D. J. (1976). Some properties ...
  • Millman, J., & Arter, J. A. (1984). Issues in item ...
  • National Council of State Boards of Nursing, & National Council ...
  • Ozturk, N. B., & Dogan, N. (2015). Investigating Item Exposure ...
  • Owen, R. J. (1975). A Bayesian sequential procedure for quantal ...
  • Parshall, C. G., Spray, J. A., Kalohn, J. C., & ...
  • Phankokkruad, M. (2012). Association Rules for Data Mining in Item ...
  • Reckase, M. D. (1989). Adaptive testing: The evolution of a ...
  • Reckase, M. D. (2003). Item pool design for computerized adaptive ...
  • Reckase, M. D., & He, W. (2004). The ideal item ...
  • Reckase, M. D., & He, W. (2005). Ideal item pool ...
  • Reckase, M. D. (2007). The design of p-optimal item bank ...
  • Reckase, M. D. (2009). Optimal Item Pool Design for the ...
  • Reckase, M. D., & He, W. (2009a). Optimal item pool ...
  • Reckase, M. D., & He, W. (2009b). The influence of ...
  • Reckase, M. D. (2010). Designing Item Pools to Optimize the ...
  • Revuelta, J., & Ponsoda, V. (1998). A comparison of item ...
  • Rudner, L. M. (2010). Implementing the Graduate Management Admission Test ...
  • Stocking, M. L., Swanson, L., & Pearlman, M. (1993). Application ...
  • Sympson, J. B., & Hetter, R. D. (1985, October). Controlling ...
  • Tseng, W. T. (2016). Measuring English vocabulary size via computerized ...
  • Van der Linden, W. J., Scrams, D. J., & Schnipke, ...
  • Van der Linden, W. J., & Glas, C.A.W. (2000). Computerized ...
  • Van der Linden, W. J., & Pashley, P. J. (2010). ...
  • Veldkamp, B. P, Vershoor, A. J., Eggen, T. J. (2007). ...
  • Verschoor, A. J., & Straetmans, G. J. J. N. (2000). ...
  • Vispoel, W. P. (1993). Computerized adaptive and fixed-item versions of ...
  • Vispoel, W. P. (1998). Psychometric characteristics of computer-adaptive and self ...
  • Vispoel, W. P., Rocklin, T. R., & Wang, T. (1994). ...
  • Wainer, H., Dorans, N. J., Flaugher, R., Green, B. F., ...
  • Wainer, H., Dorans, N. J., Eignor, D., Flaugher, R., Green, ...
  • Wang, H. P., Kuo, B. C., Chao, R. C., & ...
  • Yen, W. M. (1984). Effects of local item dependence on ...
  • Zheng, Y., & Chang, H. H. (2015). On-the-fly assembled multistage ...
  • نمایش کامل مراجع