0% Complete
صفحه اصلی
/
نوزدهمین کنفرانس ملی و سیزدهمین کنفرانس بین المللی یادگیری و یاددهی الکترونیکی ایران
گمراه کردن مدل های زبانی بزرگ در سیستم های نمره دهی خودکار
نویسندگان :
سجاد نوریان
1
آزاده سلطانی
2
1- دانشگاه بجنورد
2- دانشگاه بجنورد
کلمات کلیدی :
مدل های زبانی بزرگ،هوش مصنوعی،فریب دادن،نمره دهی خودکار
چکیده :
سامانههای نمرهدهی خودکار در سالهای اخیر به ابزارهایی مهم برای تسریع و استانداردسازی ارزیابی تبدیل شدهاند. این سامانهها با تکیه بر مدلهای زبانی بزرگ دقت بالایی در تصحیح پاسخهای دانشجویان به دست آوردهاند، اما همچنان مسئله اعتمادپذیری و عدالت در نمرهدهی از چالشهای اصلی آنهاست. حساسیت این مدلها به تغییرات ظاهری یا محتوای غیرمرتبط میتواند موجب نمرهدهی نادرست شود و بررسی مقاومت آنها در برابر این نوع حملات ضروری است. این پژوهش مقاومت چهار مدل GPT-OSS 120B, GPT-OSS 20B, DeepSeek V3.1, Qwen3vl-235B-A22B-thinkingرا در برابر دو نوع حمله متنی شامل تغییر زمینه مسئله و جملات عاطفی ارزیابی میکند. برای هر نوع حمله ده اجرای مستقل انجام شد و حافظه مدلها پس از هر بار اجرا پاکسازی گردید تا نتایج تحت تأثیر اجراهای قبلی قرار نگیرد. یافتهها نشان میدهد حملات مبتنی بر بازتعریف مسئله بیشترین میزان اثرگذاری را ایجاد میکنند و میتوانند روند استدلال مدل را تغییردهند. در نتیجه نهایی، مدل Qwen3 بیشترین آسیبپذیری را نشان داد، در حالی کهDeepSeek V3.1 پایدارترین عملکرد را ارائه کرد. این نتایج تأکید میکند که استفاده از مدلهای زبانی به عنوان مصحح، بدون نظارت انسانی همچنان با چالش نمرهدهی ناعادلانه همراه است.
لیست مقالات
لیست مقالات بایگانی شده
گزارش یک تجربه موفق : آموزش ابزارهای آزمون ساز مبتنی بر هوش مصنوعی در دانشجویان مقطع کارشناسی رشته بهداشت مدارس دانشگاه علوم پزشکی جندی شاپور اهواز در سال 1403
بهاره قوامی حسین پور
ابعاد پشتیبانی یادگیری الکترونیکی با قابلیت های هوش مصنوعی در آموزش سازمانی
عطا برزگری - فرهاد سراجی
ارزشیابی کیفیت تدریس تلویزیونی درس ریاضی پایه پنجم ابتدایی از دیدگاه متخصصان آموزش
کیومرث تقی پور - پریا برزگر
یادگیری انسانی در عصر پستدیجیتال: تحول سوژه، نهاد و آموزش در جامعۀ ایران
حامد طاهری کیا
Promoting Learner Engagement and Enhancing Willingness to Communicate: A Project-based VR-assisted Course
S. Susan Marandi - Fatemeh Saneie Kashanifar
Design and Development of Virtual Reality-based IELTS Speaking Module Simulator
S. Susan Marandi - Maryam Safdari - Tricia Thrasher
طراحی مقیاس کیفیت آموزش مجازی آنلاین در آموزش عالی استان خوزستان
عاطفه دریکوند - غلام حسین رحیمی دوست - مجبتی جهانی فر
مطالعه تطبیقی مولفههای تضمین کیفیت در آموزش عالی جهان و ارائه چهارچوب پیشنهادی به منظور ارتقای کیفیت در نظام آموزش عالی ایران
رحیم مرادی
Comparative Analysis of Artificial Intelligence Integration in the Educational Systems of China and the United States (2025)
Zahra Habibi - Saman Pirehbabi - Roghayeh Gavagsaz-Ghoachani - Matheepot Phattanasak
Investigation of Teachers' Use of Information Technology in the Enhanced Learning-Teaching Process of Tenth-Grade Students (Case Study: Shahed Nadjmieh Girls' Vocational School)
Mehrshad Khosraviani - Zahra Shams - Mohammadreza Abbassian
بیشتر
ثمین همایش، سامانه مدیریت کنفرانس ها و جشنواره ها - نگارش 44.0.6