باحثون يكافحون أوهام الذكاء الاصطناعي في الرياضيات: اكتشافات جديدة تثير الدهشة!
استفاد الباحثون في جامعة بيركلي من حقيقة أن ChatGPT، مثل البشر، يتسم بالتقلب. طلبوا من ChatGPT الإجابة على نفس مسألة الرياضيات 10 مرات متتالية. لقد فوجئت بأن آلة قد تجيب على نفس السؤال بطرق مختلفة، لكن هذا ما تفعله نماذج اللغة الكبيرة. غالبًا ما كانت العملية خطوة بخطوة والإجابة هي نفسها، لكن الصياغة الدقيقة اختلفت. أحيانًا كانت الطرق غريبة والنتائج خاطئة تمامًا. (انظر مثالاً في الصورة أدناه.)
قام الباحثون بتجميع الإجابات المتشابهة معًا. عندما قاموا بتقييم دقة أكثر الإجابات شيوعًا بين الحلول العشرة، كان أداء ChatGPT مذهلاً. بالنسبة للجبر الأساسي في المدرسة الثانوية، انخفض معدل الخطأ للذكاء الاصطناعي من 25% إلى صفر. بالنسبة للجبر المتوسط، انخفض معدل الخطأ من 47% إلى 2%. أما بالنسبة لجبر الكلية، فقد انخفض المعدل من 27% إلى 2%.
أجاب ChatGPT على نفس سؤال الجبر ثلاث طرق مختلفة، لكنه توصل إلى الاستجابة الصحيحة سبع مرات من أصل عشر في هذا المثال.
ومع ذلك، عندما طبق العلماء هذه الطريقة التي يسمونها “الاتساق الذاتي”، لم تنجح بنفس القدر عند التعامل مع الإحصائيات؛ حيث انخفض معدل خطأ ChatGPT من 29% إلى 13% ولكن لا يزال أكثر من واحد من كل عشرة إجابات كان خاطئاً. أعتقد أن هذه نسبة عالية جداً للطلاب الذين يتعلمون الرياضيات.
السؤال الكبير هو بالطبع ما إذا كانت حلول ChatGPT تساعد الطلاب على تعلم الرياضيات بشكل أفضل مقارنة بالتعليم التقليدي أم لا؟ في الجزء الثاني من هذه الدراسة ، قام الباحثون بتجنيد حوالي274 بالغاً عبر الإنترنت لحل مسائل رياضية وخصصوا عشوائيًا ثلثهم لرؤية حلول ChatGPT كـ “تلميح” إذا احتاجوا لذلك (تم إزالة إجابات ChatGPT الخاطئة أولاً). بعد اختبار قصير لاحقاً ، تحسن هؤلاء البالغين بنسبة17 % مقارنة بأقل من12 % مكاسب تعليمية للبالغين الذين تمكنوا فقط رؤية مجموعة مختلفة من التلميحات المكتوبة بواسطة مدرسين رياضيين جامعيين . أولئك الذين لم يُعرض عليهم أي تلميحات حصلوا تقريباً على نفس الدرجات في الاختبار اللاحق كما فعلوا في الاختبار السابق.
هذه النتائج التعليمية المثيرة للإعجاب لـChatGPT دفعت مؤلفي الدراسة للتنبؤ بجرأة بأن “التوليد المستقل تمامًا” لنظام تدريس آلي فعال هو “على الأبواب”. نظريًا ، يمكن لـChatGPT هضم فصل دراسي أو محاضرة فيديو بسرعة ثم يعود فوراً لتدريب طالب عليه.
قبل أن أحتضن هذا التفاؤل ، أرغب في معرفة مدى استخدام الطلاب الحقيقيين – وليس فقط البالغين المجندين عبر الإنترنت – لهذه الأنظمة التعليمية الآلية . حتى في هذه الدراسة حيث تم دفع البالغين لحل مسائل رياضية ، لم يكمل120 شخصا تقريباً ممن شاركوا والبالغ عددهم حوالي400 العمل وبالتالي كان يجب إلغاء نتائجهم . بالنسبة للكثيرمن الأطفال وخاصة الطلاب الذين يواجهون صعوبةفي مادة معينة < spanstyle = " font-weight :400 "> التعلممن الكمبيوتر ليس جذابا span > a >< spanstyle = " font-weight :400 "> . span > p>
< i >< spanstyle = " font-weight :400 "> كتبت هذه القصة عن span > i >< a href =" https://hechingerreport.org/proof-points-combat-ai-hallucinations-math/"> < i >< spanstyle = " font-weight :400 "> هلوسات الذكاء الاصطناعي span > i > a >< i >< spanstyle = " font-weight :400 "> بواسطة جيل بارشاي وتم إنتاجها بواسطة span > i > < a href =" https://hechingerreport.org/special-reports/higher-education/"> < i >< spans tyle = " font-w eight :300 "> تقرير هيشنجر spans > /i >
منظمة إخبارية غير ربحية ومستقلة تركز على عدم المساواة والابتكارفي التعليم . اشترك للحصولعلى
نقاط الإثبات
وغيرهامن
نشرات هيشنجر
.