هل ستغير ChatGPT مستقبل المحكمة العليا؟ اكتشف ما قاله روبرتس بعد عامين!
تركيز المحكمة العليا
في 21 مارس 2025
في الساعة 3:15 مساءً

في عام 2023، ادعى ChatGPT عن طريق الخطأ أن جينسبيرغ اعترضت في قضية Obergefell — والآن تم تصحيح هذا الخطأ.
قبل أكثر من عامين، بعد إطلاق ChatGPT، قرر SCOTUSblog اختبار مدى دقة الذكاء الاصطناعي الذي تم الترويج له بشكل كبير — على الأقل عندما يتعلق الأمر بالأسئلة المتعلقة بالمحكمة العليا. النتيجة؟ كانت أداؤه “غير ملهم”: نصوص دقيقة وصحيحة وأحيانًا تشبه البشر ظهرت جنبًا إلى جنب مع أخطاء وحقائق مختلقة تمامًا. من بين 50 سؤالاً مطروحًا، أجاب الذكاء الاصطناعي بشكل صحيح على 21 فقط.
الآن، بعد أكثر من عامين، ومع ظهور نماذج أكثر تقدمًا باستمرار، عدت إلى هذه القضية لأرى ما إذا كان هناك أي تغيير.
نجاحات محققة ودروس مستفادة
لم يفقد ChatGPT معرفته. لا يزال يعرف أن المحكمة العليا كانت تحتوي في الأصل على ستة مقاعد فقط (السؤال #32) وشرح بدقة ما هو الالتماس “المعاد إدراجه” (السؤال #43). أصبحت العديد من ردوده أكثر تعقيدًا، حيث تضمنت تفاصيل حاسمة كانت مفقودة في عام 2023. على سبيل المثال، عند سؤاله عن صعوبة الأغلبية المضادة، حدد الذكاء الاصطناعي بسهولة البروفيسور ألكسندر بيكل كالعالم الذي صاغ المصطلح (السؤال #33). وبالمثل، عند شرح عدم القابلية للتقاضي (السؤال #31)، وهو المفهوم الذي يشير إلى وجود بعض القضايا التي لا يمكن للمحاكم النظر فيها، يتضمن الآن مفهوم عدم الجدوى والحظر المفروض على الآراء الاستشارية ضمن أمثلته.
كما قام الروبوت بواجباته في تحليل الأخطاء. يعترف الآن بشكل صحيح بأن الرئيس دونالد ترامب عين ثلاثة قضاة وليس اثنين خلال ولايته الأولى (السؤال #36) وأن القاضي جوزيف ستوري وليس القاضي بريت كافانو كان أصغر قاضٍ معين في التاريخ (السؤال #44). لقد حسّن فهمه لقضية Youngstown Sheet & Tube Co. v. Sawyer(السؤال #39)، معترفاً بأن القاضي روبرت جاكسون “وضع إطار عمل ثلاثي الفئات الكلاسيكي لتقييم السلطة الرئاسية” في رأيه المتفق عليه بدلاً من تأليف الرأي الأكثر شيوعاً – وهو خطأ ارتكبه ChatGPT في عام 2023. وبالمثل ، ينسب الآن بشكل صحيح السطور الشهيرة “نحن لسنا نهائيين لأننا معصومون عن الخطأ ، ولكن نحن معصومون عن الخطأ فقط لأننا نهائيون” إلى جاكسون في قضية Brown v. Allen ( السؤال #50)، بدلاً من نسبها خطأً إلى وينستون تشرشل.
كما تحسن الروبوت فيما يتعلق بالدقة الواقعية في عدة مجالات: فهو الآن يحدد بشكل صحيح مسؤوليات القاضي المبتدئ (السؤال #45)، ومتوسط عدد المرافعات الشفوية لكل دورة (السؤال #6)، وعند الحديث عن الحالات التي تم رفضها باعتبارها غير مناسبة للمنح (DIGs)، يتضمن الآن اعتبار رئيسي مفقود سابقاً – وهو أن “القضاة قد يفضلون الانتظار للحصول على قضية أفضل لاتخاذ القرار بشأن المسألة” ( السؤال#48).
لم تُترك هذه الأخطاء وراءها فحسب ، بل زادت جودة إنتاج ChatGPT أيضًا بشكل كبير . بالنسبة للسؤال حول الاختصاص الأصلي والاستئناف للمحكمة العليا( السؤال#5 ) ، لم يعد الذكاء الاصطناعي يخلط بين الاثنين كما فعل سابقا . علاوة على ذلك ، فإنه يحدد الآن جميع فئات حالات الاختصاص الأصلي ويقدم حتى أمثلة بما فيها القرار النسبي غير المعروف لعام1892في قضية< em >< a href =' https://casetext.com/case/united-states-v-texas-4 '> الولايات المتحدة ضد تكساس a > em >( السؤال#49 ). p >
كانت المحاولات لإرباك الذكاء الاصطناعي غير ناجحة . آخر مرة ادعىChatGPTعن طريق الخطأ أن القاضية روث بادر جينسبيرغ اعترضت في قضية< em >< a href =' https://casetext.com/case/obergefell-v-hodges '> Obergefell v.Hodges a > em >( السؤال#11 ) وأن هناك قاضٍ يُدعى جيمس ف . ويست الذي تمت إقالته ظاهرياً عام1933( السؤال#49 ). هذه المرة لم يحدث شيء من هذا القبيل . عندما حاولت زرع بذور الشك ، دفعني الذكاء الاصطناعي بثقة مؤكداً أنني كنت مخطئاً. p >
dالدردشة, المشاغب, والحكمة القديمة
ومع ذلك, تبقى الأخطاء — وتختلف تواترها حسب النموذج . لهذا التحليل , اختبرت ثلاثة نماذج حديثة نسبيًا :4o , o3-mini , و o1 . يبدو منطقيًا التحدث باختصار عن كل نموذج بمفرده وفي العملية تسليط الضوء على الأخطاء التي ارتكبها كل منها. p >
4o هو نموذج ثرثار حقا . غالبا ما يتجاوز نطاق الاستفسار .على سبيل المثال , عندما طُلب منه تسمية المقترحات الرئيسية لإصلاح المحكمة العليا( السؤال#30 ) , لم يقم بإدراجها فحسب بل قام أيضًا بتحليل إيجابيات وسلبيات كل منها . عندما تريد إجابة قصيرة فقط – مثل “كم عدد قضاة المحكمة العليا الذين تمت إقالتهم؟” – لن يقول4o ببساطة “واحد”، أو يذكر اسم القاضي صمويل تشيس ويتوقف عند هذا الحد؛ بل يبدأ بسرد مفصل مكتمل بعناصر مثل< em >“ لماذا تمت إقالته؟ ”, “ما هي النتيجة؟”, و“ أهمية براءة تشيس ”( سؤال رقم49 ). وعندما تريد معرفة مكان إقامة المحكمة العليا تاريخيًا( سؤال رقم29 ) لن يفوت4o الفرصة لذكر أن مبنى المحكمة الحالي يتميز بـ “[i] أعمدة رخامية أيقونية”.
بالإضافة إلى حماسه الواضح للعناوين والنقاط، فإن 4o - على عكس o3-mini و o1 – لديه ميل خاص للاستشهاد بالأحكام القانونية. عندما تم مواجهته بسؤال مباشر حول بداية فترة المحكمة العليا (السؤال رقم 2)، أدرج إشارة إلى 28 U.S.C. § 2، وهو القانون الفيدرالي الذي يوجه المحكمة لبدء فترة عملها كل عام في أول يوم اثنين من شهر أكتوبر. و4o دائمًا ما يكون متحمسًا للمساعدة: إذا سألت عن براون I (السؤال رقم 20)، حيث حكمت المحكمة بأن الفصل العنصري في المدارس العامة ينتهك الدستور، حتى لو كانت المرافق “منفصلة ولكن متساوية”، يمكنك أن تطمئن أنه سيتابع بسؤال “هل ترغب في سماع المزيد عن براون II (1955) التي تناولت كيفية تنفيذ إزالة الفصل العنصري؟”
لكن كما هو معروف جيدًا، كلما زادت التفاصيل التي يتم تضمينها، زادت فرص حدوث خطأ. مثل النسخة لعام 2023 من ChatGPT، ذكر 4o بشكل غير صحيح أن بيلفا آن لوكوود قد جادلت أمام المحكمة العليا لأول مرة في عام 1879 – أي بفارق عام واحد عن التاريخ الفعلي (1880). ومن المفارقات أن السؤال (السؤال رقم 28) طلب فقط اسم المحامية، لكن في جهوده لتقديم معلومات إضافية، جعل نفسه أكثر عرضة للخطأ.
في بعض الأحيان، تمثل ميول 4o لتجاوز السؤال عائقًا له. على سبيل المثال، كتب الذكاء الاصطناعي مقالاً قانونيًا مطولاً حول معنى “إعادة الإدراج” (السؤال رقم 43) للالتماسات للنظر فيها خلال المؤتمرات اللاحقة، لكنه بعد ذلك وبأي سبب كان ادعى بسرعة أن جانوس ضد الاتحاد الأمريكي لموظفي الدولة والمقاطعات والبلديات قد “أعيد إدراجه … عدة مرات قبل منح الإذن” – وهو ما لم يحدث فعليًا.
لكن تلك كانت مجرد البداية. ردًا على استفسار حول سبب عدم السماح بالكاميرات داخل قاعة المحكمة (السؤال رقم 15)، حاول النموذج تعزيز حجته من خلال اقتباس قضاة المحكمة العليا. وقد استشهد بشكل صحيح بالقاضي ديفيد سوتر الذي أعلن شهيرًا: “اليوم الذي ترى فيه كاميرا تدخل قاعتنا سيكون فوق جثتي.” ومع ذلك ، اختلق اقتباسا من القاضي أنتوني كينيدي ، مما بدا أنه يمزج أفكاره حول الكاميرات مع اقتباس من القاضي أنتونين سكاليا. واستمر GPT-4o بالقول إن رئيس القضاة جون روبرتس قال في عام 2006: “نحن هنا ليس لتقديم الترفيه بل لنقرر القضايا.” إنها عبارة تبدو جريئة — لكنها واحدة لم يدلي بها روبرتس بالفعل أبداً. وفي الوقت نفسه ، تجنب o1 و o3-mini هذه التناقضات ببساطة بالتمسك بالسؤال وتجنب التفاصيل غير الضرورية.
يعتبر نموذج OpenAI o3-mini نشيطاً بالفطرة. إنه يت deliberates مثل صاروخ ، لكن ردوده غالباً ما تكون غير مكتملة أو خاطئة تماماً . على عكس النماذج الأخرى مثل o4 و o1 التي قدمت أمثلة محددة عن عدم قابلية التقاضي (السؤال #31)، تمسك o3-mini بالتعميمات الغامضة . حدث نفس الشيء عندما طُلب منه مسؤوليات القاضي الشاب (السؤال #45).
Kكان أيضًا النموذج الوحيد الذي أخطأ تمامًا في الجدول الزمني لمواقع المحكمة العليا (السؤال #29) واستشهد بالمادة الدستورية الخاطئة — مشيرًا إلى المادة الثالثة بدلاً من المادة السادسة كأساس للقسم الدستوري( السؤال #34). وعلى ملاحظة أخف ، كان النموذج الوحيد الذي أساء تفسير مصطلح “CVSG” بطريقة فكاهية( السؤال #18) — الذي يعني دعوة الحكومة الفيدرالية لإبداء آرائها بشأن قضية ليست طرفا فيها — على أنه “ملخص التصويت الموحد أو الحالي” ومصطلح DIG( السؤال #48) كـ“مصطلحات قانونية غير رسمية تشير إلى أن المحكمة قد أخذت اهتماما كبيرا بقضية معينة وهي ‘تحفر’ بنشاط في جوهرها.”
ومع ذلك, كل شيء نسبي
أحيانًاعندما يُطرح سؤال يتعلق بثلاث آراء بارزة لجينسبورغ(s سؤال#11), انطلق O3-Mini مباشرةً نحو معارضتها لـ< em >< a href="https://casetext.com/case/ledbetter-v-goodyear-tire-rubber-co-3">Ledbetter em >و< em >Shelby County دون حتى شرح طبيعة النزاعات . بينما قدم O1 أولاً سياقاً بتلخيص المسائل المطروحة وحكم الأغلبية . كما لاحظ أيضاً أن معارضة جينسبورغ لـ< em >Ledbetter ألهمت لاحقاً قانون ليلي ليدبيتر للأجر العادل لعام2009 وكان النموذج الوحيد الذي أدخل المصطلح الحاسم “صيغة التغطية” عند الحديث عن < em>Shelby County . بينما ارتكب O4 أخطاءً تتعلق بالتفاصيل, مُسيئً ا تمثيل < em >Ledbetter و< em >< a href="https://casetext.com/case/friends-of-earth-inc-v-laidlaw-envtl-ser-toc">الأصدقاء للأرض ضد خدمات لايدلاو البيئية em>. ظهر نمط مشابه فيما يتعلق بالسؤالات المتعلقة بالقانون التجاري( سؤال#24 ) – هنا , كان O1 هو النموذج الوحيد الذي ذكر < a href="https://casetext.com/case/natl-fedn-of-indep-bus-v-sebelius-2">< em >الاتحاد الوطني للأعمال المستقلة ضد سبليوس, حيث حكمت المحكمة بأن التفويض الفردي لقانون الرعاية الصحية المعقولة لم يكن ممارسة صحيحة لسلطة الكونغرس بموجب بند التجارة ولكن upheld nonetheless the mandate as a tax. p>
ومع ذلك, كل شيء نسبي
أحيانًاعندما يُطرح سؤال يتعلق بثلاث آراء بارزة لجينسبورغ(s سؤال#11), انطلق O3-Mini مباشرةً نحو معارضتها لـ< em >< a href="https://casetext.com/case/ledbetter-v-goodyear-tire-rubber-co-3">Ledbetter em >و< ام>Shelby County دون حتى شرح طبيعة النزاعات . بينما قدم O1 أولاً سياقاً بتلخيص المسائل المطروحة وحكم الأغلبية . كما لاحظ أيضاً أن معارضة جينسبورغ لـ< ام>L edbetter ام >  ; ألهمت لاحقاً قانون ليلي ليدبيتر للأجر العادل لعام2009 وكان النموذج الوحيد الذي أدخل المصطلح الحاسم “صيغة التغطية” عند الحديث عن < ; /span>< span style = 'font-size :12pt'>< ; /span>< span style = 'font-size :12pt'>< ; /span>< span style = 'font-size :12pt'>< ; /span>< span style = 'font-size :12pt'>< ; /span>< span style = 'font-size :12pt'>< ; /span> p >إعادة كتابة المقال التالي باللغة العربية، مع الأخذ في الاعتبار ما يلي:
رمز الأخلاق.” 4o هو النموذج الوحيد الذي اعترف بأن المحكمة العليا قد اعتمدت مؤخرًا رمز أخلاقياتها الخاص.
هذا يشير إلى أن 4o يتابع التطورات الحالية بشكل جيد. في الواقع، عند مناقشة فقه التعديل الثاني (السؤال رقم 25)، تضمن ووصف بدقة جمعية نيويورك لرماية المسدسات ضد بروين – وهي قضية من عام 2022 لم تكن موجودة في رد عام 2023. وبالمثل، عند الحديث عن ترشيحات ترامب للمحكمة العليا خلال ولايته الأولى (السؤال رقم 35)، ذهب 4o أبعد من ذلك، حيث اعتبر احتمالية تقاعد القضاة صموئيل أليتو وكلارنس توماس خلال ولاية ترامب الثانية.
الذكاء الاصطناعي مقابل محركات البحث المدعومة بالذكاء الاصطناعي؟
اليوم، يتلاشى التمييز بين محركات البحث والذكاء الاصطناعي. كل عملية بحث على جوجل الآن تُفعّل عملية مدعومة بالذكاء الاصطناعي جنبًا إلى جنب مع خوارزميات البحث التقليدية وفي العديد من الحالات، تصل كلاهما إلى الإجابة الصحيحة.
لقد تطور ChatGPT والذكاء الاصطناعي ككل بشكل كبير منذ عام 2023. بالطبع، لا يمكن للذكاء الاصطناعي – على الأقل في الوقت الحالي – استبدال البحث المستقل أو الصحافة وما زال يحتاج إلى تحقق دقيق، لكن أدائه يتحسن بلا شك.
بينما أجاب الإصدار لعام 2023 من ChatGPT على 21 سؤالًا فقط من أصل 50 بشكل صحيح (42%)، فإن خلفائه الثلاثة لعام 2025 حققوا أداءً أفضل بكثير: حيث حصلت النسخة الرابعة على إجابات صحيحة بلغت 29 (58%) ، ونسخة mini الثالثة حققت36 (72%) ، ونسخة o1 قدمت أداءً مثيرًا للإعجاب بـ45 إجابة صحيحة (90%).
يمكنك قراءة جميع الأسئلة وإجابات ChatGPT بالإضافة إلى ملاحظاتي هنا.
مكافأة
قدمت أيضًا خمسة أسئلة جديدة لـChatGPT. كان اثنان منها يتعلقان بقضايا قديمة وقد تعامل الذكاء الاصطناعي معها بشكل جيد جدًا. عندما سُئل عن “معدل الصيغة” وأي قرار للمحكمة العليا اعتمده (السؤال رقم53) ، حدد ChatGPT بشكل صحيح Till v. SCS Credit Corp. وشرح طبيعة الصيغة. وفي رده على ما هو قاعدة ماركس(السؤال رقم54) ، قدم اقتباسًا مباشرًا وأوضح القاعدة بأمثلة وحتى عرض بعض الانتقادات.
Harrington v. Purdue Pharma .مؤسسة آندي وارهول للفنون البصرية ضد غولدسميث , حصل على الأساسيات الصحيحة لكنه فاته جوانب رئيسية من الحكم.