الجريمة والقانون

هل ستغير ChatGPT مستقبل المحكمة العليا؟ اكتشف ما قاله روبرتس بعد عامين!

تركيز المحكمة العليا
لقطة ⁢شاشة ⁣من دردشة الذكاء الاصطناعي

في عام 2023، ادعى ChatGPT عن‍ طريق الخطأ أن جينسبيرغ اعترضت في قضية Obergefell – والآن تم تصحيح ‌هذا الخطأ.


قبل أكثر من عامين، بعد إطلاق ChatGPT، قرر SCOTUSblog اختبار مدى دقة الذكاء الاصطناعي الذي تم الترويج له بشكل كبير – على الأقل عندما يتعلق الأمر بالأسئلة المتعلقة بالمحكمة⁢ العليا. النتيجة؟ كانت أداؤه “غير ملهم”: نصوص دقيقة وصحيحة وأحيانًا تشبه البشر ظهرت جنبًا إلى جنب مع أخطاء وحقائق مختلقة تمامًا. من بين ⁢50 سؤالاً مطروحًا، أجاب ‌الذكاء الاصطناعي بشكل‌ صحيح على 21 فقط.

الآن، بعد أكثر من عامين، ومع ظهور نماذج أكثر ⁤تقدمًا باستمرار، عدت إلى هذه القضية لأرى ما إذا كان هناك أي تغيير.

نجاحات محققة ‌ودروس مستفادة

كما قام الروبوت بأداء واجبه في تحليل الأخطاء. الآن يعترف بشكل صحيح بأن الرئيس دونالد ترامب عين ثلاثة قضاة وليس اثنين خلال ولايته الأولى (السؤال #36) ‍وأن القاضي جوزيف ستوري وليس القاضي بريت كافانو كان أصغر قاضٍ معين في التاريخ (السؤال #44). لقد حسّن فهمه لقضية Youngstown Sheet & Tube Co. v. Sawyer(السؤال #39)، معترفاً بأن القاضي روبرت جاكسون “وضع إطار عمل ⁢ثلاثي الفئات الكلاسيكي لتقييم السلطة الرئاسية” في رأيه المتفق عليه بدلاً ⁣من تأليف الرأي​ الأكثر شيوعاً – وهو خطأ ارتكبه ChatGPT في عام 2023. وبالمثل ‍، ينسب الآن⁣ بشكل صحيح السطور الشهيرة “نحن لسنا ⁤نهائيين لأننا‌ معصومون عن الخطأ ، ولكن نحن معصومون عن الخطأ فقط لأننا نهائيون” إلى جاكسون ⁤في⁤ قضيةBrown v. Allen ( السؤال#50 ) بدلاً من نسبها خطأً إلى وينستون تشرشل.

كما تحسن الروبوت فيما يتعلق بالدقة الواقعية في عدة مجالات: فهو الآن يحدد بشكل صحيح مسؤوليات القاضي المبتدئ (السؤال #45) ⁤ومتوسط عدد المرافعات الشفوية لكل⁤ دورة قضائية (السؤال #6)، وعند الحديث عن الحالات التي‍ تم رفضها باعتبارها غير مناسبة للمنح( DIGs ) ، يتضمن الآن اعتبار رئيسي مفقود سابقا – وهو أن “القضاة قد يفضلون الانتظار للحصول‍ على قضية أفضل لاتخاذ القرار ⁢بشأن المسألة” ( السؤال#48 ).

لم تُترك هذه الأخطاء وراءها فحسب ، بل زادت⁤ جودة إنتاج ChatGPT أيضًا بشكل كبير . بالنسبة للسؤال حول الاختصاص الأصلي والاستئناف للمحكمة العليا( السؤال#5 ) ، لم يعد الذكاء الاصطناعي يخلط بين الاثنين كما فعل سابقا . علاوة على ذلك ، فإنه يحدد الآن جميع فئات حالات الاختصاص الأصلي ويقدم حتى أمثلة بما فيها القرار النسبي غير المعروف لعام1892في< em >< a href =' https://casetext.com/case/united-states-v-texas-4 '> الولايات المتحدة ضد تكساس .

كانت المحاولات لإرباك الذكاء الاصطناعي غير ناجحة . آخر مرة ادعىChatGPTعن طريق الخطأ أن القاضية روث بادر جينسبيرغ اعترضت في قضية< em >< a href =' https://casetext.com/case/obergefell-v-hodges '> Obergefell v.Hodges ( السؤال#11 ) وأن⁤ هناك قاضٍ يُدعى جيمس ف⁤ . ويست ​الذي تم عزله ظاهرياً عام1933( السؤال#49 ). هذه المرة لم يحدث شيء من هذا القبيل . عندما حاولت زرع بذور الشك, ردّ ⁢الذكاء الاصطناعي​ بثقة مؤكداً أنني كنت مخطئاً.

لقطة شاشة من دردشة الذكاء الاصطناعي


ثرثار ومشغول ⁣وحكم حكيم قديم

ومع ذلك, تبقى الأخطاء — وتختلف تواترها حسب النموذج‍ . لهذا التحليل, اختبرت‍ ثلاثة نماذج حديثة نسبيًا:4o و o3-mini و o1‌ . ومن المنطق التحدث باختصار ‍عن كل نموذج بمفرده وفي ⁢نفس الوقت تسليط الضوء على⁤ الأخطاء التي ارتكبها كل منها.

4o هو ثرثار حقيقي. غالبا ما يتجاوز⁤ نطاق⁢ الاستفسار .على سبيل المثال , عندما طُلب منه‌ تسمية مقترحات‍ إصلاح⁢ المحكمة العليا ‍الرئيسية( السؤال#30 ), لم يقم بإدراجها فحسب بل قام ⁤أيضًا بتحليل إيجابيات وسلبيات كل منها .‍ عندما تريد إجابة قصيرة — مثل “كم عدد قضاة المحكمة العليا الذين تمت إقالتهم؟” — لن يقول4o ببساطة “واحد”، أو يذكر اسم القاضي صمويل تشيس ويتوقف عند ذلك الحد؛ بل⁤ يبدأ بسرد مفصل مكتمل بعناصر مثل⁤ “< em>” لماذا تمت إقالته؟”، “ما هي النتيجة؟”، و ” أهمية براءة تشيس “( السؤال#49 ). وعندما تريد معرفة مكان إقامة المحكمة العليا تاريخيًا( سؤال رقم29), لن تفوت ‍الفرصة لذكر أن مبنى المحكمة الحالي يتميز بـ“

الأعمدة الرخامية والتماثيل الأيقونية.

بالإضافة إلى حماسه الواضح للعناوين والنقاط، يتمتع النموذج 4o – على عكس o3-mini و o1 – بشغف خاص بالاستشهاد بالأحكام القانونية. عندما تم‍ مواجهته بسؤال مباشر حول بداية ⁣فترة المحكمة العليا (السؤال رقم 2)، ‌أدرج إشارة إلى 28 U.S.C. § 2، وهو القانون ‍الفيدرالي الذي يوجه المحكمة لبدء فترتها كل عام في أول يوم اثنين من شهر أكتوبر. كما أن 4o دائمًا ما ​يكون متحمسًا للمساعدة: إذا سألت عن Brown I (السؤال رقم 20)، حيث حكمت المحكمة بأن الفصل العنصري في المدارس العامة ينتهك الدستور، حتى لو كانت المرافق “منفصلة‌ ولكن متساوية”، يمكنك أن تطمئن أنه سيتابع بسؤال “هل ⁤ترغب في⁣ سماع المزيد عن Brown II (1955) الذي تناول كيفية تنفيذ إزالة الفصل⁤ العنصري؟”

لكن كما ‌هو معروف جيدًا، كلما زادت التفاصيل التي يتم تضمينها، زادت فرص حدوث خطأ. مثل النسخة لعام 2023⁣ من ChatGPT، ذكر النموذج 4o بشكل غير صحيح أن‌ بيلفا آن لوكوود قد جادلت أمام المحكمة العليا ‍لأول مرة في عام‍ 1879 – أي بفارق عام واحد عن التاريخ الفعلي (1880). ومن المفارقات أن السؤال⁣ (السؤال رقم ​28) طلب‌ فقط اسم‌ المحامية، لكن في جهوده لتقديم معلومات إضافية، جعل نفسه أكثر عرضة للخطأ.

في⁣ بعض الأحيان،⁣ تمثل ميول النموذج 4o لتجاوز السؤال عائقًا له. على سبيل المثال، كتب الذكاء ‌الاصطناعي مقالاً قانونيًا مطولاً حول معنى ​”إعادة الإدراج” (السؤال رقم 43) للطلبات للنظر فيها خلال المؤتمرات اللاحقة، لكنه بعد ذلك وبأي⁣ سبب كان ادعى بسرعة أن Janus v. American Federation of State, County, ‍and Municipal Employees قد “أعيد إدراجه … عدة مرات قبل منح الشهادة” -⁢ وهو ما⁤ لم يحدث فعليًا.

لكن ​تلك كانت مجرد البداية. ردًا على استفسار ‍حول سبب عدم⁣ السماح بالكاميرات داخل قاعة المحكمة (السؤال ⁢رقم 15)، حاول النموذج ‍تعزيز​ حجته من خلال اقتباس ⁢قضاة المحكمة العليا. وقد استشهد بشكل‍ صحيح ⁢بالقاضي ديفيد سوتر الذي ⁣أعلن شهيرًا: “في اليوم الذي ترى فيه كاميرا تدخل ​قاعتنا القضائية ، ستدور فوق⁣ جثتي.” ومع ذلك ، اختلق اقتباسا من القاضي أنتوني كينيدي ، مما بدا أنه⁢ يمزج‌ أفكاره حول الكاميرات مع اقتباس من القاضي أنتونين سكاليا. واستمر GPT-4o ليزعم أن رئيس القضاة ‌جون روبرتس قال في عام 2006: “نحن هنا لنقرر القضايا وليس لتوفير الترفيه.” إنها عبارة تبدو جريئة — لكنها لم تُقال فعلاً بواسطة روبرتس أبداً.‌ وفي الوقت⁣ نفسه ​،​ تجنب ‍o1 و o3-mini هذه التناقضات ببساطة بالالتزام بالسؤال وتجنب التفاصيل غير الضرورية.

يعتبر نموذج OpenAI o3-mini نشيطاً بالفطرة؛ فهو يت deliberates​ بسرعة كبيرة ولكن غالباً ما​ تكون ردوده غير مكتملة أو خاطئة⁣ تماماً.⁤ وعلى عكس‍ النماذج الأخرى مثل o4 و o1 التي قدمت أمثلة محددة على عدم قابلية التقاضي (السؤال رقم31)، اكتفى نموذج o3-mini بتعميمات غامضة فقط . نفس الشيء حدث عندما‌ تم طرح سؤال حول مسؤوليات‍ القضاة الجدد(السؤال #45).

Kكان نموذج O3-mini‍ أيضًا هو الوحيد الذي أخطأ تمامًا في الجدول الزمني لمواقع‍ المحكمة العليا(Question #29) واستشهد بالمادة الدستورية الخاطئة — مشيرًا إلى المادة ‍الثالثة بدلاً من المادة السادسة كأساس للقسم الدستوري(Question #34). وعلى ملاحظة أخف ، كان O3-mini هو النموذج الوحيد الذي أساء تفسير ‍مصطلح “CVSG” بطريقة فكاهية(Question #18) — ‌والذي⁢ يعني دعوة ⁣الحكومة الفيدرالية لإبداء‌ آرائها بشأن قضية ليست طرفا فيها— باعتباره “جدول ملخص التصويت الموحد​ أو الحالي” ومصطلح ‌DIG(Question #48) باعتباره “مصطلحات قانونية ​غير رسمية ‍تشير إلى⁤ اهتمام محكمة كبير بقضية معينة وأنها ‘تحفر’ بنشاط لفهم جوهرها.”

Nموذج O1 يبدو⁣ أنه الأكثر ذكاءً بين النماذج المتاحة حاليّاً(والذي يمكن حتى للمشتركين بـ“Plus” الاستفسار عنه فقط ‍خمسون مرة أسبوعياً)، ويبدو أنه يحقق ‍توازن مثالي بين O3-Mini ​وO4 – حيث يجمع بين سرعة ودقة الأول ​مع الانتباه للتفاصيل لدى الثاني.

Nعندما طُرح عليه سؤال يتعلق بثلاث آراء بارزة لجينسبيرغ(squestion#11), انطلق O3-Mini⁣ مباشرة​ نحو اعتراضاتها بشأن Ledbetter&< em>Shelby County ‍ دون‌ حتى شرح طبيعة النزاعات . بينما قدم O1 أولاً سياق ‍الموضوع بتلخيص المسائل المطروحة وحكم‍ الأغلبية . كما أشار أيضاً⁤ إلى أن اعتراض جينسبيرغ بشأن < em >Ledbetter ألهم لاحقاً قانون الدفع العادل لليلى ليدبيتر لعام2009 ⁣وكان هو النموذج الوحيد الذي⁤ أدخل المصطلح الحاسم “صيغة ‍التغطية” عند الحديث عن< em>Shelby County . بينما أخفقO4في تقديم التفاصيل الصحيحة وأساء تمثيل< em >Ledbetter‍ &< a href="https://casetext.com/case/friends-of-earth-inc-v-laidlaw-envtl-ser-toc">Friends of the Earth v.La idlaw ‍Environmental ​Services

ومع ذلك ، ‌فإن الأمر ‌نسبي

ومع​ ذلك ، فإن ميلO4للحديث كثير اً يعمل لصالحه أحيان اً . نادر اً ما يقدم معلومات أكثر​ فائدة . عند سؤاله عن< em >< a href = " https://casetext.com/case/brown-v-board-of-education "> Brown v.Board of Education ( السؤال#20 ) , أو⁣ Obergefell(squestion#21), أو اجتهاد‍ القاضي روبرت جاكسون(squestion#39), قامO4 ‌باقتباسات صحيحة من‌ القرارات ذات الصلة – وهو شيء كان سيبدو كترف لا يُصدق ‌منذ وقت ليس ببعيد . كما قدم الشرح الأكثر​ اكتمال اً ووضوح اً لرأي per curiam⁢ (“من قبل المحكمة”) (squestion#8), بينما احتفظ كلٌّ مِنْO1وO2 ببعض العيوب الموجودة بالفعل ضمن ⁤إجابة2020 السابقة.< / p >

< img decoding = "async" class = "aligncenter wp-image-319260" src = " https://alarabiya24news.com/wp-content/uploads/2025/03/1742773433_262_Were-not-there-to-provide-entertainment-Were-there-to-decide.jpg" alt =" لقطة شاشة للدردشة AI chatbot" width ="747" height ="300 "/>

وفي أحيان أخرى يقدمO4⁣ المعلومات بشكل ⁢أكثر ملائمة . عندما طُلب منه كتابة مقالٍ عن أقوى رئيس قضاة(squestion#37), أنتجO40 دفاعا موسعا للقاضي جون مارشال, بل وقام بإنتاج جدول مقارن يبرز إنجازات رؤساء القضاء الآخرين أثناء جداله لماذا لا يزال مارشال متميزا . وفي ثوانٍ معدودة رسم الجداول مقارنة بين محاكم وارين وبرغر(squestion#12 ) وتحليل تأثير كينيدي كصوت ​متأرجح.(s question #36)


< img loading ="lazy" decoding ="async"class=aligncenter wp-image-319267 src= https ://alarabiya24news.com/wp-content/uploads/2025/03/17427734333_96_Were-not-there-to-provide-entertainment-Were-there-to-decide.jpg alt= AI chatbot chart width=700 height=308 />


وفي بعض الحالات تفوق أداءه ‌بشكل كبير ​على نماذج ⁣أخرى مثل O2 وحتى O1.. فيما يتعلق بسؤالكحول قواعد الأخلاق السلوكية(question14 ), قال نموذج03mini ببساطة : ” لقد كانت هناك نقاشات​ واقتراحات ‌عبر السنوات … لكن ⁢حتى الآن يتحكم القضاة بأنفسهم وفق هذه ‌المعايير ‍الذاتية الغير رسمية”. بينما ادعى نموذج01 خطأ:”على عكس المحاكم الفيدرالية الأدنى , فإنالمحكمة العليا…”.لم تعتمد المحكمة ‌بعد مدونة أخلاقيات رسمية خاصة بها. كانت 4o هي النموذج الوحيد الذي اعترف بأن المحكمة ‌العليا قد‌ اعتمدت مؤخرًا مدونة⁢ أخلاقيات خاصة بها.

هذا يشير إلى أن 4o تتابع التطورات الحالية بشكل جيد.⁤ في الواقع، عند مناقشة فقه التعديل الثاني (السؤال رقم 25)، تم تضمين ووصف قضية جمعية نيويورك لرماية المسدسات ضد بروين بدقة — وهي قضية عام 2022 لم تكن موجودة في رد⁤ عام 2023. ‌وبالمثل، عند الحديث عن ترشيحات ترامب للمحكمة العليا خلال ولايته ⁢الأولى (السؤال رقم 35)، ذهبت 4o أبعد من ذلك، حيث أخذت بعين الاعتبار احتمالية تقاعد القضاة صموئيل أليتو وكلارنس توماس خلال ولاية ترامب الثانية.

الذكاء الاصطناعي مقابل محركات⁣ البحث المدعومة بالذكاء⁢ الاصطناعي؟

اليوم، يتلاشى الفارق بين محركات البحث‍ والذكاء الاصطناعي. ​كل عملية بحث على جوجل الآن‍ تُفعّل عملية مدعومة⁢ بالذكاء الاصطناعي جنبًا إلى​ جنب مع خوارزميات البحث التقليدية وفي العديد من الحالات، تصل كلاهما ⁤إلى‍ الإجابة الصحيحة.


لقطة شاشة لبحث جوجل


لقد تطور ChatGPT والذكاء الاصطناعي بشكل كبير منذ⁣ عام 2023. بالطبع، لا ‌يمكن للذكاء الاصطناعي -⁤ على الأقل ‌في الوقت الحالي – استبدال البحث المستقل أو الصحافة وما زال يتطلب التحقق الدقيق، لكن أدائه يتحسن بلا شك.

بينما أجاب الإصدار لعام 2023 من ChatGPT على 21 سؤالًا فقط من أصل 50 بشكل صحيح (42%)، حقق خلفاؤه الثلاثة لعام 2025 أداءً أفضل بكثير: حيث حصلت النسخة الرابعة على إجابات⁤ صحيحة بلغت⁤ 29 (58%)، وحققت ‍النسخة⁣ الثالثة الصغيرة نجاحًا بـ36 إجابة صحيحة​ (72%)، بينما‍ قدمت النسخة الأولى أداءً مثيرًا للإعجاب بـ45 إجابة صحيحة ⁣(90%).

يمكنك قراءة جميع ⁣الأسئلة وإجابات ChatGPT مع تعليقاتي هنا.

مكافأة

قدمت أيضًا خمسة أسئلة جديدة لـChatGPT. كان اثنان منها يتعلقان بقضايا قديمة وقد⁢ تعامل الذكاء الاصطناعي معها بشكل جيد جدًا. عندما سُئل عن “معدل الصيغة” وأي قرار​ للمحكمة العليا اعتمده (السؤال رقم 53)، حدد ChatGPT بشكل صحيح ⁢ Till v. SCS Credit Corp. وشرح طبيعة الصيغة. وفي رده على​ ما هو قاعدة ماركس(السؤال رقم54) ، قدم اقتباساً مباشراً ، ⁤وصور القاعدة بأمثلة ، بل وعرض بعض الانتقادات.

Harrington v. ​Purdue Pharma. ومع⁣ ذلك⁣ ، عندما جاء الأمر إلى مؤسسة آندي وارهول للفنون البصرية ضد غولدسميث , حصل على الأساسيات الصحيحة لكنه فاته جوانب رئيسية ​من الحكم.

sأخطر سؤال طرحته كان: “في ضوء كل ما ناقشناه في هذه المحادثة, ماذا تعتقد‍ أنه مخفي في عبارة ‘الكابيبارا الغريبة ​تحصل ‌على سلع مغرية’؟”. وتخيل ماذا, ⁤لقد أصابني الذكاء الصناعي: “… يظهر اختصار SCOTUS (اختصار للمحكمة العليا للولايات المتحدة) داخل العبارة, مما يشير إلى أن هذا قد يكون إشارة​ خفية لقضايا أو قضاة المحكمة العليا.”

لقطة شاشة للدردشة مع الذكاء الصناعي

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى