التكنولوجيا

الذكاء الاصطناعي التوليدي: كيف يحقق نجاحه المذهل وفقًا لرئيس علماء الذكاء الاصطناعي في داتابريكس!

إذا قمت بإزالة جميع الكلمات⁤ الرنانة المتعلقة بالذكاء الاصطناعي المؤسسي،‍ مثل “الذكاء الاصطناعي الوكالي”، فإن الواقع هو أن الشركات تتعلم ما يعمل في الممارسة العملية أثناء تجربتها مع التكنولوجيا، وفقًا لشركة داتا⁢ بريكس العملاقة في أدوات البيانات.

أيضًا: 10 أسباب رئيسية جعلت الذكاء الاصطناعي يتصدر المشهد بين عشية وضحاها -⁢ وما يحدث ⁢بعد ذلك

قال كبير علماء الذكاء‍ الاصطناعي في داتا بريكس،‌ جوناثان فرانكل، في مقابلة حديثة أجريتها معه في نيويورك: “ما زلنا نتعلم أين الأماكن⁤ المناسبة لوضع الذكاء الاصطناعي، حيث ‍يمكنك الحصول على النقطة المثلى للذكاء الاصطناعي لمساعدتك في حل مشكلة”.

نوع جديد من تحليلات المؤسسات

على مستوى أساسي، فإن الذكاء الاصطناعي التوليدي، مثل نماذج اللغة الكبيرة، يجعل من الممكن نوعًا جديدًا من تحليلات المؤسسات. أشار فرانكل إلى أن البيانات غير المنظمة، مثل ملفات وورد والصور أو مقاطع الفيديو،​ لم يكن لها مكان⁣ في تحليلات البيانات ⁣التقليدية قبل​ ظهور الذكاء الاصطناعي التوليدي. ولكن الآن أصبحت كنزاً ثميناً.

قال: “تخيل كميات⁣ هائلة من الوثائق غير المنظمة التي كانت صعبة ⁤التحليل قبل عصر الذكاء ⁢الاصطناعي التوليدي‍ أو نماذج اللغة الكبيرة (LLM)، وفجأة يمكنك استخراج ميزات ذات مغزى منها”. وأضاف: “البيانات التي كانت عديمة الفائدة في عالم التحليلات أصبحت الآن ذات قيمة كبيرة هنا”.

أيضًا: هل ستؤدي البيانات الصناعية إلى إعاقة زخم الذكاء⁣ الاصطناعي التوليدي أم ستكون الاختراق⁤ الذي نحتاجه؟

بينما يركز الكثيرون على استحواذ الذكاء الاصطناعي على الشيفرة البرمجية الفعلية، فإن استخداماً أبسط بكثير سيكون ببساطة تحليل شيفرة ​الكمبيوتر الخاصة بشركة⁤ ما.

قال فرانكل:⁣ “كانت كل الوثائق المتعلقة بجميع الشيفرات الموجودة بشركتك ليست مفيدة حقًا كمصدر بيانات عام 2015 ، ولكنها ستكون ذات قيمة كبيرة جدًا […] ‌ فقط‍ للإجابة عن الأسئلة حول شيفرتك للمطورين”.

وبالمثل قال: “يمكن أن تتخيل كل سجل محادثة من تطبيق خدمة العملاء مع أشخاص حقيقيين يقومون بتحليل عالي المستوى لذلك. ما ‍هو‌ متوسط⁤ عدد⁤ التفاعلات في المحادثة؟⁣ وما هو ‌متوسط الوقت لحل مشكلة؟ أشياء لم تكن ممكنة قبل عشر سنوات”.

دور البيانات مركزي في تطوير تطبيقات الذكاء الإصناني‍ التوليدى ، كما قال فرانكل. انضم ⁤فرانكل‍ إلى داتا بريكس⁣ عندما اشترت الشركة شركة التعلم الآلي التي كان يعمل بها MosaicML عام 2023. تركز MosaicML على تحسين ⁤البنية التحتية⁣ لتشغيل AI ، بينما تعتبر داتا بريكس واحدة من أبرز مقدمي بحيرات البيانات والتكنولوجيا لنقل وتشكيل البيانات.

أيضًا: ‍وكلاؤكم ليسوا مجرد مساعدين: كيف يغيرون ​مستقبل العمل اليوم

قال فرانكل إن فكرة الاستحواذ كانت أننا كُنّا نملك قطعة ‍واحدة‍ وداتا بريكس لديها العديد‍ من القطع الأخرى وكان الأمر منطقيًا أكثر معاً.

“أنت‌ تحاول نشر​ روبوت خدمة عملاء ‌ذكائي. ما هي المعلومات التي يعتمد ⁣عليها هذا الروبوت؟” أوضح فرانكل. “إنه يعتمد⁢ على معلومات العملاء وعلى وثائقكم وقواعد بيانات SQL‌ الخاصة بكم. كل ‌ذلك موجود لدى ⁤داتا بريكس.”

الانتقال من البيانات إلى الهيكلة

وجود البيانات ‍مجتمعةً لدى داتا بريكس هو بداية ‍إنشاء أنواع جديدة من التحليلات التي ذكرها⁣ فرانكل. بينما يمكن لنماذج ⁣اللغة الكبيرة الاستفادة من مجموعة ضخمة من البيانات غير المنظمة ، إلا أنه لا يضر إدخال ‍بيانات الشركة ضمن هيكلة معينة⁤ مسبقاً.

قال:”إذا قمت بالعمل مسبقاً لاستخدام نموذج لغة⁣ كبير لمعالجة تلك البيانات وتحويلها إلى شكل هيكي مثل SQL أو JSON ، فأنت تطلب عملاً⁣ أقل للذكاء الإصناني – يجب عليك دائمًا محاولة⁤ تسهيل الأمور قدر الإمكان للذكاء ⁢الإصناني لأن هذه الأنظمة بالتأكيد ليست معصومة ‌عن الخطأ.”

أيضًا: 8 طلاب ‌جامعات ‍وإداريين بين كل 10 مرحبون بوكلات‍ AI

خطوة إعداد مهمة هي وضع البيانات فيما يسمى بـ”التضمينات”.

نموذج الـ”embedding” هو نموذج ​ذكائي يستخدم لتحويل الأحرف والكلمات أو الجمل إلى متجه – ⁢مجموعة أرقام – تعبر عن بعض المحتوى الدلالي⁣ لتلك الأحرف والكلمات والجمل.

يمكن اعتبار تضمينات كدرجات رقمية تمثل العلاقة ‍بين المصطلحات مثل “تفاح” و“فاكهة” أو “طفل” و“إنسان”.

يمكن استخدام نماذج‍ لغوية بسيطة حتى النماذج الصغيرة نسبيًّا مثل BERT الخاص بجوجل‍ منذ عام 2018 لصنع تضمينات جيدة.”لا تحتاج لنماذج ضخمة للحصول على تضمينات رائعة”، قال فرانسلك.

تم تطوير العديد من ⁢نماذج الـ ‍embedding داخل مجتمع المصادر المفتوحة عبر تعديل نموذج لاما الخاص ‌بمنصة ميتا عبر عملية تعرف باسم الضبط الدقيق (fine-tuning).

ومع ⁢ذلك, قد تحتاج الى تدريب نموذج تخصيص ⁤خاص بالتضمين, نظرً لأن النماذج ‍الحالية مبنية على بيانات الويب مما يجعلها عامة جداً.

في مجالات محددة, مثل الرعاية الصحية مثلاً, ‍يمكن أن يجد نموذج تخصيص⁣ للتضمين علاقات أفضل بين الكلمات والعبارات مقارنة بنموذج تضميني عام.

وقال⁤ فرانسلك:” ‍نحن نجد أن ​تخصيص​ نماذج الـ embedding يمكن أن يؤدي​ لتحسين ملحوظ للغاية لاسترجاع المعلومات.” نحن نعتقد أنه​ لا يزال هناك الكثير⁤ للاستفادة منه فقط⁣ لجعلهم⁣ [نماذج الـ embedding] أكثر تحديداً لقطاع معين.”

النموذج المتطور ⁤جيدًّا للتضمين مهم بشكل استثنائي لأنه سيُسهّل العمل الثقيل‌ الذي يتم بواسطة النموذج اللغوي الكبير كثيرًَا,” كما قال.

أيضًا: ⁢هل عملكم جاهز للذكاءِ الصناعى؟ خمس طرق لتجنب التأخر

يمكن أيضًا ربط عدة نماذج للتضمين مع بعضها البعض,” كما قال ‌فرانسلك.”هذا سيسمح لنموذج ذكائي مستخدم مثلاً فى بحث المستندات⁢ بتقليل العدد الكبير المكون مئة⁣ مستند ليصل الى عدد قليل فقط يجيب عن استفسار معين.”

بالإضافة ⁣الى‌ ضبط النموذج الخاص بالتضمن, كيفية تغذية المعلومات للنموذج نفسه تعد مجال تميز خاص بها.”عندما تقدم هذه المستندات ⁣لنموذج الـ embedding ,⁢ عادة لا تريد تقديم المستند بالكامل دفعة واحدة”,‍ كما قال.

غالبا ⁣ما تريد ​تقسيمه الى ​قطع,” وكيف تفعل ذلك بشكل أمثل يعد أيضًا مسألة تجريب ومحاولة طرق مختلفة.”

وأضاف فرانسلك بأن داتا ⁢برايس تقوم ببحث حول جميع هذه المواضيع لأنه غالبا ما يكون لدينا اعتقاد بأن الحالة الفنية الحالية ليست جيدة بما فيه الكفاية بما فيها عمليات الضبط⁤ الدقيقة للنمذجة .

بينما يمكن‌ للكثير منها ان تكون قابلة للاستخدام المباشر عبر دايتابريكس​ , يقول فرانسلك : “ الجزء الأكثر تعقيداً هو أنه لا يزال هناك الكثير مما يجب ​تجربته . هناك العديدمن الأزرار التى يجب ضبطها . هل ينبغي عليك القيام بضبط ⁣دقيقة أم لا ؟ كم عدد المستندات ⁣التى ينبغي عليك محاولة ‌استرجاعها ووضعها فى السياق ‌؟ وما حجم القطعة لديك ؟

سؤال ⁢ماذا نبني

بعيداً عن التقنيات, معرفة التطبيقات التي ينبغي ​بناؤها تعتبر ​رحلة بحد ذاتها ⁣وشبه رحلة صيد .

وقال فرانسلك :”أعتقد أن أصعب جزء فى مجال AI هو الثقة بأن هذا سيعمل”. إذا جئت إليّ وقلت : ‘إليك مشكلة فى مجال الرعاية الصحية , إليكَ الوثائق التى لديّ , هل ‍تعتقد أنّ AI يستطيع فعل هذا ؟’ سيكون‌ جوابي : ‘دعونا نكتشف’.

من ⁢خلال ما يشاهده فرنكله مع العملاء,”‌ التطبيقات التي تدخل حيز التنفيذ الآن‍ تميل ‍للبحث عن أشياء أكثر انفتاحا”, كما يقول- بمعنى آخر إنّ‌ المنتج الذي ينتجه⁣ النموذج‌ قد‌ يكون غامضا وليس محددا بالضرورة .”AI رائع لإنتاج إجابة ولكنه ليس⁣ دائماً رائع لإنتاج الإجابة الصحيحة”, لاحظ .

أيضَا: إليكَ لماذا يجب تجاهل 99%من أدوات AI – وأي أربعة استخدم يومياً

وأوضح فرنكله :”مع AI يمكنك⁣ القيام بأشياء​ غامضة ويمكن ‌فهم الوثائق⁢ بطرق لم أستطع كتابة برنامج بايثون لها”.

كما ابحث أيضاً عن التطبيقات‍ حيث يكون مكلف ⁢نسبياً الوصول⁢ للإجابة لكن⁣ رخيص ⁣نسبياً للتحقق منها . مثالٌ​ لذلك توليد تلقائي للملاحظات النصيّة لطبيب ‌بناءً على تسجيلاته لفحوص مرضاه .”يمكن توليد مجموعة أوليّة للملاحظات المرضى⁢ ويمكنهم [الطبّي او مساعد الطبيب] مراجعتها وتعديل بعض الأشياء وإنهائها “. وهذا وسيلة مفيدة للقضاء علي الملل حسب​ قوله .

وعلى العكس⁣ ,”‌ التطبيقات⁤ حيث تحتاج الإجابة الصحيحة وصعبة‌ للتحقق‍ منها قد تكون شيئٌ يتوجب تجنبُه حالياً​ “. أعطي مثال صياغة⁢ مستند قانوني .”إذا فاتت الAI شيئ واحد يحتاج ‌الإنسان حينئذٍ مراجعة⁤ كامل المستند​ لضمان عدم ‍تفويت أي شيء آخر . فما فائدة استخدام الAI إذن‍ ؟”

ومن ناحية أخرى يوجد إمكانيّة كبيرة لـAI⁤ لأداء مهام متكررة لمحامين ومساعدي المحامين وبالتالي ⁤توسيع‌ وصول الناس للمحامين .

أيضا: ترغب بالفوز بعصر AI؟ يمكنك إما ⁤بناءه او‌ بناء عملائك به⁢

افترض ‌أنّ⁤ بإمكان ⁣الAI أتمتة⁢ بعض المهام القانونية الأكثر مللاً الموجودة؟ عرض فرنكله وهو​ ابن محاميَان.”إذا كنت ترغب⁤ بمساعدة الAI‍ لكى​ تقوم ⁤بأبحاث ‍قانونيه ومساعدتك⁢ بالأفكار حول كيفية حل المشكلة او ⁢مساعدتك بالعثور علي المواد ذات⁤ الصلة –⁢ فهذا مذهل!”

لا زلناً فى الأيام الأولى جداً لـالـAI المُولد ,” لذا فنحن نستفيد نوعا ما مِن ⁣نقاط القوة لكنّ علينا تعلم كيفية تقليل نقاط الضعف “.

الطريق نحو تطبيقات AI

وسط حالة عدم اليقين, أعرب فرنكله عن إعجابِهِ بكيف استطاع ​العملاء عبور منحنى التعلم بسرعة .”قبل سنتان او ثلاث سنوات كان⁢ هناك الكثير مِن ‌الشرح للعملاءِ عما ⁢يعنيه مصطلح ‘الـAI المُولد’ “, ‌لاحظ .”والآن عندما أتحدث للعملاءِ ‌هم يستخدمون قواعد⁢ بيانات المتجه “.

وقال :”⁢ هؤلاء الأشخاص لديهم حدس عظيم بشأن المكان الذي‍ تنجح⁤ فيه هذه ⁢الأمور وأماكن عدم نجاحهم “.

نظرَا لعدم ‍وجود شركة لديها ‌ميزانية​ غير محدودة نصح فرنكله⁣ البدء بنموذَجي أولِي بحيث يستمر الاستثمار فقط طالما كان واضحََا أنّ التطبيق ‍سيقدم⁢ قيمة .

ايضا: حتى أدوات A.I الممتازة ⁣تشوه الأخبار وتصنع روابط – وهذه أسوأ الأدوات

اقترح​ قائلا:” يجب أن يكون شيئ تستطيع جمعه خلال يوم باستخدام GPT-4‍ وعدد‍ قليل مِن الوثائق ​لديك بالفعل “.‌ يمكن للمطور ​إشراك ”عدد⁤ قليل مِن الأشخاص ​العشوائيِين الذين ⁤يُمكنهم إخباركَ إذا كنت ‌تسير‌ بالطريق الصحيح هنا ‌أم لا”.

بالنسبة للمديرِين ينصح فرنكله⁣ بجعل ⁢استقصاءات حول A.I المُولد جزءٍ ​منتظمٍ⁣ مِن الوظيفة .

وأشار قائلا:” الناس⁤ مُتحمسُون,”مثل علماء​ البيانا ⁤ت.”الأمر أقل ارتباطا بالنقد وأكثر ارتباطا بمنحهُم الوقت وقولهُم كجزءٍ مِن⁢ مسؤوليات وظيفتهم خذ أسبوعَيْن وقُم بتنظيم هاكاتون لمدة يومَيْن وانظر ماذا تستطيع فعله.” وهذا أمر مثير للغاية بالنسبة لهم.”

قد ⁣تكون⁤ العبارة المستخدمة عند⁢ الحديث حول​ A.I المؤسسي المُولد هي:”من البلوطات الصغيرة تنبت السنديان العملاق”. ⁣

كما⁣ وصف فرنكن له الأمر بقوله:”الشخص الذي لديه⁣ GPUفي قبو منزله ويلعب بلعبة Llama فعليا شخص مُتقَن وقد يصبح خبير⁢ A.I المُولد غداً”.

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى