التكنولوجيا

تفوق النماذج اللغوية الصغيرة: كيف يمكنها التغلب على النماذج الضخمة والمكلفة؟

بعد عامين ​من ​الإطلاق العام لـ ChatGPT، أصبحت المحادثات حول الذكاء ⁣الاصطناعي لا مفر منها حيث تسعى‌ الشركات في جميع الصناعات للاستفادة من نماذج اللغة الكبيرة (LLMs) لتحويل عملياتها التجارية. ومع ذلك، على الرغم من قوة ووعود LLMs، فقد أصبح العديد من⁢ قادة الأعمال وتكنولوجيا المعلومات ⁣يعتمدون عليها بشكل⁤ مفرط ويتجاهلون قيودها. ‌لهذا السبب أتوقع مستقبلاً تلعب فيه نماذج اللغة المتخصصة (SLMs) دورًا أكبر تكميليًا في‍ تكنولوجيا المعلومات ​المؤسسية.

تُعرف SLMs عادةً باسم “نماذج اللغة الصغيرة” لأنها تتطلب بيانات‍ أقل ووقت تدريب ‌أقل وهي “إصدارات أكثر انسيابية من LLMs”. لكنني ​أفضل استخدام كلمة “متخصصة” لأنها تعبر بشكل أفضل عن قدرة هذه الحلول‍ المصممة ⁣لأداء أعمال متخصصة للغاية بدقة أكبر وثبات وشفافية مقارنة بـ LLMs.⁣ من خلال تعزيز LLMs بـ SLMs، يمكن للمنظمات إنشاء حلول تستفيد من نقاط القوة لكل نموذج.

الثقة ومشكلة “الصندوق الأسود” لـ LLM

تعتبر LLMs ‍قوية للغاية، لكنها معروفة أيضًا أحيانًا بأنها “تفقد الخيط”، أو تقدم نتائج تنحرف عن المسار بسبب⁢ تدريبها العام ومجموعات البيانات الضخمة. تصبح ‌هذه​ النزعة‌ أكثر إشكالية بسبب حقيقة أن ChatGPT وغيرها من LLMs هي أساساً “صناديق سوداء” لا تكشف كيف تصل ​إلى إجابة معينة.

ستصبح مشكلة الصندوق الأسود هذه قضية أكبر في المستقبل، خاصة⁣ بالنسبة للشركات والتطبيقات الحيوية للأعمال حيث تكون الدقة ⁣والثبات والامتثال أمرًا بالغ الأهمية. فكر في ⁤الرعاية ⁣الصحية والخدمات المالية والقانون كمثال رئيسي على المهن التي يمكن أن تؤدي فيها الإجابات غير الدقيقة إلى عواقب مالية ضخمة وحتى عواقب تتعلق ⁣بالحياة والموت. بدأت الهيئات التنظيمية بالفعل في ملاحظة ذلك ومن المحتمل أن تبدأ في المطالبة بحلول ذكاء‍ اصطناعي قابلة للتفسير، خاصةً ‍في الصناعات التي تعتمد على ⁢خصوصية البيانات والدقة.

بينما غالباً ما‍ تعتمد ‍الشركات نهج “الإنسان ضمن الحلقة” للتخفيف من هذه القضايا، فإن الاعتماد‌ المفرط على LLM قد يؤدي إلى شعور زائف بالأمان. بمرور الوقت، يمكن أن يتسلل التراخي وتفلت الأخطاء دون ⁣اكتشاف.

SLM = قابلية تفسير أكبر

لحسن​ الحظ، تعتبر⁣ SLMs أكثر ملاءمة لمعالجة ⁤العديد من قيود LLMs. بدلاً من تصميمها لمهام عامة الاستخدام، يتم تطوير SLMs بتركيز أضيق وتدريبها على بيانات محددة المجال. تسمح لهم هذه الخصوصية بالتعامل مع متطلبات اللغة ⁤الدقيقة في المجالات التي ‍تكون فيها الدقة أمرًا بالغ ⁣الأهمية. بدلاً من الاعتماد على مجموعات بيانات ضخمة ومتنوعة ، يتم تدريب SLMs ​على معلومات مستهدفة ،​ مما يمنحهم الذكاء السياقي لتقديم استجابات ⁢أكثر اتساقًا وقابلية للتنبؤ ‌وملائمة.

يوفر هذا عدة مزايا: أولاً ، إنها أكثر ⁢قابلية للتفسير ، مما يسهل فهم المصدر‌ والمنطق وراء نتائجها . وهذا أمر حاسم في الصناعات المنظمة حيث‌ يجب تتبع القرارات إلى مصدر معين .

ثانيًا ، يعني حجمها الأصغر أنها‍ غالباً ما تستطيع‍ الأداء ​بسرعة أكبر مقارنة بـLLMs ، وهو عامل حاسم​ لتطبيقات ⁢الوقت الحقيقي .⁣ ثالثا ، توفر SLM المزيد من التحكم للشركات فيما يتعلق بخصوصية البيانات والأمان⁢ ، خاصة إذا تم نشرها داخلياً أو بناؤها ⁢خصيصا للمؤسسة .

علاوة على ذلك ، بينما قد تتطلب SML التدريب ‍المتخصص أولياً إلا أنها تقلل المخاطر المرتبطة باستخدام نماذج لغة كبيرة تابعة لجهات ‌خارجية تتحكم بها ⁢مزودون خارجيون . هذا التحكم لا يقدر بثمن في التطبيقات التي‌ تتطلب⁣ معالجة ‍صارمة للبيانات والامتثال .

التركيز على تطوير الخبرة (وكن حذرًا بشأن البائعين الذين يعدون ‍بالكثير)

أريد أن أوضح أن الـLLMs وSLMs ليست متعارضة بالضرورة . عملياً يمكن لـSLMs تعزيز الـLLMs لإنشاء حلول هجينة حيث توفر الـLLMs سياق أوسع وتضمن الـSLMs التنفيذ الدقيق . كما أنه لا يزال هناك الكثير لاستكشافه حتى عندما يتعلق الأمر بالـLLMs لذلك دائمًا ما أنصح قادة التكنولوجيا بمواصلة استكشاف ⁢العديد من الإمكانيات والفوائد المرتبطة بها .

بالإضافة إلى ذلك بينما يمكن للـLLM التوسع جيداً لمجموعة متنوعةٍ مِنَ المشكلات إلا أنه قد لا تنتقل الـSLM بشكل جيد​ لبعض حالات الاستخدام . لذلك فمن المهم وجود فهم واضح مسبق لما يجب معالجته .

كما أنه مهم لقادة الأعمال وتقنية المعلومات تخصيص المزيد مِنَ الوقت والاهتمام لبناء المهارات المتميزة المطلوبة لتدريب وضبط واختبار الـSLM . لحسن‍ الحظ هناك الكثير ​مِنَ المعلومات المجانية والتدريب المتاحة ​عبر مصادر شائعة مثل Coursera وYouTube وHuggingface.co . ينبغي للقادة التأكد ‍مِنْ حصول مطوريهم علي وقت كافٍ للتعلم والتجربة مع‌ SLMS كلما اشتدت المنافسة للحصول علي خبرة الذكاء الاصطناعي .

أنصح القادة​ أيضًا بتقييم الشركاء ‌بعناية . تحدثت مؤخرًا مع شركة طلبت رأيي حول ⁤ادعاءات مزود تكنولوجيا معين وكان رأيي أنهم‌ إما يبالغون فيما يدعون أو أنهم ببساطة خارج نطاق معرفتهم بشأن قدرات التكنولوجيا المعنية .

لقد اتخذت الشركة خطوة حكيمة للخلف ونفذت إثبات مفهوم ‌مُراقَب لاختبار ادعاءات البائعين وبالفعل كما توقعت كانت الحلول ​غير ​جاهزة للاستخدام الفعلي وتمكنت الشركة مِنْ الابتعاد باستثمار زمني ومادي قليل نسبيًَّا

سواء بدأت الشركة بإثبات مفهوم⁣ أم ‌نشر مباشر فإنني ⁢أنصحهم بالبدء صغيرا واختبار كثير والبناء علي ⁢النجاحات المبكرة لقد جربت شخصيًا العمل بمجموعة صغيرة جدًا مِنَ التعليمات والمعلومات ‍فقط لأجد النتائج تنحرف عن المسار عندما أعطي النموذج⁤ معلومات‌ إضافيّة لذا ‌فإن النهج البطيء والثابت هو نهج حكيم

في الختام بينما ستستمر LLMS بتوفير قدراتها القيمة بشكل متزايد إلا إن قيودها أصبحت واضحة بشكل ‌متزايد كلما زادت الشركات اعتمادا علي الذكاء الاصطناعي إن التعزيز باستخدام SLMS يوفر طريقا للمضي قدمَا وخاصةً فى المجالات⁢ ذات‌ المخاطر ‍العالية التى⁢ تطلب دقة وقابلية تفسير عبر ‍الاستثمار فى SLMS تستطيع الشركات تأمين استراتيجيات الذكاء الاصطناعى الخاصة بهم لضمان ان أدواتهم تدفع الابتكار ولكن أيضا تلبي​ مطالب الثقة والموثوقيه والتحكم

AJ سوندير هو المؤسس المشارك ومدير المعلومات ومدير المنتجات لدى Responsive

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى