تريند 🔥

🌙 رمضان 2024

تحديات تطوير الذكاء الاصطناعي.. ماذا يحدث عندما تنفذ بيانات التدريب المتاحة؟

دعاء رمزي
دعاء رمزي

6 د

منذ انطلاق Chat GPT و BARD وغيرها من نماذج ذكاء اصطناعي قادرة على التعلم الذاتي والإبداع والابتكار مثل البشر وأصبح الجميع في خوف وترقب من اليوم الذي تحتلّ فيه الروبوتات كوكب الأرض وتُنهي البشرية كما رأينا في عشرات الأفلام.

ولكن يواجه الذكاء الاصطناعي الآن مشكلة كبرى قد تعوق استمرار تعلمه الذاتي مما يمنع تطوره بشكل واضح أو على الأقل تؤدي لتباطؤ ملحوظ في هذا التطور.

وقد يكون هذا أمر جيد للكثير من الخائفين من مصيرهم وقدرتهم على الاستمرار في وظائفهم التي احتلتها بالفعل روبوتات الدردشة فائقة الذكاء، ولكن هذا التأخر في التطور لم يلق قبولًا لدى العلماء والمهتمين بالذكاء الاصطناعي..!

إذ مع هذا التراجع في التطور ستتضاءل بشدة الأرباح الناجمة من تطوير نماذج الذكاء الاصطناعي السابقة مما قد يؤدي لخسائر فادحة، لذا هناك سعي محموم للسيطرة على الأمر واستمرار تعليم نماذج الذكاء الاصطناعي.

لكن ما الذي يعيق هذا التطور في الأساس، وما هي البدائل لحل هذه المشكلة وضمان استمرار الهيمنة.. هذا ما سوف نتعرف عليه الآن.


نقص البيانات عالية الجودة وإعاقة تعلم نماذج الذكاء الاصطناعي

أدى تطوير نماذج اللغات الكبيرة LLMs إلى طفرة فائقة في تغذية نماذج الذكاء الاصطناعي بالبيانات وفي البرمجة عمومًا، فبعد أن كانت لغات البرمجة تقتصر على الرموز فقط، أصبح بإمكان الآلات التعامل مع الكلمات والصور مما يزيد بشدة من قدرة الذكاء الاصطناعي على التعلم اللانهائي من كل البيانات الموجودة على الإنترنت وتطويعها لتطوير المعرفة بطرق لم يسبق لها مثيل.

ولكن المشكلة الآن أن البيانات عالية الجودة أو الموثوقة على الإنترنت في تراجع مقارنة بالبيانات غير الموثوقة والمتمثلة في منشورات وسائل التواصل الاجتماعي، مما يهدد بعدم تمتع نماذج الذكاء الاصطناعي بالدقة اللازمة للقيام بمهام معقدة وخصوصًا في الرعاية الصحية واتخاذ القرارات.

فوفقًا لبحث حديث أجرته شركة Epoch فقد يحتاج الأمر قريبًا للغاية وتحديدًا عام 2026 إلى المزيد من البيانات الضرورية لتدريب الذكاء الاصطناعي ببيانات عالية الجودة، في حين أن المنشورات غير الموثوقة قد تمتد لعقود كثيرة آتية، مما سيمنع بالتأكيد التحسين اللانهائي في الذكاء الاصطناعي والذي كان يأمل فيه العلماء، إذ أن هذا التحسن قد يتباطأ بالتدريج.

فمقارنة بالإنسان قد نحتاج إلى أمثلة قليلة أمامنا لنتعلم شيئًا جديدًا، ولكن هذا لا ينطبق على نماذج الذكاء الاصطناعي حتى الآن، إذ يعتمد تطوره بشكل أساسي على زيادة كمية البيانات التي يتدرب عليها، ولكن هذه الزيادة الضخمة بمفردها لن تكفي خصوصًا في التخصصات الدقيقة.

فإذا طلبنا من نموذج ذكاء اصطناعي تشخيص مرض نادر أو اكتشافه فسوف يحتاج الأمر بالإضافة للزيادة المستمرة في البيانات أن تكون على أكبر قدر من الدقة، ويشير هذا إلى وجود حاجة ضرورية لتغيير النمط الذي يتعلم به النموذج ليستمر في التطور.


تراجع فاعلية نموذج الذكاء الاصطناعي كلما زاد حجمه

من أهم التحديات الحالية أمام استمرار تعلم الذكاء الاصطناعي هو أنه كلما زاد حجمه فإن التحسن في أدائه يُصبح هامشيًا ولا يتواكب مع حجم الموارد المُنفقة على عملية تزويده بالبيانات، فكلما كان أكثر ضخامة فإن هذا يتطلب المزيد من الموارد الحسابية وأوقات متزايدة للتدريب وهدر الطاقة والأموال دون تطبيق حقيقي في العالم الواقعي.

فتشير التقديرات إلى أنه كلما كان نموذج الذكاء الاصطناعي أكبر حجمًا تراجعت صفة المتانة فيه أو قدرته على مواجهة مدخلات صعبة أو مُعادية، وهذا لأنه كلما ازداد ضخامة فإنه يتعرض إلى مدخلات مُعادية أكثر، فإذا لم يستمر التحسن بشكل فائق ومستمر فلن يتمكّن من التعامل مع تلك المدخلات المعادية.

والمشكلة الثانية في زيادة ضخامة نماذج الذكاء الاصطناعي تكمن في صعوبة التعميم، أو بمعنى آخر قدرته على التعامل الجيد مع بيانات جديدة لم يتعرف عليها أثناء التدريب أو القياس بتعبير آخر، فنماذج الذكاء الاصطناعي تركز على حفظ البيانات الضخمة بدلًا من الاهتمام بأنماط التعلم الأساسية، مما يؤدي إلى ضعف نتائجها بالتدريج أمام المعطيات الجديد وبالتالي تتراجع بشدة قدرتها على التنبؤ.


أهم الطرق البديلة المطروحة لاستمرار قدرة نماذج الذكاء الاصطناعي على التعلم


إعادة تغذية النماذج بالبيانات نفسها

يقترح سوابا سوايمديبتا Swabha Swayamdipta الأستاذ في جامعة كاليفورنيا إعادة النظر فيما يتم اعتباره بيانات عالية ومنخفضة الجودة، ويؤكد أن تقديم بيانات أكثر تنوعًا سوف يساهم في التغلب على قيود التعلم دون التأثير في الجودة، وبمعنى آخر تقديم البيانات نفسها بطرق متنوعة لزيادة نمط التعلم.

ولكن هذه الوسيلة سوف تؤجل فقط المشكلة ولن تكون حلًا طويل الأمد، كما أن إمداد النماذج بالبيانات نفسها مرارًا وتكرارًا سوف يجعله عُرضة للجاهزية الزائدة عن الحد وهو ما قد يعيق تنفيذ الأوامر، فكما أن الطعام المصنع أو فائق التجهيز خطر على الإنسان، فإن البيانات المفرطة في التكرار سوف تكون خطرًا على الآلة.


آلية JEPA أو نهج تقسيم البيانات لمجموعات وتوزيع الاحتمالات

يقول يان ليكون Yann LeCun كبير علماء الذكاء الاصطناعي في META AI أن أي مراهق يستطيع تعلم قيادة السيارات في 20 ساعة أو أقل، بينما تحتاج أفضل أنظمة القيادة الذاتية اليوم إلى ملايين ومليارات البيانات المصنفة لتعزيز قدرتها!.

لذا اقترح طريقة تطور من قدرة الذكاء الاصطناعي ليتعلم مثل البشر، ويتمثل هذا الاقتراح في توزيع البيانات، مستدلًا في هذا بقدرة البشر والحيوانات على التعلم من خلال كميات صغيرة للغاية من التفاعلات والملاحظات البسيطة والمستمرة، لذا اقترح تقسيم البيانات إلى مجموعات فرعية وتوزيع الاحتمالات ثم دمجها معا.

وقد نجح تطبيق هذه الطريقة بالفعل في زيادة قدرة نماذج الذكاء الاصطناعي على التعامل مع البيانات المعقدة وعالية الأبعاد والتكيف مع البيانات المتغيرة.. لكن هل سوف تؤدي إلى حل فعّال ومستمر لمشكلة توقف تعلم الآلة؟


تقنية تعديل البيانات

وهي طريقة أخرى لإمداد نماذج الذكاء الاصطناعي بالبيانات نفسها ولكن مع إضافة المزيد من التشويش عليها، فيمكن إضافة أقدام أخرى للصور أو معطيات متنوعة مما يقلل من فرط التجهيز ويؤدي لتحسين أداء نموذج الذكاء الاصطناعي.


تعلم تخصصات جديدة

وهي الطريقة الأخيرة المقترحة للتغلب على نفاد البيانات اللازمة لعمل النماذج بكفاءة، وتتمثل في إعادة ضبط نموذج مدرب سابقًا للقيام بمهمة جديدة، وهو الأمر الذي يمكن أن يتم بكمية صغيرة من البيانات وبالتالي يجعله حلًا لمشكلة البيانات الموثوقة القليلة وأكثر توفيرًا للموارد.

ذو صلة

وبتنفيذ هذه الطريقة قد يكون لدينا نماذج قادرة على القيام بمجموعة متنوعة من المهام مختلفة الكفاءة وفقًا لحجم البيانات الموثوقة الموجودة فيها.

وفي النهاية فمن الواضح أنه رغم التطور الفائق في نماذج الذكاء الاصطناعي وقول الكثيرين أنه يفوق البشر، إلا أن محاولات العلماء مستمرة ليواكب فقط قدرة البشر على التطور، فإذا كان الإنسان قادرًا على التعلم الفعّال من مشاهدة بعض الأمثلة البسيطة وتطبيق ما تعلمه بطرق مختلفة لحل المشكلات، فإن الذكاء الاصطناعي شديد الشراهة للبيانات والتي من الواضح أنها حتى الآن لا تفي بحاجته للتطور الفعّال، فإذا كان يحتاج لتخزين ملايين ومليارات منها للقيام بمهمات محدودة، فبالتالي فإن القيام بمهمات أكثر تعقيدًا وتكاملًا قد يكون بعيدًا للغاية عن النماذج الموجودة حاليًا على الأقل.

أحلى ماعندنا ، واصل لعندك! سجل بنشرة أراجيك البريدية

بالنقر على زر “التسجيل”، فإنك توافق شروط الخدمة وسياسية الخصوصية وتلقي رسائل بريدية من أراجيك

عبَّر عن رأيك

إحرص أن يكون تعليقك موضوعيّاً ومفيداً، حافظ على سُمعتكَ الرقميَّةواحترم الكاتب والأعضاء والقُرّاء.

ذو صلة