تريند 🔥

🌙 رمضان 2024

تجارب “شطرنج” من جوجل تكشف كيف تزيد قوة الذكاء الاصطناعي!

مريم مونس
مريم مونس

6 د

عبر الحواسيب التي تجمع بين مناهج متعددة لحل ألغاز الشطرنج، طورت جوجل ذكاء اصطناعيًا متقدمًا يتفوق على بطلها الحالي، ألفا زيرو، عبر تعزيز القدرة على التعامل مع المواقف الصعبة والإبداع في الحلول.

تُظهر التجارب أهمية التنوع في التعلم والتفكير الإبداعي داخل مجال الذكاء الاصطناعي، حيث يسمح الجمع بين استراتيجيات متنوعة للنظام بتجاوز القيود السابقة واستكشاف حلول جديدة بفعالية أكبر.

تُعد هذه النتائج خطوة نحو فهم أعمق لكيفية تعزيز الإبداع والتعميم في الذكاء الاصطناعي، مما يفتح آفاقًا جديدة لتطبيقاته في مجالات مختلفة، من الألعاب الاستراتيجية مثل الشطرنج إلى تطوير الأدوية واستراتيجيات تداول الأسهم.

عندما فرض فيروس كوفيد-19 على الناس العودة إلى منازلهم مطلع عام 2020، أعاد توم زاهافي، عالم الكمبيوتر، اكتشاف شغفه بلعبة الشطرنج، التي كان يمارسها في طفولته. وقد استلهم من قراءته لمذكرات جاري كاسباروف "التفكير العميق"، التي تناولت مبارياته ضد الكمبيوتر الشهير "ديب بلو" من آي بي إم في عام 1997، بالإضافة إلى متابعته لمقاطع فيديو الشطرنج على يوتيوب ومسلسل "The Queen’s Gambit" على نتفليكس.

مع ذلك، لم يكن زاهافي يسعى لتحسين مستواه في اللعبة، بل كان يجد متعة أكبر في حل ألغاز الشطرنج، التي تتطلب غالبًا تفكيرًا خارج الصندوق ولا تحدث عادةً في المباريات الواقعية. هذه الألغاز، بالرغم من كونها وسيلة لصقل مهارات اللاعبين، كشفت أيضًا عن قصور برامج الشطرنج الحاسوبية، خصوصًا من خلال لغز شهير ابتكره السير روجر بنروز في عام 2017، الذي أظهر أن البرامج القوية قد تفشل في تقييم المواقف بدقة مقارنةً باللاعبين البشريين ذوي الخبرة.

أثارت هذه الألغاز فضول زاهافي، الذي أصبح مهتمًا بفهم سبب صعوبة هذه المواقف على الحواسيب، بينما يمكن للبشر حل بعضها. وفي إطار عمله كعالم أبحاث في جوجل ديب مايند، بدأ زاهافي في استكشاف طرق إبداعية لمعالجة المشكلات، متجاوزًا الأساليب التقليدية المعتمدة في برامج الشطرنج القائمة على الذكاء الاصطناعي.

من هذا المنطلق، طور زاهافي وفريقه طريقة لدمج عدة أنظمة ذكاء اصطناعي تعمل بتناغم لحل الألغاز، مستفيدين من تنوع الاستراتيجيات والمناهج. أظهر النظام الجديد، الذي يجمع بين ما يصل إلى 10 أنظمة متخصصة، قدرة فائقة على التعامل مع ألغاز بنروز بشكل أكثر إبداعًا وكفاءة مقارنةً ببرنامج AlphaZero منفردًا.

أكد هذا الابتكار على أهمية التعددية في الذكاء الاصطناعي وألهم الباحثين في مجالات مختلفة، مثل أليسون ليمهيتشارات من دورداش وأنطوان كولي من إمبريال كوليدج لندن، الذين أشادوا بالنهج الجديد واعتبروه خطوة نحو حلول أكثر إبداعًا وفعالية في مواجهة التحديات المعقدة، ليس فقط في لعبة الشطرنج ولكن في مجالات عديدة تتطلب تفكيرًا متعدد الأبعاد.


مطاردة الفشل: كيف يكشف التعلم المعزز عن حدود الذكاء الاصطناعي

قبل انضمامه إلى "ديب مايند"، كان توم زاهافي مفتونًا بالتعلم المعزز العميق، وهو مجال من الذكاء الاصطناعي يعتمد على استخدام الشبكات العصبية لتعليم النظام بعض المهام من خلال التجربة والخطأ. هذا المبدأ يشكل الأساس لأقوى برامج الشطرنج، ويُستخدم أيضًا في مجالات أخرى مثل السيارات ذاتية القيادة. يبدأ النظام بفهم بيئته، مثل لوحة الشطرنج والحركات المحتملة في اللعبة، أو كل ما يحيط بالسيارة في حالة القيادة الذاتية. ثم يتخذ قرارات ويقوم بإجراءات، يقيّم بعدها مدى نجاحه في تحقيق هدفه. كلما اقترب من هذا الهدف، يحصل على مكافآت تحفزه على تحسين أدائه.

لقد كان التعلم المعزز هو الأسلوب الذي مكّن AlphaZero من تحقيق مستوى الأستاذية في الشطرنج، حيث لعب 44 مليون مباراة ضد نفسه خلال التسع ساعات الأولى من تدريبه في ديسمبر 2017، متعلمًا تدريجيًا كيفية اختيار الحركات الأكثر فعالية.

رغم نجاح التعلم المعزز، فإنه لا يضمن دائمًا تطوير استراتيجيات تعكس فهمًا عميقًا للعبة. لاحظ زاهافي وزملاؤه بعض السلوكيات الغريبة والأخطاء الناتجة عن التدريب على أساس التجربة والخطأ، مثل الاستغلال المفرط لثغرات في ألعاب الفيديو أو العجز أمام ألغاز معينة، مما يشير إلى وجود "بقع عمياء" في فهم النظام.

زاهافي يرى أن هذه البقع العمياء قد تكون في الواقع مرتبطة بالمكافآت الداخلية للنظام، وليست مجرد أخطاء. هذه الأنظمة لا تفهم مفهوم الفشل بشكل كامل، وهو ما يحد من قدرتها على الابتكار والتعامل مع مشكلات جديدة. يبدو أن الذكاء الاصطناعي لا يزال بحاجة إلى تعلم كيفية الفشل بشكل إبداعي، ليتمكن من تجاوز هذه العقبات وتطوير حلول أكثر تطورًا.


التحسين المبتكر: كيف يُعيد التنوع في التعلم المعزز تشكيل مهارات الذكاء الاصطناعي

تكمن أهمية الأخطاء التي تواجهها أنظمة الذكاء الاصطناعي في مشكلة التعميم، حيث تجد هذه الأنظمة صعوبة في تطبيق الاستراتيجيات المتعلمة من موقف معين على مشكلات متنوعة. يُشير جوليان توجيليوس، الباحث في مجال التعلم المعزز، إلى هذا التحدي بالقول: "غالبًا ما يؤدي التعلم المعزز إلى تطوير 'سياسة' تحل مشكلة محددة، لكنها تفشل في التعميم على سياقات أخرى". وقد لاحظ توم زاهافي، العامل في جوجل ديب مايند، أن ألغاز بنروز تمثل تحديًا خاصًا يتطلب هذا النوع من التعميم، حيث فشل AlphaZero في حل الألغاز بسبب تركيزه المفرط على الفوز في الألعاب من البداية إلى النهاية، مما أدى إلى ظهور "نقاط عمياء" كُشفت بواسطة ترتيبات القطع غير المتوقعة في ألغاز بنروز.

اعتقد زاهافي أن الحل يكمن في منح البرنامج مساحة كافية للإبداع وتجريب أساليب تدريب مختلفة. ولإثبات نظريته، جمع هو وزملاؤه مجموعة من ألغاز بنروز وأخرى تحدي، ليجدوا أن AlphaZero بمفرده استطاع حل أقل من 4% من ألغاز بنروز وأقل من 12% من الألغاز الإضافية. وعند تدريب AlphaZero على اللعب ضد نفسه بدءًا من ترتيبات ألغاز بنروز، تحسن أداؤه بشكل ملحوظ، حيث نجح في حل 96% من ألغاز بنروز و76% من مجموعة التحديات.

من هذه النتائج، قرر زاهافي وفريقه تطوير نسخة متنوعة من AlphaZero تضم مجموعة من أنظمة الذكاء الاصطناعي المدربة بشكل مستقل على مواقف متنوعة. وقد وجدوا أن هذا التنوع الإبداعي أدى إلى زيادة كبيرة في الأداء، حيث هزم النظام المتنوع الإصدار الأصلي من AlphaZero في معظم المباريات وحل ضعف عدد ألغاز التحدي، وأكثر من نصف إجمالي كتالوج ألغاز بنروز.

يُظهر هذا البحث أن التنوع في التعلم يمكن أن يعزز بشكل كبير قدرة الذكاء الاصطناعي على التعامل مع مشكلات جديدة وغير متوقعة، مما يفتح آفاقًا جديدة ليس فقط في عالم الشطرنج ولكن في تطبيقات الذكاء الاصطناعي الأوسع.


 توسيع آفاق الذكاء الاصطناعي بما يتجاوز التعلم المعزز

أكد أنطوان كولي على أن النهج المتنوع له القدرة على تعزيز أداء أي نظام ذكاء اصطناعي، وليس فقط تلك المبنية على التعلم المعزز. استُخدم هذا المبدأ في تدريب الأنظمة الفيزيائية، مثل روبوت ذي ستة أرجل تم تمكينه من تجريب أشكال متنوعة من الحركة، ثم "إصابته" عمداً لتشجيعه على استخدام استراتيجيات جديدة. كولي شرح أن الهدف هو خلق مجموعة واسعة من الحلول المتباينة، مما يسمح لنظام الذكاء الاصطناعي باختيار الحل الأمثل لكل موقف، تمامًا كما يفعل لاعب الشطرنج المتنوع.

يعتقد زاهافي أن لدفع أنظمة الذكاء الاصطناعي للتفكير في خيارات أوسع قد يكون مفتاحًا لتحقيق الإبداع الآلي. يشير هذا إلى إمكانية وجود توازي بين الذكاء البشري والصناعي، حيث يُنظر إلى الذكاء على أنه قدرة على تقييم واختيار من بين مجموعة كافية من الخيارات. بتحفيز النظام على تقدير تنوع الاستراتيجيات، يتم تشجيع نوع من التفكير الإبداعي.

ذو صلة

ليمهيتشارات تنوه إلى أن النهج المتنوع قد لا يحل بشكل كامل تحدي التعميم في التعلم الآلي، ولكنه يُعد خطوة نحو تحسينه. وتتوافق هذه النتائج مع الملاحظات التي تُظهر أن التعاون يمكن أن يؤدي إلى أداء أفضل في المهام المعقدة بين البشر، مثل تأليف الأغاني.

رغم أن النهج المتنوع يُعد مكلفًا حسابيًا نظرًا لضرورة أخذه في الاعتبار لعدد أكبر من الاحتمالات مقارنة بالأنظمة التقليدية، يظل زاهافي مقتنعًا بأن هناك مجالًا لاستكشاف حلول جديدة. ويُشير إلى أن العالم المليء بالبيانات قد يحمل أكثر من إجابة واحدة لكل تحدٍ.

أحلى ماعندنا ، واصل لعندك! سجل بنشرة أراجيك البريدية

بالنقر على زر “التسجيل”، فإنك توافق شروط الخدمة وسياسية الخصوصية وتلقي رسائل بريدية من أراجيك

عبَّر عن رأيك

إحرص أن يكون تعليقك موضوعيّاً ومفيداً، حافظ على سُمعتكَ الرقميَّةواحترم الكاتب والأعضاء والقُرّاء.

ذو صلة