ديب مايند طوّرت ذكاء اصطناعيّ يحوّل الصّور ثنائية الأبعاد إلى مشاهد ثلاثيّة الأبعاد!

0

شارك المقال 👈

Share on facebook
Share on twitter
Share on linkedin
Share on pocket

تستمر إنجازات شركة ديب مايند DeepMind بإبهارنا في كل خطوة جديدة تخطوها، أو إنجاز جديد تحققه في مجال الذكاء الاصطناعي. فإنجاز الشركة عندما قام ذكائها الاصطناعي بهزيمة بطل العالم في لعبة غو لا يزال يُذكر حتّى هذه اللحظة، واليوم سنتكلم عن إنجاز جديد للشركة، لا يقل أهمية عن الإنجازات السابقة، حيث طوّر ديب مايند ذكاءً اصطناعيًا قادرًا على عرض مشاهد كاملة ثلاثية الأبعاد بعد مشاهدته فقط لصور مسطحة ثنائية الأبعاد.

يحاول باحثو الذكاء الاصطناعي تطوير خوارزمياتهم بهدف جعل الآلات قادرة على الرؤية كالبشر، فنحن نرى العالم بشكل ثلاثي الأبعاد، ونضع التصوّرات والافتراضات عن كل ما يحيطنا، فإذا ما دخلنا غرفة تحوي أغراضًا سنستطيع تخيّل أشكالها حتّى لو لم نراها كاملةً، كأن نشاهد ثلاث أرجل للطاولة ونستنتج وجود رجلًا رابعةً من الخلف حتّى دون رؤيتها، بعكس الذكاء الاصطناعي الّذي لا يرى سوى بكسلات الصور، ولا يفهم سوى المشهد الّذي يراه دون سواه.

هذا هو الإنجاز الجديد إذًا، ويتمثّل في جعل الذكاء الاصطناعي قادرًا على تخيّل ماهيّة الأشكال ثلاثية الأبعاد حتّى دون أن يراها كاملةً، إنطلاقًا من صور ثنائية الأبعاد لذات الأشكال، من مساقط مختلفة، وهي مهارة صعبة حتى على البشر في بعض الأحيان، واسألوا من قام بدراسة مادة الرسم الصناعي سابقًا لتدركوا مدى صعوبة الأمر.

أطلق ديب مايند على الخوارزمية الجديدة اسم “شبكة البحث التجريبية (GQN)”، وهي شبكة عصبيّة مصممة لتعليم الذكاء الاصطناعي كيف يتخيّل شكل الكائنات والأغراض من منظور مختلف. في الأساس، يكون دخل الشبكة العصبية صورًا ثنائية الأبعاد مسطحة لمشهد أو غرض ما. ما هو مهم، في هذه الحالة، هو أنّ الذكاء الاصطناعي لشركة ديب مايند لا يستخدم أي مدخلات أو معلومات سابقة تخص الإنسان، والدخل لا يتعدى ثلاث صور ومع ذلك يمكن للخوارزمية التنبؤ بما ستبدو عليه نسخة ثلاثية الأبعاد من المشهد.

حقوق الصورة: deepmind.com

يتكون نموذج GQN _كما مبيّن أعلاه_ من جزئين أو شبكتين عصبيّتين الأولى للتمثيل والأخرى للتوليد. تأخذ شبكة التمثيل الصور ثنائية الأبعاد كدخل لها، أمّا خرجها يكون عبارةً عن تمثيلٍ للمشهد، وهي خطوة عاديّة لا تختلف كثيرًأ عن الشبكات المختلفة الّتي يكون هدفها فهم الصور. أما شبكة التوليد فهي المؤولة عن “تخيّل” المشهد من وجهة نظر مختلفة، غير موجودة في الصور ثنائية الأبعاد.

تمّ نشر كل التفاصيل التقنية في مجلة العلوم، ويمكنكم الإطلاع عليها (التفاصيل التقنية)، أو مشاهدة الفيديو التالي.

في الوقت الحالي، لم يتم تدريب الشبكات على صور حقيقية، واكتفى الباحثون ببعض الأشكال الهندسية البسيطة ومتوسطة التعقيد، وبالتالي فإن الخطوة التالية الّتي يهدف الباحثون لها هي خلق مشاهد واقعية من الصور الفوتوغرافية الحقيقية.

تخيّل إمكانية تشكيل مقطع فيديو قصيرابتداءً من صورة فوتوغرافية، في الحقيقة أمر مثير للاهتمام بشكل كبير، ولكن هل تعتقدون أن مثل هذا التطبيق سيكون ذو أثر فعلي في الواقع؟ شاركونا آرائكم عن طريق التعليقات.

0

شاركنا رأيك حول "ديب مايند طوّرت ذكاء اصطناعيّ يحوّل الصّور ثنائية الأبعاد إلى مشاهد ثلاثيّة الأبعاد!"

أضف تعليقًا