تريند 🔥

🤖 AI

الساعة الأولى: الرؤية الحاسوبية

الرؤية الحاسوبية
علي عبدو
علي عبدو

7 د

في الحقيقة بداية معرفتي عن هذا المجال بدأت من خلال دراستي الجامعية ومن ثم الماجستير في الذكاء الاصطناعي، وبعد قدومي إلى ألمانيا حصلت على فرصة للعمل وتطبيق خبراتي في شركة تطور برامج تعتمد على معالجة الصورة بشكل أساسي. لذلك أعتقد أني أمتلك قدرًا لا بأس به من المعلومات عن هذا المجال، وبناء عليه أحببت أن أقدم سلسلة مقالات أتحدث فيها عن موضوع الرؤية الحاسوبية وتصنيف الصور والتعليم العميق. 

سيتم نشر مقال جديد عن الموضوع أسبوعيًا، فأتمنى أن تقدم هذه المقالات لكل مهتم في المجال قيمة مضافة وفائدة، وأرحب بأسئلتكم عن المجال في التعليقات، وسأبذل جهدي للرد على الجميع بحسب معرفتي واستطاعتي.

في عالم التكنولوجيا المتقدمة، تلعب الرؤية الحاسوبية دورًا حيويًا في تحسين وتطوير العديد من التطبيقات اليومية التي تسهم في جعل حياتنا أكثر سهولة وفعالية. من الهواتف الذكية التي تتعرف على الوجوه لفتح الجهاز إلى السيارات ذاتية القيادة التي تتجنب العقبات تلقائيًا. من الترفيه الى الصناعة ومن التطبيقات العسكرية الى التطبيقات الاقتصادية، أصبحت هذه التكنولوجيا جزءًا لا يتجزأ من حياتنا اليومية. 

ولكن ما هي الرؤية الحاسوبية بالتحديد؟ وكيف تختلف عن معالجة الصور التقليدية؟ في هذا المقال، سنعمل على تبسيط هذه المفاهيم وتوضيح الأهداف الرئيسية لتقنيات الرؤية الحاسوبية. سنستعرض الفرق بين الرؤية الحاسوبية ومعالجة الصور، والتمييز بينها وبين الذكاء الاصطناعي بشكل عام. كما سنتناول بعض التطبيقات العملية لهذه التقنية، ونوضح التحديات التي تواجهها.

في الأجزاء المقبلة من هذه السلسلة، سنتناول المواضيع بشكل أعمق، ونستكشف تطبيقات وتقنيات متقدمة في مجال الرؤية الحاسوبية، بما في ذلك التعلم العميق وكيفية استخدامه لتحسين دقة الأنظمة وتحليل البيانات البصرية بطرق مبتكرة.


ما هي الرؤية الحاسوبية؟

الرؤية الحاسوبية هي فرع من علوم الحاسوب يهدف إلى تمكين الحواسيب من رؤية وفهم العالم من حولها باستخدام الصور والفيديوهات. تعتمد هذه التقنية على معالجة البيانات البصرية وتحليلها لاستخلاص معلومات مفيدة تمكن النظام من اتخاذ قرارات أو تنفيذ مهام محددة.



ما الفرق بين الرؤية الحاسوبية (Computer vision) ومعالجة الصور (Image processing)؟

الرؤية الحاسوبية ومعالجة الصور هما مفهومان مترابطان ولكنهما مختلفان. في معالجة الصور، يكون الهدف الرئيسي هو تعديل الصور بطرق مختلفة مثل التوضيح أو التنعيم أو التصفية. يتم استخدام هذه التعديلات لتحسين جودة الصورة أو لإعدادها لتحليل لاحق.

في المقابل، تهدف الرؤية الحاسوبية إلى فهم محتوى الصورة دون تغييرها. تستخدم هذه التقنية لاستخلاص معلومات ذات مغزى من الصور، مثل تصنيف الكائنات أو تحديد مواقعها في الصورة. في بعض الحالات، يمكن استخدام معالجة الصور لتحسين جودة الصورة قبل تطبيق تقنيات الرؤية الحاسوبية عليها.



ما الفرق بين الرؤية الحاسوبية (Computer vision) والذكاء الاصطناعي (ِAI)؟

الرؤية الحاسوبية هي جزء من الذكاء الاصطناعي (AI). يركز الذكاء الاصطناعي على إنشاء أنظمة قادرة على أداء مهام تتطلب ذكاءً بشريًا مثل التعلم والاستدلال. في حين تركز الرؤية الحاسوبية بشكل خاص على تمكين الحواسيب من رؤية وفهم العالم البصري.



الأهداف الرئيسية للرؤية الحاسوبية


تصنيف الصور Image Classification

تصنيف الصور هو عملية تحديد نوع أو فئة الكائنات الموجودة في الصورة. تشمل بعض الأمثلة:


  • تصنيف الأشعة السينيّة بأنها سرطانيّة أم لا (تصنيف ثنائيّ).
  • تصنيف رقم مكتوب بخطّ اليد (تصنيف متعدّد الفئات).
  • تصنيف الحيوانات
  • تصنيف المأكولات

تحديد الكائن داخل الصور 

يهدف تحديد الكائن إلى تحديد موقع الكائنات المختلفة في الصورة. تشمل بعض الأمثلة:


  • صورة لشارع ما والمطلوب تحديد كلّ مكان كل كائن في مشهد الشارع (السيارات، اشارات المرور، المارة …).
  • صورة داخل البيت والمطلوب تحديد مكان الأثاث والأشخاص.
  • صورة لمنشأة صناعية. تحديد مكان الآلات المختلفة، وتحديد الأشخاص.

تجزئة الصورة Image Segmentation

تجزئة الصورة تهدف إلى تقسيم الصورة إلى أجزاء مختلفة بناءً على الكائنات الموجودة فيها. هذا يسمح بتحديد كل جزء من الصورة بدقة عالية.



تطبيقات الرؤية الحاسوبية


التعرف على الوجوه

تُستخدم تقنيات التعرف على الوجوه في مجموعة واسعة من التطبيقات، من الفلاتر على وسائل التواصل الاجتماعي إلى أنظمة الأمان التي تعتمد على التعرف على الوجه.





الاستخدام في الصناعة 

تُستخدم الرؤية الحاسوبية في الفحص الآلي للمنتجات على خطوط الإنتاج للكشف عن العيوب وتحسين جودة المنتجات.




السيارات ذاتية القيادة

تستخدم السيارات ذاتية القيادة تقنيات الرؤية الحاسوبية للتعرف على العقبات وإشارات المرور والمشاة لضمان القيادة الآمنة.



التعرف على النصوص 

تتيح تقنيات التعرف على النصوص للحواسيب قراءة وترجمة النصوص من الصور، مثل تطبيق ترجمة غوغل الذي يستخدم الصور لترجمة النصوص.



الواقع المعزز

تتيح تقنيات الرؤية الحاسوبية تحسين التجارب التفاعلية في الواقع المعزز، مما يجعل التطبيقات أكثر تفاعلية وواقعية.



المجال الطبي

تُستخدم الرؤية الحاسوبية في المجال الطبي لتحليل الصور الطبية مثل الأشعة السينية والتصوير بالرنين المغناطيسي لتحسين التشخيص والعلاج.




تحديات الرؤية الحاسوبية

قبل أن نخوض في تحديات الرؤية الحاسوبية، علينا أن نرى الصور من وجهة نظر الحاسب.


كيف يرى الحاسب الصورة

الحاسب يرى الصورة على شكل مصفوفة من الأرقام، حيث تمثل كل قيمة في المصفوفة درجة معينة من اللون الرمادي أو الألوان. هذا التمثيل العددي يجعل فهم الصورة من قبل الحاسب أمرًا معقدًا.

إذا رأيتم الصورة التالية ستكتشفون مباشرة أنها صورة لرقم ثمانية



لكن ماذا يرى الحاسب؟؟


الحاسب لا يرى سوى أرقام. بشكل أدق مصفوفة من الأرقام. القيم تتراوح بين 0 و 255. 0 تعني اللون الاسود و255 تعني اللون الأبيض وما بينهما هي درجات اللون الرمادي.



الصور الملونة



إذا الحاسب يرى فقط مجموعة من الأرقام، لذلك عندما نقول ان الرؤية الحاسوبية معقدة وصعبة، يبدو أن الأمر منطقي الآن. فكيف يمكن للحاسب أن يجد مثلا قطة ضمن كومة الأرقام تلك. هذا هو التحدي الأكبر، بالإضافة إلى ذلك، فإن هنالك مجموعة من الأمور والعوامل تجعل الموضوع أكثر تعقيدًا.


ظروف الإضاءة المتغيرة

تؤثر ظروف الإضاءة على جودة الصور وقدرة النظام على تحليلها بدقة.



تغيّر المنظور والحجم

تغير زاوية التصوير أو حجم الكائن يمكن أن يؤثر على دقة التعرف على الكائنات.



اختفاء جزء من الكائن

قد يكون من الصعب على النظام التعرف على الكائنات إذا كانت أجزاء منها مخفية.



تشوه شكل الكائن

تشوهات الكائنات بسبب الحركة أو التصوير من زوايا غير مثالية يمكن أن تعيق عملية التعرف عليها.


قبل أن نغوص في العمق في الجزء الثاني، أجد من المفيد أن نعود قليلا في التاريخ لنتعرف على أهم المحطات في تاريخ الرؤية الحاسوبية، وبعدها نلقي الضوء على أهم المحاور التي من الممكن أن تُشكل مستقبل هذا القطاع التكنولوجي الهام. 

تاريخ موجز للرؤية الحاسوبية

بدأت الرؤية الحاسوبية في الستينيات مع تطور أول ماسح ضوئي للصور الرقمية. ومنذ ذلك الحين، شهدت هذه التقنية تطورات كبيرة مع ظهور الشبكات العصبية والخوارزميات المتقدمة. اليوم، تستخدم تقنيات الرؤية الحاسوبية في مجموعة واسعة من التطبيقات من التعرف على الوجوه إلى السيارات ذاتية القيادة. اليكم المخطط التالي الذي يبين أهم المحطات التاريخية.


بعد 2012، تحول التطور في تكنولوجيا الرؤية الحاسوبية إلى تطور في خوارزميات التعليم العميق التي باتت أكثر قدرة وفعالية، وهي ما زالت تتطور بشكل يومي. هذه أهم الخوارزميات مع سنة نشرها.


المخطط التالي يبين تطور دقة تصنيف الصور مع كل خوارزمية يتم نشرها.



مستقبل الرؤية الحاسوبية

قدر حجم السوق العالمية للرؤية الحاسوبية بـ 11.7 مليار دولار أمريكي في عام 2021. ومن المتوقع أن يبلغ معدل النمو السنوي المركب 6.9٪ بين الفترة من 2021 إلى 2030. وبالتالي من المتوقع أن يصل السوق إلى 21.3 مليار دولار أمريكي بحلول عام 2030.


التطورات المستقبلية المتوقعة

  • الذكاء الاصطناعي والتعلم العميق: من المرجح أن تستمر تقنيات التعلم العميق في تحسين قدرات الرؤية الحاسوبية، مما قد يمكن الأنظمة من فهم الصور والفيديوهات بشكل أكثر دقة وفعالية.
  • الأتمتة الصناعية: يمكن أن تصبح أنظمة الفحص الآلي باستخدام الرؤية الحاسوبية أكثر شيوعًا في المصانع، مما قد يسهم في تحسين جودة المنتجات وزيادة الكفاءة.
  • التطبيقات الطبية: من المحتمل أن يشهد المجال الطبي تقدمات كبيرة في استخدام الرؤية الحاسوبية لتحليل الصور الطبية وتشخيص الأمراض بدقة أعلى وسرعة أكبر.
  • التفاعلات الذكية: قد تسهم الرؤية الحاسوبية في تطوير تفاعلات أكثر ذكاءً وواقعية في تقنيات الواقع الافتراضي والمعزز، مما يعزز من تجربة المستخدم.
  • السيارات الذاتية القيادة: من المتوقع أن تصبح تقنيات الرؤية الحاسوبية أكثر تطورًا ودقة، مما قد يسهم في تحسين سلامة وفعالية السيارات الذاتية القيادة على الطرق.

مصادر ومراجع للتعلم

لمن يرغب في التعرف أكثر على هذا المجال، هناك العديد من الكتب والدورات المتاحة:

  • كتب مثل "Computer Vision: Algorithms and Applications" و"Learning OpenCV 4 Computer Vision with Python 3".
  • دورات عبر الإنترنت مثل "Introduction to Computer Vision and Image Processing" على Coursera و"Introduction to Computer Vision" على Udacity.
ذو صلة

خاتمة

الرؤية الحاسوبية هي مجال مثير ومليء بالتحديات، يقدم إمكانيات هائلة لتحسين حياتنا. من خلال فهم كيفية عمل هذه التقنية وتطبيقاتها المختلفة، يمكننا الاستفادة من الإمكانيات الكبيرة التي توفرها لتطوير حلول مبتكرة في مختلف المجالات.

أحلى ماعندنا ، واصل لعندك! سجل بنشرة أراجيك البريدية

بالنقر على زر “التسجيل”، فإنك توافق شروط الخدمة وسياسية الخصوصية وتلقي رسائل بريدية من أراجيك

عبَّر عن رأيك

إحرص أن يكون تعليقك موضوعيّاً ومفيداً، حافظ على سُمعتكَ الرقميَّةواحترم الكاتب والأعضاء والقُرّاء.

مقال شيق ورائع, شكرا للمعلومات المفيده و الشرح المبسط

ذو صلة