LEAP26

شركة OpenAI تستعد لإطلاق جيل جديد من تقنيات الذكاء الاصطناعي المتقدمة لإنشاء الصور

عبد الرحمن عمرو
عبد الرحمن عمرو

3 د

تستعد OpenAI لإطلاق جيل جديد من نماذج توليد الصور بجودة أعلى.

تسريبات تشير إلى نماذج غامضة بأسماء شريطية ودعم دقة 4K.

النموذج الجديد يعتمد على بنية جديدة مع أسلوب توليد بمرحلة واحدة.

تعتزم OpenAI إيقاف DALL·E 2 وDALL·E 3 في مايو، مفسحة المجال لنموذج جديد.

التركيز ينتقل من جودة الصور إلى القدرة على التكامل والاندماج في العمل اليومي.

قبل سنوات قليلة، كان توليد صورة مقنعة عبر الذكاء الاصطناعي يتطلب بعض التسامح مع عيوب النصوص المشوشة والوجوه غير المتناسقة. اليوم، يبدو أن المرحلة التجريبية توشك على الانتهاء. تقارير حديثة تشير إلى أن OpenAI تستعد لإطلاق جيل جديد من نماذج توليد الصور، قد يُعرف باسم GPT Image 2، مع وعود بجودة أعلى ونصوص أكثر دقة، في لحظة اشتدّت فيها المنافسة مع Google وAdobe.


تسريبات تكشف ملامح الجيل الجديد

بحسب تقرير نشره موقع The Information، رُصدت نماذج غامضة بأسماء شريطية على منصة LM Arena المتخصصة في الاختبارات العمياء بين نماذج الذكاء الاصطناعي. النماذج ظهرت لساعات قبل أن تُزال، لكن ذلك كان كافياً لتنتشر اللقطات عبر Reddit ومنتديات المطورين. مستخدمون أشاروا إلى واقعية فوتوغرافية لافتة، ودقة شبه كاملة في كتابة النصوص داخل الصور، إضافة إلى دعم دقة 4K بشكل أصلي.

هذه التفاصيل ليست تحسينات تجميلية فحسب. أحد أوجه القصور التقليدية في مولدات الصور كان تشويه الحروف أو عكسها أو توليد كلمات غير مفهومة. تجاوز هذه العقبة يعني اقتراب النماذج من الاستخدام الإنتاجي الفعلي في الإعلانات، تصميم الواجهات، والمواد التعليمية دون حاجة لتعديل يدوي مكثف.


تحول معماري بدل تطوير تدريجي

المعلومات المتداولة تشير إلى أن النموذج الجديد لا يعتمد على خط معالجة GPT-4o الذي استندت إليه إصدارات GPT Image 1 و1.5، بل يستخدم بنية جديدة كلياً مع اعتماد أسلوب توليد بمرحلة واحدة بدلاً من مرحلتين. تقنياً، هذا قد يفسر ارتفاع الجودة وسرعة الاستجابة في آن واحد.

الانتقال من تحسين تدريجي إلى إعادة تصميم معمارية يحمل دلالة مهمة. السوق لم يعد يكتفي بتعديلات طفيفة، بل ينتظر قفزة في الأداء والكفاءة. ومع تنامي الطلب على المحتوى المرئي المدعوم بالذكاء الاصطناعي، تصبح سرعة التوليد وتكلفة التشغيل عاملين حاسمين في المنافسة.


لحظة حساسة قبل إيقاف DALL·E

التوقيت يبدو محسوباً. OpenAI تعتزم إيقاف DALL·E 2 وDALL·E 3 في مايو، ما يخلق فراغاً يتطلب بديلاً قوياً. في المقابل، دفعت Adobe نماذج OpenAI وGoogle إلى داخل تطبيق Firefly إلى جانب نماذجها الخاصة، بينما تواصل Google تحسين نموذج Nano Banana Pro الذي يُنظر إليه كمعيار جديد في الواقعية البصرية.

هذا التداخل بين الشركات يعني أن المستخدم النهائي لم يعد يهتم باسم النموذج بقدر ما يهتم بالنتيجة: صورة نظيفة، نص واضح، وتكلفة معقولة. الشركات تتنافس الآن في طبقة “الفائدة العملية” لا في طبقة الاستعراض التقني فقط.


من سباق الصور إلى سباق الذكاء المتعدد

إحدى الملاحظات اللافتة في التحليلات المصاحبة للتسريبات أن المنافسة تتحول من مجرد توليد صورة جميلة إلى بناء منظومة متعددة الوسائط قادرة على الفهم والتحرير والتكامل مع النص والصوت. عندما يصبح النموذج قادراً على إنشاء صورة، ثم تعديلها، ثم تفسيرها، فإننا أمام طبقة جديدة من الإنتاج المعرفي.


المنافسة تنتقل من جودة الصورة إلى قيمة الاستخدام اليومي وقدرة النموذج على الاندماج في سير العمل.

ذو صلة

هنا تحديداً يتحدد الفارق بين أداة للمتعة البصرية وأداة للبناء التجاري والإبداعي.

سواء حمل الاسم GPT Image 2 أو غيره، فإن ما نراه هو مرحلة نضج مبكرة في جيل جديد من الذكاء البصري. الاختبار الحقيقي لن يكون في دقة البكسل، بل في قدرة النموذج على أن يصبح جزءاً طبيعياً من أدوات المصمم والمبرمج والمسوق. في النهاية، التكنولوجيا التي تستمر ليست الأعلى ضجيجاً، بل الأكثر اندماجاً في تفاصيل العمل اليومي.

عبَّر عن رأيك

إحرص أن يكون تعليقك موضوعيّاً ومفيداً، حافظ على سُمعتكَ الرقميَّةواحترم الكاتب والأعضاء والقُرّاء.

ذو صلة