قوائم أراجيك

طفرة جديدة من إنفيديا… Blackwell Ultra يحقق أداءً أقوى 50 مرة في الذكاء الاصطناعي

عبد الرحمن عمرو
عبد الرحمن عمرو

3 د

كشفت إنفيديا عن أداء GB300 NVL72 بزيادة 50 ضعفًا في الإنتاجية لكل ميغاواط.

تحول التركيز إلى الاستدلال، حيث أصبح تشغيل النموذج القلبي للعمل التجاري.

تحسينات برمجيات TensorRT-LLM تضاعف الإنتاجية لكل وحدة معالجة خلال أشهر.

تسارع سباق السحابة مع نشر نظم GB300 NVL72 سريعًا بفعالية تجارية.

تقدم منصة Rubin القادمة أداءً أعلى بعشرة أضعاف من Blackwell.

عندما يتباطأ رد مساعدك الذكي لثوانٍ إضافية، يبدو الأمر تفصيلاً صغيراً. لكن في عالم يعتمد على الاستجابة اللحظية — من أدوات البرمجة إلى الوكلاء الأذكياء — تتحول كل ميلي ثانية إلى تكلفة، وكل واط كهرباء إلى معادلة اقتصادية كاملة. في هذا السياق كشفت إنفيديا عن أرقام أداء جديدة لمنصة GB300 NVL72 المزودة بمعالجات Blackwell Ultra، تعد فيها بزيادة تصل إلى 50 ضعفاً في الإنتاجية لكل ميغاواط وبتقليص تكلفة التوكن الواحد حتى 35 مرة مقارنة بجيل Hopper السابق.


تحول مركز الثقل إلى الاستدلال

لسنوات كان التركيز منصباً على تدريب النماذج الضخمة، حيث تستهلك مراكز البيانات آلاف المعالجات لبناء نموذج لغوي جديد. اليوم يتغير المشهد. الاستدلال، أي تشغيل النموذج لخدمة المستخدمين في الزمن الحقيقي، أصبح قلب العملية التجارية. كل رسالة يرسلها مستخدم، وكل سطر كود يُولَّد، يعني ملايين “التوكنات” التي يجب معالجتها بسرعة وكفاءة.

بحسب الأرقام التي عرضتها إنفيديا، فإن Blackwell Ultra يقدم 1.5 ضعف أداء الحوسبة مقارنة بالنسخة القياسية من Blackwell، مع مضاعفة أداء طبقات الانتباه عبر تسريع عمليات softmax. هذه التحسينات ليست تفاصيل تقنية معزولة؛ بل تعالج عنق الزجاجة في نماذج المحولات، خصوصاً تلك التي تعمل بسياقات طويلة وتطبيقات تفكير معقدة.


معمارية جديدة… وبرمجيات أكثر نضجاً

القفزة لا تعود إلى العتاد وحده. مكتبة TensorRT-LLM المخصصة للاستدلال شهدت تحسينات مستمرة، ما أدى إلى مضاعفة الإنتاجية لكل وحدة معالجة في بعض السيناريوهات خلال أشهر قليلة. هنا تتضح معادلة إنفيديا التقليدية: بنية معالج جديدة مدعومة بطبقة برمجية شديدة التحسين.

النتيجة المجمعة، كما تشير الشركة، هي زيادة بعشرة أضعاف في عدد التوكنات في الثانية لكل مستخدم، وخمسة أضعاف لكل ميغاواط، ما يترجم إلى تعزيز شامل لقدرة ما تسميه “مصانع الذكاء الاصطناعي”. الحديث لم يعد عن جهاز أسرع فقط، بل عن بنية تحتية قادرة على تقديم استجابات منخفضة الكمون مع استهلاك طاقة أقل.


سباق السحابة يتسارع

اللافت أن مزودي الخدمات السحابية تحركوا سريعاً. CoreWeave أعلنت نشر أنظمة GB300 NVL72 في بيئة إنتاجية فعلية، بينما نشرت مايكروسوفت عنقوداً ضخماً يحقق أكثر من 1.1 مليون توكن في الثانية على رف واحد خلال اختبارات تحقق مستقلة. كذلك تخطط Oracle لتوسيع عناقيدها إلى أكثر من مئة ألف وحدة Blackwell لتلبية الطلب المتزايد على أعباء الاستدلال.

هذه الأرقام تكشف اتجاهاً واضحاً: السحابة لم تعد تبحث فقط عن معالجات أقوى، بل عن كفاءة طاقة أعلى لكل عملية ذكاء اصطناعي. فالواقع أن تكلفة الكهرباء والتبريد أصبحت عنصراً مركزياً في حسابات الربحية.


اقتصاديات جديدة لوكلاء الذكاء الاصطناعي

حين تنخفض تكلفة المليون توكن بهذا الحجم، تتغير جدوى تطبيقات كاملة. شركات متخصصة في الاستدلال مثل Baseten وDeepInfra وFireworks AI وTogether AI أشارت بالفعل إلى خفض التكاليف بما يصل إلى عشرة أضعاف مع الجيل السابق من Blackwell. النسخة Ultra ترفع السقف أكثر، خصوصاً في سيناريوهات الكمون المنخفض الضرورية للمساعدين البرمجيين والوكلاء الأذكياء.

  • تحسين الكفاءة يعني إمكانية تقديم خطط اشتراك أرخص أو هوامش ربح أعلى.
  • الأداء الأعلى لكل ميغاواط يخفف الضغط على الطاقة في مراكز البيانات.
  • الاستجابة الأسرع تفتح الباب لتجارب استخدام أكثر تعقيداً وسلاسة.

ما بعد Blackwell

ذو صلة

إنفيديا استعرضت أيضاً منصة Rubin القادمة، التي تعد بزيادة أداء إضافية تصل إلى عشرة أضعاف مقارنة بـ Blackwell. قد يبدو الرقم امتداداً للحماسة المعتادة في هذا القطاع، لكنه يعكس إيقاعاً متسارعاً لابتكارات المعالجات المخصصة للذكاء الاصطناعي.

المثير هنا أن المنافسة لم تعد تدور حول من يدرّب النموذج الأكبر فحسب، بل حول من يشغّله بكفاءة أعلى وعلى نطاق أوسع وبتكلفة أقل لكل استجابة. في هذا التحول تكمن القصة الحقيقية: الذكاء الاصطناعي يغادر المختبرات إلى خطوط الإنتاج الرقمية، ومع كل جيل معالجات جديد يعاد رسم حدود الممكن اقتصادياً قبل أن يُعاد رسمه تقنياً.

عبَّر عن رأيك

إحرص أن يكون تعليقك موضوعيّاً ومفيداً، حافظ على سُمعتكَ الرقميَّةواحترم الكاتب والأعضاء والقُرّاء.

ذو صلة