LEAP26

يتصدر بقوة GLM-5.1 يتجاوز أقوى النماذج مثل GPT وClaude في أداء البرمجة

عبد الرحمن عمرو
عبد الرحمن عمرو

3 د

شركة Z.

ai تطلق نموذج GLM-5.

1 القادر على العمل بشكل مستقل لثماني ساعات.

GLM-5.

1 يتصدر اختبار SWE-Bench Pro، متفوقًا على نماذج مغلقة مثل GPT-5.

4.

النموذج يتميز بتجربة "الهندسة الوكيلة"، مدعومًا بتحسينات في المحاذاة بعد التدريب.

يدعم نافذة سياقية كبيرة تصل إلى 200 ألف رمز، مما يفيد قاعدة الشيفرة الكبيرة.

Z.

ai تشير إلى توسع المنافسة خارج المختبرات الأميركية مع تطوير النماذج مفتوحة المصدر.

تخيّل أن تُسنِد مهمة برمجية معقّدة إلى نظام ذكاء اصطناعي، ثم تتركه يعمل بمفرده لساعات، يخطط وينفّذ ويختبر ويُعيد المحاولة دون أن يطلب توجيهاً. هذا بالضبط ما تراهن عليه شركة Z.ai مع إطلاق نموذجها الجديد GLM-5.1، الذي تقول إنه قادر على العمل بشكل مستقل على مهمة ترميز واحدة لمدة تصل إلى ثماني ساعات متواصلة. إعلانٌ لا يستهدف أرقاماً قياسية فحسب، بل يعيد طرح سؤال قديم: إلى أي حد يمكن للذكاء الاصطناعي أن يصبح “مهندساً” يعمل إلى جوارك؟


صدارة في اختبار المطورين

النموذج الجديد تصدّر اختبار SWE-Bench Pro بنتيجة 58.4 نقطة، متفوقاً على نماذج مغلقة المصدر مثل GPT-5.4 وClaude Opus 4.6 وGemini 3.1 Pro. هذا الاختبار يُعد من المقاييس المهمة لقياس قدرة النماذج على فهم مشكلات برمجية حقيقية داخل مستودعات مفتوحة المصدر، واقتراح إصلاحات دقيقة قابلة للتنفيذ.

الأهمية هنا ليست في التفوق العددي فقط، بل في دلالته على نضج نماذج مفتوحة المصدر في مجال هندسة البرمجيات. عندما يقترب نموذج متاح بالأوزان المفتوحة من قمة هذا المعيار، فإن ذلك يوسّع هامش المنافسة ويضغط على الشركات المالكة للنماذج المغلقة.


ثماني ساعات من العمل المتواصل

بحسب توثيق Z.ai، يستطيع GLM-5.1 تنفيذ دورة كاملة من “التجربة–التحليل–التحسين” بشكل ذاتي. في عرض تجريبي، أنجز النظام بناء بيئة سطح مكتب لينكس كاملة خلال ثماني ساعات، منفذاً مئات التكرارات دون تدخل بشري مباشر. الفكرة هنا ليست في كتابة شيفرة فحسب، بل في إدارة عملية تطوير متكاملة تتضمن الاختبار والتحسين التدريجي.

هذا النمط من “الهندسة الوكيلة” يشير إلى انتقال الذكاء الاصطناعي من دور المساعد التفاعلي إلى دور المنفّذ شبه المستقل، القادر على تتبع هدف طويل الأمد ضمن حلقة عمل مستمرة.


تحسين تدريجي لا قفزة معمارية

من الناحية التقنية، GLM-5.1 ليس نموذجاً جديداً بالكامل، بل هو تحسين لاحق لـ GLM-5 الذي طُرح سابقاً كبنية Mixture-of-Experts بعدد ضخم من المعاملات مع جزء نشط لكل رمز. ما تغيّر هو طبقات المحاذاة اللاحقة للتدريب، بما في ذلك الضبط الدقيق متعدد المهام ومراحل التعلم المعزز.

هذا يعكس توجهاً واضحاً في الصناعة: التقدم اليوم لم يعد يعتمد فقط على زيادة الحجم أو عدد المعاملات، بل على كيفية صقل النموذج ليصبح أكثر اتساقاً في مهام محددة مثل توليد الشيفرة، إصلاح الأخطاء، وتحسين الأداء.


سياق واسع وقدرة على التوسع

يدعم النموذج نافذة سياقية تصل إلى 200 ألف رمز، مع إمكانية إخراج تصل إلى 128 ألف رمز. هذه الأرقام تهم المطورين الذين يعملون على قواعد شيفرة كبيرة أو مشاريع مترابطة تحتاج إلى فهم سياق طويل. كما أنه مُهيأ للعمل ضمن بيئات تطوير تعتمد على أدوات مساعدة للترميز، ما يجعله جزءاً من سير عمل فعلي وليس مجرد أداة تجريبية.

  • نشر الأوزان تحت رخصة MIT يفتح الباب للتبني الأكاديمي والتجاري.
  • تسعير واجهة البرمجة يعكس محاولة منافسة مباشرة في سوق API منخفض التكلفة.

توازن بين الأداء وسقف التوقعات

ذو صلة

رغم الصدارة في معيار محدد، تشير تقييمات مستقلة إلى أن النموذج يقترب من مستوى Claude Opus 4.6 في مهام البرمجة، مع بقاء فجوات في الاستدلال العام والمهام الإبداعية. هذه مفارقة مألوفة في سباق النماذج: تفوق تخصصي لا يعني هيمنة شاملة.

ومع ذلك، فإن ما تقدمه Z.ai هو إشارة واضحة إلى أن المنافسة لم تعد مقتصرة على المختبرات الأميركية الكبرى. مع تسارع تطوير النماذج مفتوحة المصدر، يبدو أن مستقبل هندسة البرمجيات سيشهد حضوراً أكبر لوكلاء ذكيين يعملون لساعات بصمت، بينما ينصبّ دور الإنسان أكثر فأكثر على التوجيه، والمراجعة، واتخاذ القرار النهائي.

عبَّر عن رأيك

إحرص أن يكون تعليقك موضوعيّاً ومفيداً، حافظ على سُمعتكَ الرقميَّةواحترم الكاتب والأعضاء والقُرّاء.

ذو صلة