ثورة الذكاء الاصطناعي تواصل اندفاعها مع إطلاق Claude Sonnet 5 الجديد بإمكانات متقدمة وتكلفة أقل
أطلقت أنثروبيك نموذج Claude Sonnet 5 لتقديم أداء عالٍ بأسعار ميسورة.
يتميز النموذج بقدرته على التخطيط والتنفيذ والتعامل مع المهام كوكلاء ذكيين.
حقق النموذج تقدمًا في اختبارات البرمجة الذاتية وسيناريوهات المهام المعرفية.
يشمل النموذج تحسينات في إدارة السياق واستخدام الأدوات بشكل أكثر دقة.
تركيز الشركة على السلامة يقلل من السلوكيات غير المرغوبة ويعزز الأمان.
حين يحتاج المطور إلى نموذج قوي لإنجاز مهمة معقدة، يكون السؤال الأول غالبًا: كم سيكلفني ذلك؟ فالقوة في عالم الذكاء الاصطناعي لم تعد معيارًا كافيًا وحده؛ التكلفة وسهولة التوسع أصبحتا جزءًا من المعادلة. في هذا السياق أعلنت أنثروبيك إطلاق نموذجها الجديد Claude Sonnet 5، محاولةً تقديم أداء يقترب من الفئة العليا لكن بسعر أقرب إلى المتناول.
وكلاء أذكياء بتكلفة أخف
تضع أنثروبيك نموذج Sonnet 5 في قلب سباق “الذكاء الوكيلي” Agentic AI، حيث لا يكتفي النموذج بالإجابة، بل يخطط وينفذ ويستخدم أدوات خارجية مثل متصفح الويب والطرفيات البرمجية. الفكرة هنا أن النموذج لا ينتظر تعليمات خطوة بخطوة، بل يتعامل مع المهمة كسلسلة قرارات مترابطة.
هذا النضج في قدرات التخطيط والاستدلال كان قبل أشهر حكرًا على نماذج أكبر مثل Opus، بتكلفة مرتفعة تقيّد الاستخدام التجاري واسع النطاق. اليوم تحاول الشركة كسر هذه المعادلة: أداء قريب من القمة، لكن بسعر يبدأ من دولارين لكل مليون رمز إدخال و10 دولارات للإخراج حتى نهاية أغسطس، قبل تعديل طفيف في تكلفة الإدخال.
أداء يقترب من الفئة العليا
وفق الأرقام التي نشرتها الشركة، حقق Claude Sonnet 5 نسبة 63.2% في أحد اختبارات البرمجة الذاتية، مقارنة بـ 58.1% للإصدار السابق Sonnet 4.6، بينما سجل Opus 4.8 نسبة 69.2%. الفارق ما زال قائمًا، لكنه أصبح أضيق بما يكفي ليجعل قرار الترقية مرتبطًا بالميزانية أكثر من كونه متعلقًا بالإمكانات.
الأهم أن النموذج الجديد تفوق بصورة طفيفة على Opus 4.8 في أحد اختبارات المهام المعرفية، ما يشير إلى تحسن واضح في الاستدلال وتنفيذ السيناريوهات متعددة الخطوات، لا سيما في بيئات التطوير التي تعتمد على الأتمتة واستخدام الأدوات.
من التجربة المخبرية إلى الاستخدام الفعلي
تقول شركات جربت النموذج قبل إطلاقه إنه أكثر قدرة على إكمال المهام الطويلة حتى نهايتها، مع مراجعة نتائجه ذاتيًا دون تدخل إضافي. هذه نقطة حساسة في نماذج الوكلاء؛ فالمشكلة ليست بدء المهمة، بل الاستمرار فيها دون انحراف أو فقدان للسياق.
- تحسن في إدارة السياق عبر سلاسل أوامر ممتدة.
- قدرة أفضل على استخدام الأدوات دون أخطاء متكررة.
- توازن أوضح بين الاستقلالية والتحكم.
السلامة كعامل تفاضل
مع توسع قدرات النماذج الوكيلية، تزداد المخاوف الأمنية. تشير أنثروبيك إلى انخفاض معدلات السلوكيات غير المرغوبة، وتحسن الاستجابة لمحاولات حقن الأوامر، إضافة إلى تراجع الهلوسة والميل إلى مجاملة المستخدم على حساب الدقة. هذه تحسينات مهمة للشركات التي تريد دمج النموذج في تطبيقات إنتاجية أو أدوات داخلية.
ومع ذلك، تعترف الشركة بأن نماذج Opus 4.8 وClaude Mythos Preview ما زالت تتفوق في بعض سيناريوهات السلامة المعقدة، بينما يتمتع Sonnet 5 بقدرة أقل على تنفيذ المهام السيبرانية الخطرة، وهو ما يُقرأ هنا كميزة أمان أكثر منه قيدًا تقنيًا.
سوق مزدحم ومعايير تتغير
يأتي الإطلاق في سياق تنافسي واضح، بعد طرح OpenAI نموذج GPT-5.6 Sol وتقديم جوجل Gemini 3.5 Flash بقدرات مشابهة في التخطيط وتنفيذ المهام. لكن ما يتغير فعلاً هو معيار المقارنة: لم يعد السؤال “من الأقوى؟” بل “من يحقق التوازن الأفضل بين الأداء والتكلفة والاعتمادية؟”.
إتاحة Sonnet 5 كمحرك افتراضي لمستخدمي الخطة المجانية وPro تعكس ثقة بأن النموذج قادر على تحمل الاستخدام واسع النطاق، لا كنسخة تجريبية بل كبنية تشغيل يومية.
في المحصلة، يبدو أن أنثروبيك تراهن على أن المرحلة القادمة لن يحسمها النموذج الأضخم، بل النموذج الأكثر عملية. فالذكاء الاصطناعي حين يصبح جزءًا من سير العمل اليومي، يتعين أن يكون ثابتًا، ميسور التكلفة، وقادرًا على إنهاء المهمة… لا مجرد البدء فيها.
عبَّر عن رأيك
إحرص أن يكون تعليقك موضوعيّاً ومفيداً، حافظ على سُمعتكَ الرقميَّةواحترم الكاتب والأعضاء والقُرّاء.
Ai Everything
LEAP26








