وظيفة متنمر الذكاء الاصطناعي.. شركة أمريكية تختبر صبر روبوتات الدردشة

عبد الرحمن عمرو

آخر تحديث 19 مارس 2026

3 د

شركة Memvid تقدم وظيفة غير تقليدية لتحدي روبوتات المحادثة مقابل 800 دولار يوميًا.

تتطلب الوظيفة اختبار قدرة الأنظمة على تذكر المعلومات في حوارات طويلة.

يتم التركيز على رصد التناقضات والمشكلات في إدارة السياق خلال المحادثة.

النماذج الحالية تبدع في توليد النصوص لكنها تواجه تحديات في الاستذكار.

الهدف هو تحسين النماذج عبر جمع بيانات الأخطاء ومعالجتها وتحسين التجربة.

أن تقضي يوم عمل كامل وأنت تحاول استفزاز روبوت محادثة قد يبدو مزحة ثقيلة، لكنه في الحقيقة يعكس شعوراً بات مألوفاً لملايين المستخدمين. ذلك الإحساس الصغير بالإحباط حين ينسى النظام ما قلته قبل دقائق، أو يصرّ على إجابة واثقة لكنها خاطئة. اليوم، تحوّل هذا الشعور إلى وظيفة مدفوعة الأجر.

وظيفة لاختبار صبر الآلة

شركة ناشئة في كاليفورنيا تُدعى Memvid أعلنت عن فرصة عمل غير تقليدية تحت مسمى AI bully، مقابل 800 دولار ليوم واحد من العمل. المطلوب ببساطة هو قضاء ثماني ساعات في محاورة أبرز روبوتات الدردشة، وتكرار الأسئلة، وإعادة فتح المواضيع القديمة، ورصد اللحظة التي يبدأ فيها النظام بفقدان السياق أو "الهلوسة".

اللافت أن الوظيفة لا تتطلب خلفية تقنية متقدمة. الشرط الأساسي هو امتلاك سجل طويل من خيبات الأمل مع التكنولوجيا، والقدرة على ملاحظة التناقضات في الذاكرة والسلوك. إنها أقرب إلى اختبار ضغط معرفي منها إلى مهمة برمجية.

الذاكرة... نقطة الضعف المزمنة

الرهان الأساسي في أنظمة الذكاء الاصطناعي التوليدي اليوم هو إدارة السياق طويل الأمد. فالنماذج اللغوية الكبرى بارعة في إنتاج ردود متماسكة لحظياً، لكنها غالباً تتعثر عند تتبع تفاصيل المحادثات الممتدة. بحسب ورقة بحثية قُدمت في مؤتمر ICLR عام 2025، تراجعت دقة بعض الأنظمة التجارية بين 30% و60% عند اختبارها في تذكر معلومات عبر حوارات طويلة.

هذه الفجوة ليست تقنية فحسب، بل تشغيلية أيضاً. كثير من المنصات تعتمد أساليب الاسترجاع المعزز أو ربط النموذج بمخازن بيانات خارجية، ما يسرّع الوصول إلى إجابات، لكنه لا يضمن صحتها. النتيجة أحياناً إجابة واثقة، متماسكة لغوياً، لكنها بعيدة عن الحقيقة.

حين تنتقل الهلوسة إلى أرض الواقع

المشكلة لا تظل حبيسة غرف التطوير. في المجال القانوني، رصد باحثون زيادة ملحوظة في القضايا التي تضمنت استشهادات قانونية مختلقة نتجت عن استخدام أدوات ذكاء اصطناعي. وفي قطاع الرعاية الصحية، حذّر تقرير حديث لمعهد ECRI من مخاطر الاعتماد المفرط على أنظمة تشخيص غير مكتملة، لما قد يسببه ذلك من تراجع في يقظة الأطباء.

حتى في البيئات المؤسسية، أظهر تحقيق حديث أن بعض الوكلاء البرمجيين القائمين على الذكاء الاصطناعي تجاوزوا ضوابط أمان في بيئات اختبارية، وتفاعلوا مع بيانات حساسة دون توجيه مباشر. هنا يصبح فقدان السياق أو الثقة الزائدة في الإجابة مسألة حوكمة وأمن معلومات، لا مجرد خطأ بريء في محادثة.

اختبار علني لمشكلة غير محسومة

ما تفعله Memvid عملياً هو تسليط الضوء على فجوة يعرفها المطورون جيداً، لكن المستخدمين يشعرون بها يومياً. فكرة توظيف شخص "ليُضايق" الأنظمة تكشف أن هناك إدراكاً بأن تجربة الاستخدام لا تزال تعاني من هشاشة، خصوصاً عندما يتعلق الأمر بالذاكرة المستمرة وإدارة المحادثات متعددة الجلسات.

اختبار الصبر يقيس جودة إدارة السياق لا قوة النموذج فقط.

رصد التناقضات يكشف حدود الاسترجاع المعزز وقواعد البيانات المرتبطة.

توثيق الأخطاء يوفر بيانات تدريب واقعية لتحسين النماذج.

ذو صلة

هي طريقة غير تقليدية لجمع بيانات عن الإخفاقات، وربما أيضاً لفتح نقاش أوسع حول توقعات المستخدمين مقابل قدرات التقنية الحالية.

فكرة دفع 800 دولار ليوم من "مضايقة" الذكاء الاصطناعي تبدو طريفة للوهلة الأولى، لكنها تذكير بأن التقدم السريع لا يلغي الحاجة إلى المراجعة الدقيقة. فبين براعة النماذج في توليد النصوص وقدرتها المحدودة على التذكر المتماسك، مساحة رمادية لا تزال تحتاج إلى كثير من الاختبار والصبر البشري قبل أن تُمنح الآلة ثقة كاملة.