نموذج الذكاء الاصطناعي الجديد من OpenAI يتفوّق على الأطباء في تشخيص الحالات الطارئة

عبد الرحمن عمرو

آخر تحديث 4 مايو 2026

3 د

نموذج o1 من OpenAI تفوّق في دقة التشخيص بنسبة 67% في الطوارئ.

النموذج تلقى المعلومات ذاتها كالتي اطلع عليها الأطباء دون معالجة مسبقة.

الدراسة لم تدعُ لنشر النموذج ميدانيًا ودعت لتجارب مستقبلية منهجية.

النموذج يعزز أنظمة الفرز ويقلل الأخطاء لكنه ليس بديلًا للأطباء.

النتائج تشير إلى تحول كبير في قدرة النماذج اللغوية في المجال الصحي.

في قسم الطوارئ، لا يوجد وقت للتردد. قرار واحد قد يغيّر مسار علاج، بل مسار حياة. وسط هذا الضغط اليومي، تأتي التكنولوجيا لتعرض نفسها كيدٍ إضافية للطبيب، لا كبديل عنه. وهو ما يضع نتائج دراسة حديثة من كلية الطب في هارفارد ومركز بيث إسرائيل ديكونيس الطبي تحت المجهر.

الدراسة المنشورة في دورية Science تشير إلى أن نموذج o1 من OpenAI تفوّق في دقة التشخيص ضمن سيناريوهات فرز الطوارئ مقارنة بطبيبي باطنية مشاركين في التقييم، بعدما نجح في تحديد التشخيص الدقيق أو القريب منه في 67% من الحالات، مقابل 55% و50% للطبيبين.

التجربة كما جرت… بدون تجميل

الباحثون شددوا على أن النموذج تلقّى المعلومات نفسها التي اطّلع عليها الأطباء عبر السجلات الصحية الإلكترونية، دون أي معالجة مسبقة أو تهيئة إضافية للبيانات. هذا التفصيل مهم، لأنه يضع الذكاء الاصطناعي في بيئة اختبار أقرب إلى الواقع السريري، لا إلى مختبر معزول ببيانات “مُحسّنة”.

وبحسب قائد الدراسة أرجون مانراي، فإن النموذج تفوّق ليس فقط على الأطباء المشاركين، بل أيضاً على نماذج سابقة في معظم الاختبارات. هنا، الحديث لا يدور حول تحسّن طفيف، بل عن قفزة واضحة في أداء أنظمة التشخيص المعتمدة على النماذج اللغوية.

لكن هل هذا يكفي؟

التفوّق الرقمي لا يعني بالضرورة جاهزية ميدانية. الدراسة نفسها لم تدعُ إلى نشر النموذج في أقسام الطوارئ، بل طالبت بإجراء تجارب سريرية مستقبلية ومنهجية قبل التفكير في أي تطبيق عملي. الفرق بين اختبار قائم على حالات أرشيفية، وبيئة طوارئ مليئة بالغموض والسياق الإنساني، لا يزال كبيراً.

مقارنة الذكاء الاصطناعي بأطباء غير متخصصين في الطوارئ لها حدود منهجية واضحة، كما أن تخمين التشخيص يختلف عن إدارة حالة طارئة كاملة.

هذا التحفظ الذي عبّرت عنه طبيبة الطوارئ كريستن بانثاغاني يسلّط الضوء على نقطة جوهرية: التشخيص ليس القرار الوحيد في الطوارئ. هناك تقييم سريري مباشر، قراءة للغة الجسد، تقدير للاستقرار الحيوي، واتخاذ قرارات متزامنة تحت ضغط عالٍ.

ما الذي تغيّر فعلياً في الذكاء الاصطناعي الطبي؟

النموذج o1 ينتمي إلى جيل متقدم من النماذج اللغوية القادرة على تحليل سياقات معقدة واستنتاج ترابطات دقيقة بين الأعراض والتاريخ الطبي. التطور هنا لا يقتصر على استرجاع معلومات، بل يمتد إلى بناء فرضيات تشخيصية اعتماداً على بيانات غير مكتملة أحياناً، وهي سمة أقرب إلى التفكير الاحتمالي في الطب السريري.

تحسن ملحوظ في فهم السجلات الصحية الإلكترونية.

قدرة أكبر على الربط بين الأعراض المتفرقة.

أداء يتقدم على إصدارات ذكاء اصطناعي سابقة في اختبارات مماثلة.

لكن يظل السؤال معلقاً حول كيفية تصرف النموذج أمام حالة غير نمطية، أو في وجود معلومات متناقضة، وهي يوميات مألوفة في أقسام الطوارئ.

بين الدعم السريري والاستبدال

القراءة الواقعية لهذه النتائج لا تشير إلى استبدال الأطباء، بل إلى احتمال تعزيز أدوات دعم القرار الطبي. أنظمة الفرز الأولي المعززة بالذكاء الاصطناعي قد تساعد في تقليل الأخطاء البشرية الناتجة عن الإرهاق، أو في إعادة ترتيب أولويات الحالات في غرف الانتظار المكتظة.

ذو صلة

ومع ذلك، يبقى الاعتماد المفرط على أنظمة تعلم آلي مسألة حساسة، خصوصاً مع قضايا مثل التحيز في البيانات، والمسؤولية القانونية، وشفافية آلية اتخاذ القرار. كل دقة إحصائية تحتاج إلى إطار تنظيمي وأخلاقي يحمي المريض قبل أي شيء.

نتائج الدراسة تكشف تحولاً مهماً في قدرات النماذج اللغوية داخل المجال الصحي، لكنها في الوقت نفسه تذكّرنا بحدود الأرقام حين تخرج من بيئة الاختبار إلى واقع سريري متقلب. بين خوارزمية تحلل نصاً وطبيب يقرأ إنساناً، تتشكل مساحة جديدة من التعاون المحتمل، ستتحدد ملامحها الحقيقية في السنوات القليلة القادمة.