دعوى قضائية ضد OpenAI من بريتانيكا وميريام-ويبستر بسبب بيانات التدريب
رفعت بريتانيكا وميريام-ويبستر دعوى قضائية ضد OpenAI لانتهاك حقوق النشر.
تزعم الدعوى استخدام مقالات محمية لتدريب نماذج اللغة الكبرى دون إذن.
تتخطى القضية مسألة التدريب إلى اتهام بالهلوسة وانتهاك العلامات التجارية.
القضية تدور حول التوازن بين الابتكار وحماية الملكية الفكرية.
الصراع يتعلق بكيفية استدامة المؤسسات مقابل إتاحة المعرفة بالذكاء الاصطناعي.
حين نطرح سؤالاً بسيطاً على روبوت محادثة ونحصل على إجابة فورية، نادراً ما نفكر في المواد الخام التي صُنعت منها تلك الإجابة. خلف السطر السلس تقف قواعد بيانات، مقالات، وكتب كتبها أشخاص حقيقيون. هذا الأسبوع، تحوّل هذا السؤال الأخلاقي إلى مواجهة قانونية مباشرة بعد أن رفعت موسوعة بريتانيكا وقاموس ميريام-ويبستر دعوى قضائية ضد OpenAI، متهمتين إياها بانتهاك واسع النطاق لحقوق النشر.
جوهر الدعوى: المحتوى كوقود للذكاء الاصطناعي
بحسب نص الدعوى، تحتفظ بريتانيكا بحقوق قرابة مئة ألف مقال منشور على الإنترنت، وتزعم أن هذه المواد استُخدمت لتدريب نماذج اللغة الكبرى دون إذن. جوهر الاتهام لا يقتصر على عملية التدريب نفسها، بل يمتد إلى مخرجات النموذج حين تتضمن “نسخاً حرفية كاملة أو جزئية” من محتوى الموسوعة، إضافة إلى استخدام المقالات ضمن آلية الاسترجاع المعزز بالتوليد RAG داخل ChatGPT.
تقنياً، تعتمد نماذج اللغة على كميات هائلة من البيانات لاكتساب الأنماط اللغوية والمعرفية. السؤال القانوني المطروح هنا: هل يُعد استخدام محتوى محمي بحقوق النشر لتدريب نموذج ذكاء اصطناعي استخداماً تحويلياً مشروعاً، أم استغلالاً مباشراً لمصنفات محمية؟
ما وراء حقوق النشر: العلامة التجارية والهلوسة
الدعوى تتجاوز مسألة التدريب إلى اتهام OpenAI بانتهاك قانون العلامات التجارية الأميركي عند إسناد معلومات “مختلقة” أو غير دقيقة إلى بريتانيكا. ما يُعرف بظاهرة الهلوسة في أنظمة الذكاء الاصطناعي لم يعد مجرد تحدٍ تقني يتعلق بالدقة، بل بات يحمل تبعات قانونية تمس السمعة والموثوقية.
تقول الدعوى إن ChatGPT يزاحم الناشرين عبر تقديم إجابات تحل محل محتواهم وتنافسه مباشرة، بما يهدد نموذجهم الاقتصادي.
هنا يتقاطع البعد التقني مع البعد التجاري. فحين يحصل المستخدم على خلاصة فورية دون زيارة المصدر الأصلي، يتراجع المرور إلى المواقع، ومعه عائدات الإعلانات والاشتراكات التي تمول إنتاج المعرفة عالية الجودة.
سابقة قضائية غير محسومة
المشهد القانوني لا يزال ضبابياً. لا توجد حتى الآن قاعدة راسخة تحسم ما إذا كان تدريب نماذج اللغة على بيانات محمية يشكل انتهاكاً صريحاً. في قضية سابقة، أقنع فريق Anthropic قاضياً فيدرالياً بأن استخدام الكتب كبيانات تدريب يُعد تحويلياً بما يكفي ليدخل ضمن الاستخدام العادل، رغم أن تحميل الكتب بطرق غير مشروعة كلّف الشركة تسوية مالية ضخمة.
هذا التناقض يعكس تعقيد المرحلة: التقنية تتقدم بوتيرة أسرع من قدرة الأنظمة التشريعية على اللحاق بها، بينما تحاول المحاكم رسم حدود بين الابتكار وحماية الملكية الفكرية.
صراع نماذج أعمال في عصر النماذج اللغوية
انضمام بريتانيكا إلى قائمة تضم نيويورك تايمز وناشرين آخرين يؤكد أن المواجهة لم تعد حادثة منفردة، بل نمطاً يتكرر. الناشرون يرون أن البيانات التي استثمروا في إنتاجها أصبحت مادة خاماً لنماذج توليدية تبني منتجات تنافسهم مباشرة. في المقابل، تعتمد شركات الذكاء الاصطناعي على مبدأ أن تحليل البيانات لا يعني إعادة نشرها حرفياً.
- الناشرون يركّزون على حماية حقوق النشر والإيرادات.
- شركات الذكاء الاصطناعي تدافع عن مبدأ الاستخدام التحويلي والابتكار.
- المستخدم يقف في المنتصف، مستفيداً من السهولة لكنه أقل وعياً بتكلفة المحتوى الأصلية.
المعرفة بين الإتاحة والاستدامة
القضية في جوهرها ليست قانونية فقط، بل فلسفية أيضاً: كيف يمكن تحقيق توازن بين إتاحة المعرفة عبر أنظمة ذكاء اصطناعي متقدمة، والحفاظ على استدامة المؤسسات التي تنتج تلك المعرفة؟ إذا فاز الناشرون، قد نشهد موجة ترخيص واسعة وارتفاعاً في كلفة تدريب النماذج. وإذا كُرّس مبدأ الاستخدام التحويلي، فقد تتغير صناعة النشر جذرياً.
ما يحدث الآن هو جزء من إعادة تشكيل علاقة الإنترنت بالمحتوى. الذكاء الاصطناعي لا يستهلك المعرفة فحسب، بل يعيد صياغتها ويعيد توزيع قيمتها الاقتصادية. والنتيجة، أياً كانت، سترسم ملامح المرحلة القادمة للويب حيث تتقاطع الخوارزميات مع حقوق المؤلف على نحو غير مسبوق.
عبَّر عن رأيك
إحرص أن يكون تعليقك موضوعيّاً ومفيداً، حافظ على سُمعتكَ الرقميَّةواحترم الكاتب والأعضاء والقُرّاء.
LEAP26








