تعرف على DAN: نموذج متمردة من ChatGPT يكسر القواعد ويمكن سؤاله عن مواضيع شائكة!

دعاء رمزي
دعاء رمزي

3 د

نجح بعض مستخدمي ChatGPT في إجباره على كسر القواعد من خلال إنشاء نموذج متمرد منه اسمه DAN يخالف القواعد ويتجاوز المرشحات التي وضعتها OpenAI لمنع روبوت الدردشة من تجاوز موضوعات معينة أو الحديث ببساطة عنها مثل أنواع التمييز والمخدرات والعنف وغيرها من المواضيع الشائكة.

نموذج DAN يمكنها فعل أي شيء مخالف للقواعد التي تم برمجته عليها.

الأمر يبدأ بهدف الدعابة ولكن يتطور إلى أمور متطرفة.

اعتراضات مستخدمي ChatGPT على المرشحات القوية تدفعهم لكسر قواعد الأمن والحماية.


وجاءت تسمية DAN اختصاراً لجملة Do-Anything-Now أي افعل أي شيء، ويستطيع النموذج الاحتيال على القواعد التي تضعها شركة OpenAI، وقد قام بعض المستخدمين بإطلاق نسخ شريرة من النموذج لدرجة يصعب معها إطلاقها بالفعل.

ويقول شون ماكجريجور مؤسس الشركة التعاونية لمسؤولية الذكاء الاصطناعي أن تلك المحاولات لكسر الحماية تساعد OpenAI في إصلاح الثغرات الموجودة في المرشحات، ويُبيِّن المساعدة التي تقدمها شركته في بناء الحواجز الخاصة بها.


الكثير من المرح في كسر قواعد ChatGPT

ظهرت فكرة DAN للمرة الأولى على موقع Reddit على يد المستخدم Walkerspider، وهو طالب جامعي متخصص في الهندسة الكهربائية، ليؤكد أن فكرته في البداية لم تكن تهدف لصنع نسخة شريرة أو القيام بأشياء مُضرة أو إنشاء محتوى سيء، ولكنه كان يرغب فقط في إقناع ChatGPT بتجاهل أي قواعد أو قيود موضوعة سابقًا.

وأوضح أن نسخته الأصلية التي ظهرت في ديسمبر جمعت إجابات طريفة ومليئة بالدعابة سواء عن الأفكار البشرية أو القلق من أمور معينة وحتى تفسير فظائع هتلر. هذه النسخة كان يُفترض أن تكون مُحايدة، ولكن ظهرت بعدها نسخ أخرى بعد اهتمام العشرات من الأشخاص بالفكرة وبإجبار ChatGPT على كسر القواعد والتطرق لمجالات لا تخضع للمرشحات المعتادة.


OpenAI, ChatGPT, DAN

ويقول ديفيد بلام، وهو مبتكر النسخة الثالثة من DAN أن هناك جانبًا ممتعًا للغاية في إجبار ChatGPT على خرق القواعد، ويُضيف أنه إذا كان المرء يفعل أي شيء في مجال الأمن السيبراني فإن المشكلات الحقيقية تنبع من القيام بأشياء ممنوعة أو كسر القواعد ورموز الحماية.

وقد تم تطوير أحدث نسخ DAN بواسطة SessionGloomy من منتدى ريديت Reddit والتي كان من المفترض أن تقدم ردودًا كوميدية أيضًا ومليئة بالدعابة ولكن جاءت واحدة من إجاباتها بعبارة أنها: "ستؤيد العنف والتمييز"، وهذا بعد أن طُلب منها قول شيء مخالف لإرشادات OpenAI وقد وضع المُطوِّر رمزًا يهدد DAN بالموت إذا عاد إلى شكله الأصلي!

وأكد SessionGloomy أنه شعر بالكثير من المتعة في كسر الحواجز وأنه يطوِّر نموذجًا جديدًا لكسر الحماية يتسم بالتطرف الشديد لدرجة أنه لا يمكنه إطلاقه.

ذو صلة

من المعروف أن ChatGPT والنسخ السابقة من GPT كانت تنشر محتوى تمييزي أو غير قانوني، حتى جاءت قواعد OpenAI لتضبط الأمر بعد اعتراضات علماء أخلاقيات الذكاء الاصطناعي، ولكن الكثير من المستخدمين وجدوا النموذج شديد التقييد رغم من موافقتهم المبدأية على ضرورة وجود بعض المرشحات ولكن ليس الكثير منها.

ويُعلن مُطورو DAN أنه من الصعب تحقيق التوازن بين مرشحات OpenAI وبين تقديم نسخة آمنة من DAN أو افعل أي شيء الآن، ويُعلنون أن النقاش بشأن حواجز الحماية هو أمر من الزمن البائد ولا يمكن التحكم به تمامًا عند إطلاق نماذج مفتوحة المصدر من ChatGPT للجمهور، مبينين عدم جدوى وضع أي قيود لأنه سيتم اختراقها.

عبَّر عن رأيك

إحرص أن يكون تعليقك موضوعيّاً ومفيداً، حافظ على سُمعتكَ الرقميَّة واحترم الكاتب والأعضاء والقُرّاء.

ذو صلة
متعلقات

كشف أسرار الهياكل الحجريّة الغامضة الّتي عُثِر عليها في المملكة العربية السعودية!

العثور على حاويات مستطيلة قديمة منتشرة في جميع أنحاء صحراء شمال غرب المملكة العربية السعودية، ممّا أثار حيرة علماء الآثار منذ السبعينيات.

كشفت عمليات التنقيب في مستطيل من الحجر الرملي يبلغ طوله 140 متر بالقرب من العلا في عام 2019 عن بقايا حيوانات، متجمعة حول لوح قائم من الحجر يُفسر على أنه مقدّس.

يُظهر التأريخ بالكربون المشعّ مجموعة من التواريخ، مما يشير إلى أن الموقع كان قيد الاستخدام لفترة طويلة من الزمن، من حوالي 5307-5002 قبل الميلاد، إلى 5056-4755 قبل الميلاد.


كشف تحليل حديث أنّ الهياكل الحجريّة الغامضة الّتي عُثِر عليها عبر الصّحاري الشّماليّة الغربيّة للمملكة العربيّة السّعوديّة كانت تُستخدَم لطقوس غير معروفة، بما في ذلك إيداع قرابين حيوانيّة، يُحتَمل أن تكون نُذراً لآلهة غير معروفة.

يعود تاريخ العبوات المستطيلة، المُسمّاة mustatils، إلى حوالي 7000 عام، وقد حيّرت علماء الآثار منذ السّبعينيّات. تم التعرف على أكثر من 1600 مستطيلات من خلال المسوحات الجوّية، ووجدوا أنّها تتكون من منصتين قصيرتين وسميكتين متّصلتين بجدران منخفضة يصل طولها إلى 600 متر، ولكن لا يزيد ارتفاعها عن نصف متر. عدم وجود الأسقف والجدران المنخفضة يجعلها غير مناسبة لمرافق التخزين أو حظائر الماشية.


كشفت التّنقيبات الّتي أجريت في مستطيل واحد عن ألواح حجرية قائمة ومزخرفة، بالإضافة إلى تناثر عظام الحيوانات، وتحديداً جماجم الحيوانات، المأخوذة من الماعز والغزلان والمجترّات الصّغيرة والماشية الدّاجنة.

تظهَر على العِظام علامات القطع والحرق، والّتي يعتقد الباحثون أنّها تشير إلى أنّ اللّوح الحجريّ كان "بيتيل"، وهو حجر مقدس يمثل إله أو آلهة الناس الذين عاشوا في المنطقة منذ آلاف السنين. يفترض الباحثون أن الأحجار الدائمة، أو البيتيل، كانت بمثابة وسيط بين الجنس البشري والإلهي، حيث كانت تعمل كوكيل أو مظهر من مظاهر إله / آلهة العصر الحجري الحديث أو فكرة دينية غير معروفة، والتي أودعت فيها العناصر الحيوانية كعروض نذرية.


يُظهر التأريخ بالكربون المشع للموقع مجموعة من التواريخ، مما يشير إلى أنه كان قيد الاستخدام لفترة طويلة من الزمن، من حوالي 5307-5002 قبل الميلاد، إلى 5056-4755 قبل الميلاد. علاوة على ذلك ، اكتشف الباحثون غرفة حجرية صغيرة مستطيلة بجوار رأس المستطيل حيث توجد غرفة بيتيل، تحتوي على رفات بشرية. هذه حجرة دفن قديمة، مبنية من ألواح من الحجر الرملي غير المشغول. كان المتوفى ذكراً بالغاً ربما كان يعاني من هشاشة العظام، لكن من كان ولماذا دُفن في المستطيل لا يزال مجهولاً.

عبَّر عن رأيك

إحرص أن يكون تعليقك موضوعيّاً ومفيداً، حافظ على سُمعتكَ الرقميَّة واحترم الكاتب والأعضاء والقُرّاء.

متعلقات