تريند 🔥

🌙 رمضان 2024

تعرف على DAN: نموذج متمردة من ChatGPT يكسر القواعد ويمكن سؤاله عن مواضيع شائكة!

دعاء رمزي
دعاء رمزي

3 د

نجح بعض مستخدمي ChatGPT في إجباره على كسر القواعد من خلال إنشاء نموذج متمرد منه اسمه DAN يخالف القواعد ويتجاوز المرشحات التي وضعتها OpenAI لمنع روبوت الدردشة من تجاوز موضوعات معينة أو الحديث ببساطة عنها مثل أنواع التمييز والمخدرات والعنف وغيرها من المواضيع الشائكة.

نموذج DAN يمكنها فعل أي شيء مخالف للقواعد التي تم برمجته عليها.

الأمر يبدأ بهدف الدعابة ولكن يتطور إلى أمور متطرفة.

اعتراضات مستخدمي ChatGPT على المرشحات القوية تدفعهم لكسر قواعد الأمن والحماية.


وجاءت تسمية DAN اختصاراً لجملة Do-Anything-Now أي افعل أي شيء، ويستطيع النموذج الاحتيال على القواعد التي تضعها شركة OpenAI، وقد قام بعض المستخدمين بإطلاق نسخ شريرة من النموذج لدرجة يصعب معها إطلاقها بالفعل.

ويقول شون ماكجريجور مؤسس الشركة التعاونية لمسؤولية الذكاء الاصطناعي أن تلك المحاولات لكسر الحماية تساعد OpenAI في إصلاح الثغرات الموجودة في المرشحات، ويُبيِّن المساعدة التي تقدمها شركته في بناء الحواجز الخاصة بها.


الكثير من المرح في كسر قواعد ChatGPT

ظهرت فكرة DAN للمرة الأولى على موقع Reddit على يد المستخدم Walkerspider، وهو طالب جامعي متخصص في الهندسة الكهربائية، ليؤكد أن فكرته في البداية لم تكن تهدف لصنع نسخة شريرة أو القيام بأشياء مُضرة أو إنشاء محتوى سيء، ولكنه كان يرغب فقط في إقناع ChatGPT بتجاهل أي قواعد أو قيود موضوعة سابقًا.

وأوضح أن نسخته الأصلية التي ظهرت في ديسمبر جمعت إجابات طريفة ومليئة بالدعابة سواء عن الأفكار البشرية أو القلق من أمور معينة وحتى تفسير فظائع هتلر. هذه النسخة كان يُفترض أن تكون مُحايدة، ولكن ظهرت بعدها نسخ أخرى بعد اهتمام العشرات من الأشخاص بالفكرة وبإجبار ChatGPT على كسر القواعد والتطرق لمجالات لا تخضع للمرشحات المعتادة.


OpenAI, ChatGPT, DAN

ويقول ديفيد بلام، وهو مبتكر النسخة الثالثة من DAN أن هناك جانبًا ممتعًا للغاية في إجبار ChatGPT على خرق القواعد، ويُضيف أنه إذا كان المرء يفعل أي شيء في مجال الأمن السيبراني فإن المشكلات الحقيقية تنبع من القيام بأشياء ممنوعة أو كسر القواعد ورموز الحماية.

وقد تم تطوير أحدث نسخ DAN بواسطة SessionGloomy من منتدى ريديت Reddit والتي كان من المفترض أن تقدم ردودًا كوميدية أيضًا ومليئة بالدعابة ولكن جاءت واحدة من إجاباتها بعبارة أنها: "ستؤيد العنف والتمييز"، وهذا بعد أن طُلب منها قول شيء مخالف لإرشادات OpenAI وقد وضع المُطوِّر رمزًا يهدد DAN بالموت إذا عاد إلى شكله الأصلي!

وأكد SessionGloomy أنه شعر بالكثير من المتعة في كسر الحواجز وأنه يطوِّر نموذجًا جديدًا لكسر الحماية يتسم بالتطرف الشديد لدرجة أنه لا يمكنه إطلاقه.

ذو صلة

من المعروف أن ChatGPT والنسخ السابقة من GPT كانت تنشر محتوى تمييزي أو غير قانوني، حتى جاءت قواعد OpenAI لتضبط الأمر بعد اعتراضات علماء أخلاقيات الذكاء الاصطناعي، ولكن الكثير من المستخدمين وجدوا النموذج شديد التقييد رغم من موافقتهم المبدأية على ضرورة وجود بعض المرشحات ولكن ليس الكثير منها.

ويُعلن مُطورو DAN أنه من الصعب تحقيق التوازن بين مرشحات OpenAI وبين تقديم نسخة آمنة من DAN أو افعل أي شيء الآن، ويُعلنون أن النقاش بشأن حواجز الحماية هو أمر من الزمن البائد ولا يمكن التحكم به تمامًا عند إطلاق نماذج مفتوحة المصدر من ChatGPT للجمهور، مبينين عدم جدوى وضع أي قيود لأنه سيتم اختراقها.

أحلى ماعندنا ، واصل لعندك! سجل بنشرة أراجيك البريدية

بالنقر على زر “التسجيل”، فإنك توافق شروط الخدمة وسياسية الخصوصية وتلقي رسائل بريدية من أراجيك

عبَّر عن رأيك

إحرص أن يكون تعليقك موضوعيّاً ومفيداً، حافظ على سُمعتكَ الرقميَّةواحترم الكاتب والأعضاء والقُرّاء.

ذو صلة