مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

44 خبر
  • مونديال 2026
  • المواجهة الأمريكية الإسرائيلية مع إيران بين المد والجزر
  • العملية العسكرية الروسية في أوكرانيا
  • مونديال 2026

    مونديال 2026

  • المواجهة الأمريكية الإسرائيلية مع إيران بين المد والجزر

    المواجهة الأمريكية الإسرائيلية مع إيران بين المد والجزر

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • فيديوهات

    فيديوهات

  • اتفاق وقف إطلاق النار بين إسرائيل ولبنان

    اتفاق وقف إطلاق النار بين إسرائيل ولبنان

  • قطاع غزة.. آثار القصف الإسرائيلي على منطقة سكنية في المغازي

    قطاع غزة.. آثار القصف الإسرائيلي على منطقة سكنية في المغازي

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
صورة تعبيرية / Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

اختراق في المفاوضات الأمريكية - الإيرانية وحسم 3 ملفات رئيسية عالقة بوساطة قطرية

أول رد رسمي إيراني على إعلان ترامب التوصل إلى اتفاق لوقف الحرب وموعد توقيعه

وكالة "مهر": دوي انفجار في البحر على بعد نحو كيلومترين من ساحل سيريك جنوبي إيران

مستشار قائد الحرس الثوري: إيران على أعتاب تحقيق نصر كبير

اعتراف جديد من فانس عن الأزمة بين إسرائيل وأمريكا والخلاف بين ترامب ونتنياهو

"أفضت إلى تقدم".. أمير قطر وترامب يستعرضان نتائج المشاورات والتفاهمات بين واشنطن وطهران

وكالة "فارس" عن مصدر مطلع: إيران لم توافق بعد على أي نص لمذكرة التفاهم الأولية مع الولايات المتحدة

إيران تدرج شركات إيلون ماسك ضمن قائمة أهدافها العسكرية.. ما السبب؟

قاليباف يحذر أمريكا من نقطة الصفر ومستنقع لا نهائي بعد تهديد ترامب بقصف إيران الليلة بقوة شديدة

14 نقطة.. وكالة "مهر" تنشر البنود الكاملة لمسودة التفاهم المرتقبة بين إيران والولايات المتحدة

الحرس الثوري الإيراني: إذا أرادت أمريكا أن تختبر إخفاقاتها السابقة مرة أخرى فسوف تندم على ذلك

وكالة "فارس": ترامب يحاول خلق رواية استسلام إيران أمام القصف بتصعيد لهجته التهديدية