مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

89 خبر
  • العملية العسكرية الروسية في أوكرانيا
  • هدنة وحصار المضيق
  • نبض الملاعب
  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • نبض الملاعب

    نبض الملاعب

  • فيديوهات

    فيديوهات

  • زيارة بوتين إلى الصين

    زيارة بوتين إلى الصين

  • إسرائيل تواصل غاراتها على لبنان

    إسرائيل تواصل غاراتها على لبنان

  • مقتل 12 وإصابة 15 أكثر من إثر القصف الإسرائيلي على لبنان الثلاثاء

    مقتل 12 وإصابة 15 أكثر من إثر القصف الإسرائيلي على لبنان الثلاثاء

  • لحظة بلحظة.. تحت غطاء "وقف النار" إسرائيل تواصل عملياتها في لبنان

    لحظة بلحظة.. تحت غطاء "وقف النار" إسرائيل تواصل عملياتها في لبنان

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
صورة تعبيرية / Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

"فاينانشال تايمز": ترامب عرض في الصين التحالف مع بكين وموسكو ضد "الجنائية الدولية"

"الكلام جرحني قبل ما يجرحكم".. الرئيس السوري يعتذر لأهالي محافظة دير الزور (فيديو)

الدفاع الإماراتية: المسيرة التي اعتدت على محطة براكة للطاقة النووية بأبوظبي قدمت من الأراضي العراقية

إيران تكشف لأول مرة تفاصيل إصابة مجتبى خامنئي في اليوم الأول من "حرب رمضان"

عقب خروج احتجاجات.. والد الرئيس السوري يوضح حقيقة تصريحاته المتداولة بشأن دير الزور (فيديو)

بناء على طلب قادة خليجيين .. ترامب يعلن تعليق هجوم مخطط على إيران

المرشد الأعلى الإيراني: أحد إنجازات الحرب الأخيرة هو ارتقاء بلادنا إلى مصاف الدول العظمى المؤثرة

عقوبات الاتحاد الأوروبي ضد شركة صينية للرقائق تهدد صناعة السيارات الألمانية

"لا ترتكبوا هذا الخطأ الجسيم معه".. ميركل تقدم نصيحة للسياسيين الأوروبيين تخص بوتين

"نفاق صارخ".. إيران ترد على اتهامات المستشار الألماني بشأن الهجوم على منشآت نووية بالإمارات

نيبينزيا: الرد الروسي سيكون حتميا حال إطلاق مسيرات من دول البلطيق

زعيم الحوثيين: نحن جاهزون عسكريا لأي تصعيد أمريكي ضد إيران (فيديو)

قرقاش: الموقف الرمادي أخطر من اللا موقف وخلط الأدوار خلال العدوان الإيراني الغاشم محير

نيبينزيا يدين الهجمات على المحطة النووية في الإمارات: لولا المغامرة الأمريكية الإسرائيلية ما حدث ذلك

جنود أمريكيون: طلبنا تعزيزا طبيا قبل أسابيع من ضربة إيرانية قاتلة في الكويت لكنه قوبل بالتجاهل