مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

61 خبر
  • اتفاق وقف إطلاق النار بين إسرائيل ولبنان
  • هدنة وحصار المضيق
  • مونديال 2026
  • اتفاق وقف إطلاق النار بين إسرائيل ولبنان

    اتفاق وقف إطلاق النار بين إسرائيل ولبنان

  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • مونديال 2026

    مونديال 2026

  • منتدى بطرسبورغ الاقتصادي الدولي

    منتدى بطرسبورغ الاقتصادي الدولي

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • فيديوهات

    فيديوهات

  • عملاق إيطالي يدخل خط المنافسة ويتحرك لضم محمد صلاح

    عملاق إيطالي يدخل خط المنافسة ويتحرك لضم محمد صلاح

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
صورة تعبيرية / Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

بوتين يصف رسالة زيلينسكي بـ"الوقحة" ويوجه الجيش الروسي: "اعملوا أيها الإخوة"

مجلة عسكرية: خروج مركز العمليات الجوية الأمريكية في قاعدة العديد بقطر عن الخدمة

صحيفة إسرائيلية تكشف عن أسماء قد تكون عطلت عملية ضخمة للموساد وأمريكا لإسقاط النظام في إيران

عراقجي يرد بعنف على هجوم عون غير المسبوق على إيران و"حزب الله"

إيران تهدد ترامب بحرب تمتد من هرمز إلى المحيط الهندي ومضيق باب المندب والبحرين الأحمر والمتوسط

الظلال هي الدليل.. قنصلية إيرانية تحاول بـ"صورة" تفكيك "لغز" ضربات مطار الكويت

إنذارات بهجمات صاروخية ومسيرات معادية في الكويت والبحرين (فيديوهات)

نتنياهو يلغي التصويت على قرار وقف إطلاق النار بعد بيان أمين عام "حزب الله"

بوتين يرد على إشارة زيلينسكي لعمره: الكفاءة أهم من العمر

قنبلة تهدد إسرائيل بسبب إيران ولبنان.. تحذيرات رسمية من الانهيار

لحظة بلحظة.. استمرار القصف المتبادل بين "حزب الله" وإسرائيل رغم وقف إطلاق النار

ماكرون: رسالة زيلينيسكي إلى بوتين مبادرة جيدة وحان وقت الحوار مع روسيا

استخبارات البنتاغون ترفع مستوى خطر التجسس الإسرائيلي على الولايات المتحدة إلى أعلى درجة

ترامب يستخدم الذكاء الاصطناعي لتوثيق حال السفن الحربية الإيرانية في قاع البحر (فيديو)