مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

43 خبر
  • مونديال 2026
  • المواجهة الأمريكية الإسرائيلية مع إيران بين المد والجزر
  • اتفاق وقف إطلاق النار بين إسرائيل ولبنان
  • مونديال 2026

    مونديال 2026

  • المواجهة الأمريكية الإسرائيلية مع إيران بين المد والجزر

    المواجهة الأمريكية الإسرائيلية مع إيران بين المد والجزر

  • اتفاق وقف إطلاق النار بين إسرائيل ولبنان

    اتفاق وقف إطلاق النار بين إسرائيل ولبنان

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • فيديوهات

    فيديوهات

  • جنوب لبنان.. "حزب الله" يستهدف قاعدة "بلاط" الإسرائيلية

    جنوب لبنان.. "حزب الله" يستهدف قاعدة "بلاط" الإسرائيلية

  • الأهلي المصري يستعد لصفقة جديدة

    الأهلي المصري يستعد لصفقة جديدة

  • الطيران الإسرائيلي يغير على ضاحية بيروت بعد استهداف حزب الله شمال إسرائيل بمسيرات

    الطيران الإسرائيلي يغير على ضاحية بيروت بعد استهداف حزب الله شمال إسرائيل بمسيرات

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
صورة تعبيرية / Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

وكالة "فارس" تسرد تفاصيل تدمير السرب 157 الإسرائيلي في قاعدة رامات ديفيد

"تايمز أوف إسرائيل": صفقة أمريكية-إيرانية وشيكة بنسبة نجاح 85 بالمئة

ترامب يعلن موعد توقيع الاتفاق بين الولايات المتحدة وإيران

بعد 3 سنوات على هجوم "محمد صلاح".. الجيش الإسرائيلي يعيد حساباته تجاه التهديدات القادمة من مصر

"النووي خارج النقاش".. مستشار رئيس فريق التفاوض يكشف تفاصيل مذكرة التفاهم المرتقب توقيعها

الإعلام العبري: مصر تراقب انتشار غواصات دولفين الإسرائيلية في ميناء "بربرة" (صور)

تقرير عبري: مصر أصبحت اللاعب الإقليمي الأبرز في حرب إيران.. والقاهرة جنت مكاسب دبلوماسية غير متوقعة

"قبل بزوغ الفجر".. الحرس الثوري الإيراني يتوعد إسرائيل برد مزلزل بعد قصف الضاحية الجنوبية لبيروت

البرادعي ينتقد ترامب: اتفاق إيران عودة للصفر بعد قتل ودمار وأضرار جسيمة لحقت بالاقتصاد العالمي

إيران.. محتجون يرفعون لافتات تطالب باستقالة رئيس البرلمان ووزير الخارجية رفضا للاتفاق (فيديو)

رئيس الأركان الإسرائيلي الأسبق: اليد العليا لإيران والاتفاق يرشحها للحصول على القنبلة النووية

مخاوف إسرائيلية حادة من مناورات مصرية تركية تعيد رسم خريطة التحالفات الإقليمية

هل سيكون عمر الرئيس ترامب عائقاً لنجاحه في الانتخابات النصفية؟

إيران توضح اللغط حول تسمية "الاتفاق" المرتقب توقيعه بين طهران وواشنطن

موسكو: أعضاء في مجموعة العشرين يدعون الولايات المتحدة إلى إعادة النظر في سياسة العقوبات

الأصول المجمدة والمضيق والملف النووي.. تفاصيل تتكشف تباعا حول مسودة اتفاق واشنطن وطهران

نقطة تحول قطرية حاسمة مهدت لتوجه فانس إلى جنيف لتوقيع مذكرة تفاهم أمريكية-إيرانية

إعلام عبري: إسرائيل لا تستطيع التأثير وصوتها غير مسموع