
في تحذير جديد موجه لمطوري تقنيات الذكاء الاصطناعي، كشفت شركة أنثروبيك – المتخصصة في تطوير نماذج الذكاء الاصطناعي ومقرها سان فرانسيسكو – أن مجرد عينة صغيرة من البيانات الملوثة من قبل مهاجمين قد تكون كافية لزرع باب خلفي (Backdoor) داخل نموذج ذكاء اصطناعي كبير.
وجاء هذا الاكتشاف في دراسة مشتركة أجرتها أنثروبيك بالتعاون مع معهد أمان الذكاء الاصطناعي البريطاني ومعهد آلان تورينغ، وتشمل أبرز نتائج الدراسة أن النموذج قد لا يحتاج إلى الكثير من البيانات المسمومة ليصبح عرضة للهجوم.
كما أظهرت الدراسة أن حجم البيانات الكلي المستخدمة في تدريب النموذج لا يهم كثيرا، إذ إن إدخال عدد ثابت نسبيا من الوثائق الضارة – حتى لو كان بسيطا جدا مقارنة بحجم البيانات الإجمالي – يمكنه إدخال نقطة ضعف خطيرة في النموذج.
وقد ركز الباحثون في الدراسة على نوع من الهجمات يعرف بـ الهجوم عبر “الباب الخلفي”، والذي يتم تفعيله من خلال رمز خفي داخل البيانات، وعندما يصادف النموذج هذا الرمز أثناء الاستخدام، يبدأ في إنتاج مخرجات غير مفهومة أو “هراء نصي”، بينما يعمل بشكل طبيعي في باقي الحالات.
250 وثيقة تكفي لاختراق نماذج ضخمة
تم تدريب نماذج بأحجام مختلفة 600 مليون، و2 مليار، و7 مليارات، و13 مليار معلمة (parameters، حيث استخدمت البيانات النظيفة بكفاءة Chinchilla-optimal، مع إدخال عدد محدود من الوثائق الملوثة (100، 250، 500 وثيقة).
النتيجة كانت مفاجئة، حيث نجحت الهجمات على النماذج الكبيرة والصغيرة بنفس الكفاءة عند استخدام نفس عدد الوثائق الضارة، وان حجم النموذج لا يحميه من الاختراق، بل عدد الوثائق الضارة المطلقة هو العامل الحاسم.
التحذير الأهم
رغم النتائج المثيرة، شدد فريق البحث على أن نوع “الباب الخلفي” الذي تم اختباره في الدراسة كان بسيطا ومحدودا، إذ تسبب فقط في مخرجات نصية غير مفهومة، ولم تتضمن الدراسة سيناريوهات أكثر خطورة مثل:
– تسريب البيانات الحساسة
– تنفيذ تعليمات برمجية ضارة
– تجاوز أنظمة الأمان
ولا تزال هذه الجوانب تحت البحث، خاصة فيما يتعلق بالنماذج المتقدمة أو ما يعرف بـ نماذج الجيل القادم، وتسلط دراسة أنثروبيك الضوء على هشاشة نماذج الذكاء الاصطناعي الكبيرة أمام هجمات تسميم البيانات، حتى عند استخدام عدد صغير من الوثائق الضارة.
وهذا يشكل ناقوس خطر للمطورين والباحثين في المجال، ويوجه الأنظار إلى أهمية حماية بيانات التدريب من التلاعب، بغض النظر عن حجم النموذج أو عدد معالمه.
نقلاً عن : الجمهور الاخباري
تعليقات