لمنافسة جوجل.. أبل تطلق قاعدة بيانات ضخمة لتطوير نماذج الذكاء الاصطناعي

لمنافسة جوجل.. أبل تطلق قاعدة بيانات ضخمة لتطوير نماذج الذكاء الاصطناعي

كشف باحثو أبل عن إطلاق قاعدة بيانات واسعة النطاق تهدف إلى مساعدة الآخرين على تطوير نماذج الذكاء الاصطناعي الخاصة بتحرير الصور.

وأطلقت الشركة على هذه القاعدة اسم Pico-Banana-400K، التي تحتوي على 400000 صورة حقيقية ونظيراتها المحررة بالذكاء الاصطناعي، لاستخدامها في تدريب النماذج اللغوية الكبيرة على التعامل مع طلبات تحرير الصور القائمة على النصوص، جدير بالذكر أن هذه القاعدة مفتوحة المصدر لكنها متاحة فقط لأغراض البحث العلمي، ولا يمكن استخدامها تجاريا.

Pico-Banana-400K: دعم البحث العلمي في تحرير الصور بالنصوص

نشرت أبل ورقة بحثية بعنوان “Pico-Banana-400K، قاعدة بيانات واسعة لتحرير الصور الموجه بالنصوص” على arXiv، تحتوي على نحو 400000 زوج من الصور الحقيقية والمحررة، مأخوذة من OpenImages، منظمة ضمن تصنيف 35 نوعا من التعديلات، ومقسمة إلى تعديلات ذات خطوة واحدة، وتتابعات متعددة الخطوات، وأزواج تفضيل.

تهدف هذه التنظيمات إلى تحويل إشارات التدريب من أمثلة صناعية محدودة إلى سيناريوهات حقيقية غنية بالتعليمات تشبه ما يطلبه المستخدمون فعليا.

 

طريقة الإنتاج والمميزات

تم إنشاء قاعدة البيانات باستخدام نموذج توليدي قوي (Nano Banana) لإنشاء التعديلات، ونموذج متعدد الوسائط كبير آخر ليعمل كقاض آلي، يقوم بفلترة المحاولات الفاشلة وإعادة تنفيذها، النتيجة هي قاعدة بيانات تركز على تنوع الصور الفوتوغرافية، المشاهد الإنسانية، والصور الغنية بالنصوص، مع تعليمات طويلة وقصيرة لدعم الأبحاث.

تتضمن القاعدة أيضا أمثلة سلبية وأزواج تفضيل، ما يساعد في أبحاث مواءمة النماذج، وتعليم النماذج ليس فقط ما يجب فعله، بل أيضا ما يبدو “أفضل”، كما توثق الورقة أنواع التعديلات القوية مثل تحويل الأنماط والتغييرات الفوتومترية العامة، والأنواع الهشة مثل إعادة توضع دقيقة للعناصر أو استبدال النصوص على اللوحات، ما يجعلها صريحة بشكل استثنائي حول حدود النموذج.

جدير بالذكر أن أبل تواجه بعض التأخيرات في تطوير نماذج الذكاء الاصطناعي الداخلية، حيث على الرغم من دمج الذكاء الاصطناعي في تطبيقات وميزات جديدة مع إطلاق سلسلة iPhone 17، لا تزال الشركة تؤجل تحديث Siri الذي أعلن عنه لأول مرة في 2024.

نقلاً عن : الجمهور الاخباري

محمد الهلالي، كاتب متخصص في الأخبار يتمتع بخبرة واسعة في تغطية الأحداث المحلية والعالمية. يسعى لتقديم محتوى دقيق وشامل يضع القارئ في قلب الحدث، مع تحليلات معمّقة ورؤية متوازنة تعزز الفهم العام وتسلط الضوء على خلفيات الأخبار وتأثيراتها.