يمكن لنظام الذكاء الاصطناعي الجديد إنشاء مجموعة متنوعة من الصور الواقعية والسريالية من أوصاف اللغة الطبيعية. من المحتمل أن تغير قواعد اللعبة ، ولكن ليس بدون بعض المخاوف.
تستمر الخوارزميات والذكاء الاصطناعي في إحداث موجات عبر صناعة الفن.
يأتي أحدث إنجاز من فريق بحث يسمى OpenAI ، والذي كشف للتو عن نسخة جديدة من برنامج DALL-E. هذا البرنامج عبارة عن أداة لتوليد النص إلى صورة تنتج عملًا فنيًا بناءً على وصف يدخله المستخدم.
عرض هذه المشاركة على Instagram
لن يكون هذا الذكاء الاصطناعي الجديد ، الذي يُطلق عليه اسم DALL-E 2 ، متاحًا للجمهور ، ولكن يمكن للباحثين الاشتراك لمعاينة إمكاناته. تقول شركة OpenAI إنها تخطط لإتاحة برنامجها للاستخدام في تطبيقات الطرف الثالث في نهاية المطاف - على الرغم من عدم وجود معلومات حول موعد حدوث ذلك.
في الوقت الحالي ، سيتم اختبار البرنامج من قبل شركاء تم فحصهم.
لا يُسمح للمستخدمين بتحميل الصور التي تم إنشاؤها والتي قد "تسبب ضررًا" ، ويجب عليهم الكشف عن الغرض الذي يستخدمون الذكاء الاصطناعي من أجله.
كيف يعمل DALL-E 2؟
بينما أنا لست خبيرًا في الترميز بأي حال من الأحوال ، فأنا يمكن تأكد من أن DALL-E 2 يعمل باستخدام مكتبة صور مسبقة الصنع. يتم إعطاء الخوارزمية ثروة من الصور ذات العلامات ثم تقوم بإنشاء عمل فني جديد بناءً على ما تعرفه بالفعل.
لنفترض أنك تريد إنشاء صورة لنمر على زورق. الحق غريب؟ لكن DALL-E 2 سيبحث في ملفاته للعثور على شكل كل من "الزورق" و "النمر" ، وإنشاء قطعة واحدة تجمع بينهما بشكل مقنع.
عرض هذه المشاركة على Instagram
يعتمد DALL-E 2 على CLIP الخاص بالتكرار الأول ، وهو نظام رؤية الكمبيوتر. يقول OpenAI أن هذا البرنامج الجديد يولد الصور باستخدام "الانتشار" ، حيث تبدأ القطعة على شكل بضع نقاط ويتم ملؤها تدريجياً بالتفاصيل.
تحدث هذه العملية عبر نموذج من مرحلتين. يقوم CLIP أولاً بمطابقة النص الخاص بك مع الصور الفوتوغرافية والصور الأخرى الموجودة ، ثم يقوم "وحدة فك ترميز" بإنشاء الصورة نفسها.
يقدم الفيديو أعلاه عرضًا موجزًا لما هو ممكن ، حيث يُظهر القطط التي تم إنشاؤها بواسطة الذكاء الاصطناعي ، والإصدارات التي تم تعديلها بشكل واقعي من الصور الموجودة مسبقًا ، ونظام معقد لتسمية الكائنات يسمح لـ DALL-E 2 بفهم مطالباتك. إنها أشياء رائعة حقًا.
ومن المثير للاهتمام ، أن شركة OpenAI تؤكد أنه لا تزال هناك أخطاء ومشكلات يجب حلها.
عرض هذه المشاركة على Instagram
قد تتسبب الكائنات التي تم تصنيفها بشكل خاطئ في أن تنتج الخوارزمية صورًا غير صحيحة لا تتماشى مع وصف النص المقدم. إذا كان ضمن تشفيرها صورة موجودة مسبقًا لسيارة مُصنَّفة على أنها "طائرة" ، على سبيل المثال ، فقد يؤدي ذلك إلى انحراف المولد تمامًا عن مساره ، وإرسال سيارة BMW بدلاً من Boeing.
بالإضافة إلى ذلك ، لا يمكن تقديم مطالبات محددة جدًا حتى يقوم الذكاء الاصطناعي بتسمية الكائنات ذات الصلة وتعلمها.
قد يؤدي طلب بلدة أو نوع نادر من الحيوانات إلى ظهور صور غير صحيحة وغير صحيحة حتى يتم تحسين الخوارزمية. ضع في اعتبارك أن هذا ليس سوى التكرار الثاني لـ DALL-E ، لذلك سنرى بلا شك المزيد من العروض التوضيحية المذهلة في المستقبل.