القائمة القائمة

تقوم تقنية AI DALL-E 2 الجديدة بإنشاء صور من المطالبات النصية

يمكن لنظام الذكاء الاصطناعي الجديد إنشاء مجموعة متنوعة من الصور الواقعية والسريالية من أوصاف اللغة الطبيعية. من المحتمل أن تغير قواعد اللعبة ، ولكن ليس بدون بعض المخاوف.

تستمر الخوارزميات والذكاء الاصطناعي في إحداث موجات عبر صناعة الفن.

يأتي أحدث إنجاز من فريق بحث يسمى OpenAI ، والذي كشف للتو عن نسخة جديدة من برنامج DALL-E. هذا البرنامج عبارة عن أداة لتوليد النص إلى صورة تنتج عملًا فنيًا بناءً على وصف يدخله المستخدم.

 

عرض هذه المشاركة على Instagram

 

تم نشر منشور بواسطة DALL · E بواسطة OpenAI (openaidalle)

لن يكون هذا الذكاء الاصطناعي الجديد ، الذي يُطلق عليه اسم DALL-E 2 ، متاحًا للجمهور ، ولكن يمكن للباحثين الاشتراك لمعاينة إمكاناته. تقول شركة OpenAI إنها تخطط لإتاحة برنامجها للاستخدام في تطبيقات الطرف الثالث في نهاية المطاف - على الرغم من عدم وجود معلومات حول موعد حدوث ذلك.

في الوقت الحالي ، سيتم اختبار البرنامج من قبل شركاء تم فحصهم.

لا يُسمح للمستخدمين بتحميل الصور التي تم إنشاؤها والتي قد "تسبب ضررًا" ، ويجب عليهم الكشف عن الغرض الذي يستخدمون الذكاء الاصطناعي من أجله.


كيف يعمل DALL-E 2؟

بينما أنا لست خبيرًا في الترميز بأي حال من الأحوال ، فأنا يمكن تأكد من أن DALL-E 2 يعمل باستخدام مكتبة صور مسبقة الصنع. يتم إعطاء الخوارزمية ثروة من الصور ذات العلامات ثم تقوم بإنشاء عمل فني جديد بناءً على ما تعرفه بالفعل.

لنفترض أنك تريد إنشاء صورة لنمر على زورق. الحق غريب؟ لكن DALL-E 2 سيبحث في ملفاته للعثور على شكل كل من "الزورق" و "النمر" ، وإنشاء قطعة واحدة تجمع بينهما بشكل مقنع.

 

عرض هذه المشاركة على Instagram

 

تم نشر منشور بواسطة DALL · E بواسطة OpenAI (openaidalle)

يعتمد DALL-E 2 على CLIP الخاص بالتكرار الأول ، وهو نظام رؤية الكمبيوتر. يقول OpenAI أن هذا البرنامج الجديد يولد الصور باستخدام "الانتشار" ، حيث تبدأ القطعة على شكل بضع نقاط ويتم ملؤها تدريجياً بالتفاصيل.

تحدث هذه العملية عبر نموذج من مرحلتين. يقوم CLIP أولاً بمطابقة النص الخاص بك مع الصور الفوتوغرافية والصور الأخرى الموجودة ، ثم يقوم "وحدة فك ترميز" بإنشاء الصورة نفسها.

يقدم الفيديو أعلاه عرضًا موجزًا ​​لما هو ممكن ، حيث يُظهر القطط التي تم إنشاؤها بواسطة الذكاء الاصطناعي ، والإصدارات التي تم تعديلها بشكل واقعي من الصور الموجودة مسبقًا ، ونظام معقد لتسمية الكائنات يسمح لـ DALL-E 2 بفهم مطالباتك. إنها أشياء رائعة حقًا.

ومن المثير للاهتمام ، أن شركة OpenAI تؤكد أنه لا تزال هناك أخطاء ومشكلات يجب حلها.

 

عرض هذه المشاركة على Instagram

 

تم نشر منشور بواسطة DALL · E بواسطة OpenAI (openaidalle)

قد تتسبب الكائنات التي تم تصنيفها بشكل خاطئ في أن تنتج الخوارزمية صورًا غير صحيحة لا تتماشى مع وصف النص المقدم. إذا كان ضمن تشفيرها صورة موجودة مسبقًا لسيارة مُصنَّفة على أنها "طائرة" ، على سبيل المثال ، فقد يؤدي ذلك إلى انحراف المولد تمامًا عن مساره ، وإرسال سيارة BMW بدلاً من Boeing.

بالإضافة إلى ذلك ، لا يمكن تقديم مطالبات محددة جدًا حتى يقوم الذكاء الاصطناعي بتسمية الكائنات ذات الصلة وتعلمها.

قد يؤدي طلب بلدة أو نوع نادر من الحيوانات إلى ظهور صور غير صحيحة وغير صحيحة حتى يتم تحسين الخوارزمية. ضع في اعتبارك أن هذا ليس سوى التكرار الثاني لـ DALL-E ، لذلك سنرى بلا شك المزيد من العروض التوضيحية المذهلة في المستقبل.


لماذا قد يسبب هذا مشاكل للفنانين؟

بعد الاطلاع على العمل الفني الذي تم إنشاؤه بواسطة DALL-E 2 ، من الصعب ألا تشعر بالإثارة من إمكانيات التكنولوجيا.

ومع ذلك ، يجب أن نكون على دراية بالمزالق المحتملة. يواجه الفنانون بالفعل وقتًا صعبًا للغاية في كسب المال مقابل عملهم في عصر الإنترنت - ومن هنا كان السبب الأولي لـ NFTs - ويمكن لأداة الصور الجديدة القائمة على الخوارزمية أن تخرج العديد من الرسامين الرقميين الصغار من العمل.

 

عرض هذه المشاركة على Instagram

 

تم نشر منشور بواسطة DALL · E بواسطة OpenAI (openaidalle)

كما سيصبح التحقق من صحة صورة أو لوحة على الإنترنت أكثر صعوبة ، وقد يقلل من قيمة عمل البشر الحقيقيين. يمكن أن يصبح صك الصورة الفوري أمرًا ممكنًا ، مما يؤدي إلى إنشاء سوق NFT أكثر استغلالًا.

إذا كان بإمكان الجميع صنع أي شيء على الفور ، فهل تفقد الرسوم التوضيحية واللوحات كل قيمتها التجارية؟ هل أصبح الفن نفسه مجرد تطبيق أو أداة أخرى ليستخدمها أي شخص؟

 

عرض هذه المشاركة على Instagram

 

تم نشر منشور بواسطة DALL · E بواسطة OpenAI (openaidalle)

هناك أسئلة وجودية كبيرة حول الآثار المترتبة على مثل هذه البرامج الرائدة حقًا ، وكثير منها ليس لدينا إجابات عليها.

إلى رصيد OpenAI ، على ما يبدو مدركين جدا للمخاطر. تنص على أن DALL-E 2 لن يكون متاحًا بشكل كامل للجمهور مطلقًا ، وسيتم نشره ببطء فقط للباحثين والشركاء الموثوق بهم بناءً على التعليقات. سيحتاج المستخدمون إلى توضيح سبب استخدامهم للبرنامج ولا يمكنهم عمل أي صور بذيئة أو ضارة.

إنها تريد التأكد من أن المعلومات المضللة أو الصور المزيفة لا تنتهي بالتسبب في مزيد من الخراب لأنظمتنا السياسية وخطابنا عبر الإنترنت أيضًا.

 

عرض هذه المشاركة على Instagram

 

تم نشر منشور بواسطة DALL · E بواسطة OpenAI (openaidalle)

قد تكون هذه النوايا سليمة بما فيه الكفاية ، ولكن من الذي سيقول إن المبرمجين الآخرين الأقل نية لن يقوموا ببساطة بنسخ عمل OpenAI؟ لقد رأينا بالفعل تطبيقًا واحدًا يسمى إطلاق Wombo's Dream العام الماضي ، ومن الواضح أنه يعتمد على هذا المفهوم.

يمكنك الوصول إليه الآن - على الرغم من أنه أقل تعقيدًا بكثير من DALL-E 2.

في النهاية ، ليس لدينا أي فكرة عن كيفية تأثير هذه التكنولوجيا على عالم الفن. ما احنا دo أعلم أن الأمور أصبحت مثيرة للإعجاب بشكل مخيف ، وربما حتى وادي غريب قليلاً. في الوقت الحالي ، يبدو أن شركة OpenAI تطرح منتجاتها بمسؤولية - وهذا أفضل ما يمكن أن نأمله في هذه المرحلة المبكرة.

إمكانية الوصول