لقد شهدنا انفجاراً مفاجئاً في أدوات الذكاء الاصطناعي التوليدية خلال الأشهر القليلة الماضية، ولا يوجد مكان أكثر صحة من هذا في مجال إنشاء الصور، وبين المجانية والمدفوعة والمفتوحة المصدر هناك العديد من الخيارات للاختيار من بينها. ولكن إذا كنت قد أوليت بعض الاهتمام للمناقشات المتعلقة بالصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي، فلا شك أنك سمعت عن التنافس بين Midjourney و Stable Diffusion.
وبينما يقوم كل من مولدي صور AI بعمل ممتاز، إلا أنهما يختلفان من حيث ميزات التخصيص والأنماط الفنية وسهولة الاستخدام والسعر وغيرها. لذلك في هذه المقالة دعنا نلقي نظرة على ما يفصل بين الاثنين وأي واحد يجب عليك استخدامه.
Midjourney مقابل Stable Diffusion: ما الفرق؟
إذا كنت قد سمعت مؤخراً عن Midjourney أو Stable Diffusion، فذلك لأنهما من أحدث مولدات صور AI المتاحة اليوم، وقد تم إطلاق كلاهما للجمهور في منتصف عام 2022 ولكن بأهداف مختلفة إلى حد كبير، حيث تم إطلاق Midjourney كخدمة هادفة للربح، بينما أطلق المطورون Stable Diffusion بموجب ترخيص مفتوح المصدر.
وقد جعلت طبيعة Stable Diffusion المفتوحة منه أحد أكثر مولدات الصور قابلية للتخصيص والأكثر توفراً، إذ يمكنك استخدام نسخة أساسية منه عبر الإنترنت، إما مجاناً أو من خلال اشتراك مدفوع. ولكن إذا كنت تتطلع إلى الحصول على أفضل النتائج الممكنة، فربما تريد إنشاء صور على جهاز الكمبيوتر الخاص بك، وغالباً ما يحتوي برنامج الواجهة الأمامية مثل مشروع Stable Diffusion Web UI على الكثير من الميزات المتقدمة ويسمح لك باستخدام نماذج فنية مخصصة، أما الجانب السلبي منه فهو أن الإعداد يستغرق بعض الوقت والمهارات الفنية.
يعد Midjourney أسهل في الاستخدام، لكن Stable Diffusion يوفر الكثير من الخيارات للمستخدمين المبتدئين وذوي الخبرة. ومن ناحية أخرى، لا يأخذ Midjourney نفس القدر من الجهد.
ماذا عن الجودة الفعلية للصور؟ يجب أن تحصل على نتائج دقيقة بشكل معقول من كلا مولدي صور الذكاء الاصطناعي، ومع ذلك فإن طراز V5 وهو الأحدث من Midjourney يولد صوراً عالية الجودة تتطابق مع مطالبة النص بشكل جيد للغاية، ولكن إذا كنت على استعداد لبذل جهد لتعديل المدخلات وضبط الإعدادات، فيمكن أيضاً أن يتطابق Stable Diffusion أو حتى يتجاوز نتائج Midjourney.
Midjourney مقابل Stable Diffusion: الميزات
في لمحة عابرة، قد يبدو كل من Midjourney و Stable Diffusion كما لو أنهما يقدمان نفس مجموعة الميزات، ومع ذلك فإن كل من مولدي الصور لديهما بعض نقاط القوة والضعف الفريدة.
خذ عملية الترقية على سبيل المثال، والتي كان بإمكانك إنجازها مسبقاً باستخدام الأزرار U1 و U2 و U3 و U4 في Midjourney، حيث لم يعد ذلك ممكناً لأن أحدث طراز من Midjourney لا يدعم أي طرازات ترقية حتى الآن. وعلى النقيض من ذلك فإن الطبيعة المفتوحة لـ Stable Diffusion تعني أنه يمكنك تنزيل عدة نماذج ترقية مختلفة لتجربتها، وإذا كان جهاز الكمبيوتر الخاص بك يحتوي على ذاكرة فيديو كافية، فيمكنك أيضاً إنشاء صور بدقة أعلى من الحد الحالي لـ Midjourney وهو واحد ميغا بكسل.
وفيما يلي قائمة قصيرة ببعض الاختلافات في الميزات الأخرى بين Midjourney و Stable Diffusion:
- Inpainting و outpainting: باستخدام Stable Diffusion يمكنك استخدام inpainting لتعديل أجزاء معينة من صورة موجودة، وبالمثل يتيح لك outpainting إنشاء تفاصيل جديدة خارج حدود الصورة الحالية، بينما لا تدعم Midjourney أياً من ميزات التحرير هذه حتى الآن.
- مطالبات الصور: يمكنك تحميل صورة (أو اثنتين) كجزء من موجهك في Midjourney، حيث سيقوم الروبوت بدمج الصورة مع النص الخاص بك لإنشاء إخراج مشابه لما أدخلته بشكل مرئي.
- أنماط فنية مخصصة: تقدم Midjourney نموذجاً محسّناً للأنيمي يمكنك استدعاؤه باستخدام –niji. ومع ذلك، يتيح لك Stable Diffusion تنزيل نماذج مخصصة على مجموعة متنوعة من الأنماط الفنية، من الواقعية إلى الأوريغامية.
- الرقابة: بينما لا تسمح لك نماذج Stable Diffusion الرسمية بإنشاء صور صريحة، يمكنك التغلب على هذه القيود باستخدام نماذج مخصصة، إلا أنّ هذا غير ممكن مع Midjourney فقد تجد حسابك محظوراً إذا كانت مطالباتك تحتوي على لغة صريحة أو إيحائية.
ضع في اعتبارك أنه سيتعين عليك استخدام Stable Diffusion على أجهزتك الخاصة للإستفادة من معظم فوائدها، إذ لا تقدم الأدوات عبر الإنترنت نفس المستوى من المرونة، مما يجعل Midjourney بنفس قدرة Stable Diffusion.
Midjourney مقابل Stable Diffusion: السعر
كشركة هادفة للربح، ليس من المستغرب أن تفرض Midjourney بعض القيود على عدد المرات التي يمكنك استخدامها فيها، وحتى مع اشتراك Midjourney المدفوع، فإنك تحصل فقط على قدر محدود من ساعات إنشاء الصور المجانية كل شهر، كما توفر الخطط التي تبلغ 30 دولار أو أعلى ساعات غير محدودة من الوضع المريح، ولكن هذا يعني أنه سيتعين عليك الانتظار عدة دقائق في كل مهمة، وعلاوةً على ذلك لا توجد فئة مجانية أو تجريبية على الإطلاق.
يعمل Stable Diffusion بطريقة معاكسة تماماً، حيث أنّ كود المصدر الخاص به متاح رسمياً للتنزيل، مما يعني أنه يمكنك استخدامه مجانًا. ومع ذلك ستحتاج إلى جهاز كمبيوتر قوي مع بطاقة رسومات مخصصة، كما تستهلك معظم الموديلات ما لا يقل عن 4 غيغابايت من VRAM، لذا فإن كمبيوتر الألعاب الحديث يناسب ذلك. ولكن إذا لم تكن تمتلك واحداً بالفعل، فإن هذا النوع من الأجهزة يمكن أن يكلفك بسهولة أكثر من ألف دولار، ولحسن الحظ يمكنك استخدام Stable Diffusion عبر الإنترنت أو حتى عبر جهاز افتراضي قائم على السحابة مثل Google Colab، هذا ويمكنك استخدام Stable Diffusion مجاناً، لكن الأمر سيستغرق بعض الجهد.
من الجدير بالذكر أن منشئو Stable Diffusion يقدمون أيضاً تطبيقاً لإنشاء الصور على الويب يسمى DreamStudio، ومن السهل البدء به، تماماً مثل Midjourney ولكن له تكلفة. ومع ذلك فهو أرخص إلى حد ما نظراً لأن 10 دولارات أمريكية تمنحك 1000 credits، كما يمكنك أيضاً تجربتها مجاناً حيث تحصل جميع الحسابات الجديدة على 25 credits عند التسجيل.
وفي حال كنت تبحث عن خيار مجاني وسهل الاستخدام، فإننا نوصي بالتفكير في بديل ثالث مثل Bing Image Creator بدلاً من ذلك.
Midjourney مقابل Stable Diffusion: أيهما يجب استخدامه؟
دعنا نلقي نظرة على بعض الأمثلة الواقعية لمعرفة أي منشئ صور AI هو الأفضل، ولإجراء هذه المقارنة، سنستخدم DreamStudio لإنشاء صور عبر Stable Diffusion لأنها سهلة الاستخدام مثل Midjourney، وربما يمكننا الحصول على نتائج أفضل مع النماذج المخصصة، ولكنّ هذا سيتطلب جهداً أكبر بكثير، لذلك وللحفاظ على الأمور عادلة، دعنا نقارن التجربة ذات النقرة واحدة لاستخدام Midjourney و Stable Diffusion.
تم إنشاء الصورة الأولى بموجه مبسط إلى حد ما، إذ نعتقد أن كلا مولدي الصور قد أبلا بلاءً حسناً مع المعلومات المحدودة المقدمة، حتى لو اتبعنا أساليب مختلفة تماماً.
يوضح المثال التالي بوضوح واحدة من أعظم نقاط القوة في Midjourney وهي الواقعية، فإذا كنت تتطلع إلى إنشاء صور تبدو وكأنها مأخوذة من الواقع، ستحصل غالباً على نتائج أفضل من معظم برامج إنشاء صور الذكاء الاصطناعي الأخرى. بينما يتطابق Stable Diffusion مع كل شيء موجود في الموجه، فإنه لا يرقى إلى مستوى بت واحد من الصورة الواقعية.
وبالوصول إلى مثالنا الأخير، ألق نظرة على كيفية تعامل مولدي الصور مع المطالبات الخيالية، حيث طلبنا في رسالة النص وجود تنين أفعواني أبيض كبير يجلس فوق صخرة يراقب الأفق. مرة أخرى من الواضح أن Midjourney يمكنه إنشاء تفاصيل أكثر تعقيداً، ومع ذلك إذا نظرت عن كثب إلى الجزء السفلي من الصورة ستلاحظ سلسلة من الأحرف المشوشة حيث حاولت Midjourney تكرار علامة مائية تعلمتها من بيانات التدريب الخاصة بها.
يجدر التأكيد بأن المستخدمين المتقدمين يمكنهم استخراج صور أفضل بكثير عبر Stable Diffusion مما حصلنا عليه في الأمثلة المعروضة هنا. ومع ذلك عند مقارنة الخيارين من حيث الأسهل استخداماً، وجدنا بأن Midjourney تقدم غالباً نتائج أفضل لنفس موجه الإدخال.