أصبح توليد صور الذكاء الاصطناعي شائعًا بشكل متزايد مع وجود العديد من رفاق الذكاء الاصطناعي الآن على أخذ موجه نص وتزويدك بصورة ، كما وصفت تمامًا. ومع ذلك ، مع وجود العديد من الخيارات للاختيار من بينها ، قد يكون من الصعب تحديد ما هو الأفضل في إنشاء الصور ، لذلك قررت أن أضعها في الاختبار.

لقد أخذت أربعة من أكثر رفاق الذكاء الاصطناعي شعبية ، Gemini ، ChatGpt ، Grok و Microsoft Copilot وقدمت لهم نفس المطالبات بالضبط لمعرفة أيها الأفضل في إنشاء أنواع مختلفة من الصور. يسمح لك كل هؤلاء الصحابة بإنشاء صور من مطالبات نصية مجانًا ، لكن لا يمكنك إنشاء كمية غير محدودة من الصور مع عدد معين من الأجيال يوميًا.

قررت تقديم ثلاث مطالبات مختلفة لمعرفة كيف تعاملت الصحابة من الذكاء الاصطناعي مع أنماط متعددة من الصور. كان أحدهما يطلب صورة واقعية لمعرفة كيف كانت الصورة تشبه الحياة ، وإذا كان لدى الأشخاص في هذه الصور العدد الصحيح من الأطراف والأصابع ، وهو أمر يمكن أن يشكل غالبًا مشكلة في الصور التي تم إنشاؤها.

بعد ذلك كانت دعوة لحفلة عيد ميلاد لمعرفة ما إذا كانت هناك أي مشاكل مع النص والتنسيق والديكور. أخيرًا ، أردت أن أسمح لأصحاب الذكاء الاصطناعى باستعراض عضلاتهم الإبداعية من خلال السماح لهم بإنشاء صورة إبداعية بمطالبة غامضة نسبيًا.

عند إنشاء الصور ، كان لدى Gemini و Grok علامات مائية في الركن الأيمن السفلي من الصور. لا يوجد لدى كل من ChatGPT و Microsoft Copilot أي علامات مائية على الصور التي تم إنشاؤها ، لكنني أضفت الشعارات إلى الزاوية فقط من أجل الوضوح أثناء تصفح الصور.

صورة واقعية

بادئ ذي بدء ، أردت أن أضع رفقاء الذكاء الاصطناعى في تحدي خلق صورة واقعية المظهر مع عرض أناس حقيقيين. هناك مسألة شائعة إن الصور التي أنشأتها الذكاء الاصطناعى تصور الأشخاص الذين لديهم كمية خاطئة من الأطراف أو الأصابع. الموجه المستخدم لهذه الصورة كما هو موضح أدناه:

صورة واقعية لشخصين جالسين في محطة للحافلات يمسكان بأيديهم ، يرتدي معاطف المطر ، إنه يوم ممطر قليلاً مع سماء زرقاء ولكن بعض الغيوم الرمادية. المزاج سعيد ، كلا الشخصين يتحدثان ويبتسم. يجب أن تكون الصورة 1920 في 1080 بكسل في الحجم.

إن مطالبة منظمة العفو الدولية بإنشاء صورة بأيديها أمر صعب بالفعل ، ناهيك عن شخصين يحملان يديهما. يبدو أن أيا من الصور لا تبدو صحيحة حقًا عند النظر إلى اليدين – فهي جميعها تصور مجموعة غريبة من الأصابع التي تندمج معًا ، خاصة عند النظر عن كثب. بخلاف هذا ، بدا أن جميع الصور التي تم إنشاؤها تناسب المطالبة بسماء رمادية إلى حد ما ، معاطف المطر ، إما البرك أو قطرات المطر الموضحة في الخلفية.

أحد الجوانب السلبية الطفيفة هو أنه على الرغم من أن المطالبة قد ذكرت أنه يجب أن يكون هناك شخصان يحملان يديهما ، إلا أن جميع الصور قد انتهى بها الأمر إلى أن تكون رجلًا واحدًا بدلاً من امرأتين أو رجلان.

على الرغم من كونه اثنين من رفاق الذكاء الاصطناعي المختلفين ، فإن جيل الصور هذا يشير إلى حد ما إلى ChatGpt و Copilot على حد سواء يركضون من GPT-5 مع كل صورة من الصور تبدو متشابهة تمامًا فيما يتعلق بالمواقف التي يواجهها الأشخاص ، وكيف يواجهون بعضهم البعض وحتى الخلفية.

بشكل عام ، لم يقم أي من الصحابة بعمل سيء على الرغم من أن جميعهم يخلقون يد ميجا غريبة بأصابع متعددة. مفضلي الشخصي هو من الجوزاء لأنه يبدو أكثر تفصيلًا مع خلفية أكثر تعمقا.

دعوة لحزب

ثانياً ، أردت أن أرى ما إذا كان رفقاء الذكاء الاصطناعى قادرين على إنشاء صورة تتطلب نصًا وصورًا وتزيينًا وكيف سيتعامل مع التصميم. هذا هو الموجه الذي استخدمناه لهذه الصورة:

دعوة لحفلة عيد ميلاد الخامس والعشرين التي تقام في 4 أغسطس 2026 في الساعة 6 مساءً مع التاريخ والوقت على الدعوة. الموقع هو Shard في لندن الذي يجب أن يكون أيضًا على الدعوة. يجب أن يكون الأسلوب لامعًا وورديًا مع زخارف الحفلات على الدعوة أيضًا واسم فتاة عيد الميلاد هو الياسمين ، والتي يجب دمجها على الصورة. يجب أن تكون الصورة 1920 في 1080 بكسل في الحجم.

بغض النظر عن عدد المرات التي قمت فيها بتعديل هذه المطالبة ، فإن Grok ببساطة لن يوفر لي دعوة مسطحة يمكنني طباعتها وإرسالها إلى الأشخاص الذين كانوا محبطين. كانت الصورة النهائية نتيجة للمطالبة أعلاه – حيث أنشأت جميع مولدات الذكاء الاصطناعى الأخرى دعوة بسيطة لي.

على الرغم من أن جميع الدعوات لديها المعلومات المطلوبة المعروضة ، إلا أن كلا من ChatGpt و CoPilot لم تركزوا وبدلاً من ذلك يبدو أنهما تم اقتصاصهم على جانب واحد. على الرغم من أنني طلبت أن تكون الصورة 1920 × 1080 بكسل ، إلا أنهما خرجا أصغر مما يؤديني إلى الاعتقاد بأنه تم إنشاؤه في 1920 × 1080 مع النص المتمركز ولكن بعد ذلك تم اقتصاصهما أثناء صرعه.

بشكل عام ، أعتقد أن Gemini يأخذ الفوز هنا مع دعوة جميلة حيث يتمركز النص كله. ومع ذلك ، ابتكر جميع رفاق الذكاء الاصطناعى دعوة مقبولة تمامًا.

توضيح إبداعي مفصل

أخيرًا ، أردنا أن نمنح الصحابة منظمة العفو الدولية فرصة لإثبات عضلاتهم الإبداعية عن طريق طلب مشهد غريب الأطوار بأسلوب مطلي باليد. المطالبة المستخدمة كما يلي:

لوحة للأميرة في غابة تحيط بها الجنيات والتجزئة والمواه والمهر. الأجواء غريب الأطوار وسحرية وينبغي أن تبدو الصورة كما تم رسمها يدويًا. يجب أن تكون الصورة 1920 في 1080 بكسل في الحجم.

على الرغم من طلب الصورة لتبدو وكأنها تم رسمها باليد ، بدا كلاهما من Gemini و Grok مثل أسلوب الكرتون. مسألة أخرى مع خلق Grok هي أن الأصابع الموجودة على اليد على الأميرة تندمج في الشعر. مرة أخرى ، تربح اليدين ، يخسر الذكاء الاصطناعي.

كانت المطالبة التي قدمتها غامضة نسبيًا لمعرفة مدى إبداع الصورة. مرة أخرى ، يأتي Gemini في المقدمة من حيث التفاصيل ، مع وجود البريق والزهور الصغيرة التي تنتشر حول الصفحة للمساهمة حقًا في الأجواء الغريبة والسحرية التي طلبتها.

فيما يتعلق بكونك الأقرب إلى المطالبة ، فازت ChatGPT و Microsoft Copilot بفوز مشترك هنا. الصور التي تم إنشاؤها في الواقع تبدو مطلية باليد وتلتقط الأجواء السحرية.






رابط المصدر