ارتفع محرر صور من الذكاء الاصطناعى الغامق باسم “Nano Banana” مؤخرًا إلى قمة Lmarena ، وهو أكثر المتصدرين في الذكاء الاصطناعي. لقد تجاوز النموذج بسهولة خصومه في الساحة ، مما يتيح للمستخدمين اختبار نماذج الذكاء الاصطناعى وجهاً لوجه. الآن ، كشفت Google Deepmind أن نانو موز هو في الواقع الاسم المستعار لصورة الفلاش Gemini 2.5.
قبل الكشف الكبير ، أسقطت Googlers بعض التلميحات:
هذه تغريدة غير متوفرة حاليًا. قد يكون التحميل أو تمت إزالته.
الآن وبعد أن تم طرح النموذج رسميًا ، قالت Google Deepmind إن Gemini سيكون أفضل في تحرير صورك. منتجات مثل هذا تحرك لنا خطوة أقرب إلى عالم ما بعد الفوتوشوب. بدلاً من تعلم الخصائص الفنية وعموميات برامج تحرير الصور ، والتي قد تستغرق سنوات لإتقانها ، فإن محرري الصور منظمة العفو الدولية سيتيحون لأي شخص تحرير صورة مع بعض المطالبات الصوتية أو النصية البسيطة – من الناحية النظرية.
يقول فريق Google Deepmind إن هذا النموذج قد تم تدريبه على جعل الموضوعات أكثر اتساقًا عبر تعديلات مختلفة من الصور التي تم إنشاؤها من الذكاء الاصطناعى. لقد كانت هذه مشكلة بالنسبة لنماذج صور الذكاء الاصطناعى ، بالنظر إلى طبيعتها غير المتوقعة. جربت نموذج “Nano Banana” الجديد لنفسي ، وقد نجح … بخير.
سرعة الضوء القابلة للضوء
Apple Eyes Google Gemini لترقية Siri
كانت القدرة على التحميل وتحرير الصور في الجوزاء موجودة منذ أبريل من هذا العام. من خلال نموذج Gemini المحدث ، تقول Google إنه يمكنك القيام بأشياء مثل تغيير ملابس الموضوع وموقعه ، مع الحفاظ على شبههم كما هو.
يمكنك أيضًا تحميل صور متعددة وتجمع الموضوعات معًا في نفس الصورة ، أو إضافة وتغيير تفاصيل محددة في صورة تم تحميلها ، على سبيل المثال ، انظر كيف تبدو الغرفة بلون مختلف من الطلاء أو الأثاث المختلفة.
إليكم محاولة Gemini لتحرير كلبي في الكلب الهابط وينقلها إلى استوديو اليوغا. تشبهها هو نفسه ، وقد قامت بتحرير الصورة بنجاح لجعل عينيها مفتوحة ، لكن جسدها ليس مقوسًا بالطريقة التي ينبغي أن تكون بها. (كنت أعرف ، لقد رأيت هذا العوب من عدة مرات.)

ها هو كلبي لولا ، لا يفعل اليوغا
الائتمان: Mashable

إليكم النسخة الجوزاء المحررة عندما دفعتها إلى فتح عينيها ، ووضعها في الكلب الهابط ، وتغيير الخلفية إلى استوديو اليوغا. إنه قريب ، ولكن ليس صحيحًا تمامًا.
الائتمان: Mashable
كما قال Google Deepmind في إعلانه ، قد لا يحصل النموذج دائمًا على حقه بشكل صحيح. قد لا يزال هناك عدم دقة مع التفاصيل الدقيقة والنصوص في الصورة والتناقضات. من خلال تجربتي ، يبدو فراء كلبي سلسًا للغاية ، لكن تلوينها العام وحجمه وشكله يظل كما هو. تحتوي جميع الصور على علامة مائية مرئية وعلامة مائية غير مرئية تسمى Synthid للتخفيف من أي ارتباك حول ما إذا كانت حقيقية أو تم إنشاؤها. هذا التحديث موجود الآن ، لذلك يمكنك تجربته بنفسك في تطبيق Gemini.
موضوعات
الذكاء الاصطناعي Google Gemini








