Google Nano Banana 2: نصف تكلفة صور الذكاء الاصطناعي للمؤسسات
أعلنت [[جوجل]] اليوم عن إطلاق نموذجها الجديد [[Nano]]، المصمم خصيصاً للمؤسسات لحل مشكلة التكلفة العالية في توليد صور الذكاء الاصطناعي عالية الجودة. هذا النموذج، الذي يُعرف رسمياً باسم Gemini 3.1 Flash Image، يهدف إلى جعل توليد الصور بالذكاء الاصطناعي عالي الجودة أكثر سهولة واقتصادية للشركات.
لطالما واجهت الشركات التي تسعى إلى نشر توليد صور الذكاء الاصطناعي على نطاق واسع خياراً صعباً: إما دفع أسعار باهظة لنموذج Google Nano Banana Pro، أو الاكتفاء ببدائل أرخص وأسرع ولكنها أقل جودة بشكل ملحوظ، خاصة فيما يتعلق بالمتطلبات المؤسسية مثل النصوص الدقيقة والرسوم البيانية والمعلومات غير الجمالية.
اليوم، تسعى Google DeepMind إلى سد هذه الفجوة بإطلاق Nano Banana 2، وهو نموذج يجمع بين القدرات الاستدلالية وعرض النصوص والتحكم الإبداعي للنسخة الاحترافية، ولكن بسرعة وأسعار "فلاش". كما تظهر الصورة المرفقة، والتي تم إنشاؤها باستخدام Google Nano Banana Pro، القدرات الإبداعية للنماذج السابقة.
مشكلة تكلفة الإنتاج: لماذا بقي Nano Banana Pro في المختبر؟
عندما أطلقت جوجل نموذج Nano Banana Pro في نوفمبر 2025، والذي بُني على أساس Gemini 3 Pro، أُعجب مجتمع المطورين بدقته البصرية وقدراته الاستدلالية. كان النموذج قادراً على عرض نصوص دقيقة داخل الصور، والحفاظ على اتساق الشخصيات عبر المحادثات المتعددة، واتباع التعليمات التركيبية المعقدة، وهي قدرات عانت منها مولدات الصور السابقة.
لكن أسعار النسخة الاحترافية شكلت حاجزاً أمام النشر على نطاق واسع. وفقاً لصفحة أسعار واجهة برمجة تطبيقات جوجل، يبلغ سعر إخراج الصور من Nano Banana Pro 120 دولاراً لكل مليون رمز، أي ما يعادل حوالي 0.134 دولار لكل صورة مُولّدة بدقة 1K بكسل. بالنسبة للتطبيقات التي تولد آلاف الصور يومياً، مثل تصور المنتجات للتجارة الإلكترونية، أو خطوط أنابيب الأصول التسويقية، أو توليد المحتوى المحلي، تتضاعف هذه التكاليف بسرعة.
نموذج Nano Banana 2، المبني على أساس Gemini 3.1 Flash، يقلل هذه الأسعار بشكل كبير. يبلغ سعر إخراج الصور من فئة "فلاش" 60 دولاراً لكل مليون رمز، أي حوالي 0.067 دولار لكل صورة بدقة 1K، وهو ما يمثل حوالي 50% أرخص من النموذج الاحترافي. بالنسبة للشركات التي تدير مهام عمل توليد الصور بكميات كبيرة، هذا هو الفارق بين إثبات المفهوم والنشر الفعلي للإنتاج.
ماذا يقدم Google Nano Banana 2 بالفعل؟
النموذج ليس مجرد نسخة أرخص من Nano Banana Pro. وفقاً لإعلان Google DeepMind، يقدم Nano Banana 2 العديد من القدرات التي كانت حصرية للنسخة الاحترافية، بالإضافة إلى تقديم ميزات جديدة خاصة به.
- تحسين عرض النصوص والترجمة: يمكن للنموذج توليد صور بنصوص دقيقة وواضحة، وهي نقطة ضعف تاريخية لمولدات صور الذكاء الاصطناعي، ثم ترجمة هذا النص إلى لغات مختلفة ضمن نفس سير عمل تحرير الصور.
- اتساق الموضوع المحسن: يمكن لـ Nano Banana 2 الحفاظ على تشابه الشخصيات عبر ما يصل إلى خمس شخصيات، والحفاظ على دقة ما يصل إلى 14 كائناً مرجعياً في سير عمل توليد واحد. هذا يتيح إنشاء لوحات قصصية، وتصوير المنتجات مع وحدات تخزين متعددة، وإنشاء أصول العلامة التجارية حيث يكون الاستمرارية البصرية مهمة.
- مواصفات تقنية متقدمة: يدعم النموذج التحكم الكامل في نسبة العرض إلى الارتفاع، ودقات تتراوح من 512 بكسل وصولاً إلى 4K، ومستويين من التفكير يسمحان للمطورين بالموازنة بين الجودة والوقت.
- أداة البحث عن الصور: إضافة ملحوظة يفتقر إليها Nano Banana Pro، حيث يمكن للنموذج إجراء عمليات بحث عن الصور واستخدام الصور المسترجعة كسياق أساسي للتوليد، مما يوسع فائدته لمهام العمل التي تتطلب مواد مرجعية بصرية.
عامل Qwen-Image-2.0: لماذا كان على جوجل التحرك بسرعة؟
توقيت جوجل ليس صدفة. ففي 10 فبراير، أطلق فريق Qwen التابع لـ [[Alibaba]] نموذج Qwen-Image-2.0، وهو نموذج موحد لتوليد الصور وتحريرها، والذي قورن فوراً بـ Nano Banana Pro، ولكن ببصمة أصغر بكثير.
يعمل Qwen-Image-2.0 على 7 مليارات معلمة فقط، بانخفاض من 20 مليار في سابقه، بينما يوحد توليد النص إلى صورة وتحرير الصور في بنية واحدة. يولد النموذج بدقة 2K (2048×2048 بكسل)، ويدعم المطالبات التي تصل إلى 1000 رمز للتخطيطات المعقدة، ويحتل المرتبة الأولى أو بالقرب منها في لوحة المتصدرين لتقييمات الذكاء الاصطناعي AI Arena البشرية العمياء لمهام التوليد والتحرير.
بالنسبة للمشترين من الشركات، فإن الديناميكيات التنافسية كبيرة. يعني عدد معلمات Qwen-Image-2.0 البالغ 7 مليارات تكاليف استنتاج أقل بكثير عند الاستضافة الذاتية، وهو اعتبار حاسم للمؤسسات ذات متطلبات الإقامة البيانات أو أعباء العمل الكبيرة.
كما يوفر Qwen-Image-2.0 بنية موحدة للتوليد والتحرير تبسط النشر. فبدلاً من ربط نماذج منفصلة للإنشاء والتعديل، وهو المعيار الصناعي الحالي، يتعامل Qwen-Image-2.0 مع كلتا المهمتين في تمريرة واحدة، مما يقلل من زمن الوصول وتدهور الجودة الذي يحدث عند تمرير المخرجات بين أنظمة مختلفة.
حيث يتخلف Qwen-Image-2.0 حالياً هو التكامل البيئي. يتم إطلاق Google Nano Banana 2 اليوم عبر تطبيق Gemini، وبحث جوجل (وضع الذكاء الاصطناعي والعدسة)، وAI Studio، وGemini API، وGoogle Antigravity، وVertex AI، وGoogle Cloud، وFlow، حيث يصبح نموذج توليد الصور الافتراضي بدون تكلفة ائتمانية. هذا النطاق الواسع من التوزيع يصعب على أي منافس تكراره، خاصة وأن الوصول إلى واجهة برمجة تطبيقات Qwen-Image-2.0 يقتصر حالياً على منصة Alibaba Cloud.
ماذا يعني هذا لاستراتيجيات صور الذكاء الاصطناعي للمؤسسات؟
إن التوافر المتزامن لـ Nano Banana 2 و Qwen-Image-2.0 يخلق إطار عمل لاتخاذ القرار لم يكن متاحاً لقادة تكنولوجيا المعلومات من قبل في مجال توليد الصور. بالنسبة للمؤسسات المدمجة بالفعل في نظام جوجل السحابي، فإن Nano Banana 2 هو التقييم الأول الواضح. يجعله تخفيض التكلفة من أسعار النسخة الاحترافية، جنباً إلى جنب مع التكامل الأصلي عبر منتجات جوجل، المسار الأقل مقاومة للفرق التي تحتاج إلى توليد صور بجودة إنتاج دون إعادة هيكلة بنيتها التحتية.
بالنسبة للمؤسسات التي لديها مخاوف بشأن سيادة البيانات، أو أعباء العمل الكبيرة التي تجعل تسعير واجهة برمجة التطبيقات لكل صورة باهظاً، أو تفضيل استراتيجي للنماذج مفتوحة الوزن، يقدم Qwen-Image-2.0 بديلاً مقنعاً، شريطة أن تفي Alibaba بوعدها بتوفير الوزن المفتوح.
طبقة المصدر: ميزة مؤسسية هادئة ولكنها مهمة
تضمن إعلان جوجل تفصيلاً قد يهم فرق الامتثال القانوني في الشركات أكثر من أي معيار جودة: أدوات التحقق من المصدر. يأتي Nano Banana 2 مزوداً بعلامة SynthID المائية، وهي تقنية جوجل لتحديد المحتوى الذي تم إنشاؤه بالذكاء الاصطناعي، مقترنة ببيانات اعتماد محتوى C2PA، وهو المعيار الصناعي المشترك لبيانات تعريف أصالة المحتوى.
بالنسبة للشركات العاملة في الصناعات الخاضعة للتنظيم أو الولايات القضائية ذات متطلبات الشفافية الناشئة للذكاء الاصطناعي، لم يعد التحقق من المصدر المدمج خياراً. إنه بند امتثال، ولا توفره البدائل مفتوحة الوزن المستضافة ذاتياً مثل Qwen-Image-2.0 بشكل أصلي.
الخلاصة
لا يمثل Google Nano Banana 2 قفزة جيلية في جودة توليد الصور. ما يمثله هو نضوج توليد صور الذكاء الاصطناعي من مجرد ابتكار إبداعي إلى مكون بنية تحتية جاهز للإنتاج. من خلال سد فجوة التكلفة والسرعة بين فئتي "فلاش" و"برو" مع الحفاظ على القدرات الاستدلالية وعرض النصوص التي تجعل هذه النماذج مفيدة لمهام العمل الفعلية، تراهن جوجل على أن الموجة التالية من تبني صور الذكاء الاصطناعي للمؤسسات لن تكون مدفوعة بالنماذج التي تنتج أجمل الصور، بل بالنماذج التي تنتج صوراً جيدة بما يكفي بسرعة وبتكلفة منخفضة بما يكفي للنشر على نطاق واسع.
مع دفع Qwen-Image-2.0 من الجناح مفتوح الوزن و Nano Banana Pro يحافظ على سقف الجودة، يحتل Google Nano Banana 2 بالضبط المنطقة الوسطى حيث تتركز معظم أعباء العمل المؤسسية. بالنسبة لصناع القرار في تكنولوجيا المعلومات الذين كانوا ينتظرون انحناء منحنى التكلفة، فقد حدث ذلك للتو.
الأسئلة الشائعة
Google Nano Banana 2، المعروف رسمياً باسم Gemini 3.1 Flash Image، هو نموذج جديد لتوليد صور الذكاء الاصطناعي مصمم لخفض تكاليف الإنتاج بشكل كبير للمؤسسات، مما يجعله أكثر سهولة في الاستخدام على نطاق واسع.
يخفض Nano Banana 2 تكلفة توليد الصور بنسبة 50% تقريباً مقارنة بنموذج Nano Banana Pro، حيث يبلغ سعر الصورة الواحدة بدقة 1K بكسل حوالي 0.067 دولار بدلاً من 0.134 دولار.
يقدم Nano Banana 2 تحسينات في عرض النصوص وترجمتها، واتساق الموضوع عبر شخصيات وكائنات متعددة، ويدعم دقات تصل إلى 4K، بالإضافة إلى أدوات التحقق من المصدر مثل SynthID و C2PA.
جاء إطلاق Nano Banana 2 بعد 16 يوماً فقط من إطلاق Alibaba لنموذج Qwen-Image-2.0 المنافس، مما يشير إلى استجابة جوجل للمنافسة المتزايدة في سوق توليد صور الذكاء الاصطناعي للمؤسسات.
تعد أدوات التحقق من المصدر مثل SynthID و C2PA مهمة جداً للشركات في الصناعات الخاضعة للتنظيم أو التي لديها متطلبات شفافية للذكاء الاصطناعي، حيث توفر ضماناً لأصالة المحتوى وتساعد في الامتثال.
التعليقات 0
سجل دخولك لإضافة تعليق
لا توجد تعليقات بعد. كن أول من يعلق!