گوگل از مدل جدید هوش مصنوعی تصویرساز خود با نام نانو بنانا ۲ (Nano Banana 2) رونمایی کرد. ابزاری قدرتمند با ویژگی های متنوع که بهصورت رایگان در اختیار عموم کاربران قرار گرفته است.
این مدل که با نام فنی Gemini 3.1 Flash Image نیز شناخته میشود، ترکیبی از قابلیتهای پیشرفته و حرفهای نسخه قبلی (نانو بنانا پرو) با سرعت پردازش فوقالعاده مدلهای فلش را ارائه داده و به کاربران اجازه میدهد بدون پرداخت هزینه، به امکانات سطح بالا دسترسی داشته باشند.
به گزارش گوگل دیپمایند، نانو بنانا ۲ امکان تولید تصاویر با متن دقیق و خوانا در زبانهای مختلف، استفاده از اطلاعات لحظهای وب برای ساخت اینفوگرافیکها و نمودارهای واقعی و مهمتر از همه حفظ ثبات بصری تا پنج شخصیت و ۱۴ شیء مختلف در چندین تصویر متوالی را فراهم میکند. این ویژگی برای پروژههایی مانند استوریبورد، کمیک، تبلیغات یا انیمیشنهای کوتاه بسیار ارزشمند است.
مدیر محصول گوگل دیپمایند، در توضیح این مدل گفت: «نانو بنانا ۲ با اتصال به پایگاه دانش جمینای و جستجوی واقعی در وب، قادر است سوژههای خاص، مکانهای واقعی و دادههای پیچیده را با دقت بسیار بالا بازسازی کند.»
کاربران اکنون کنترل کامل بر نسبت تصویر، رزولوشن خروجی (از ۵۱۲ پیکسل تا کیفیت 4K) و جزئیات بصری دارند. این مدل همچنین در نورپردازی طبیعیتر، بافتهای غنی و جزئیات واضحتر نسبت به نسلهای پیشین پیشرفت چشمگیری نشان داده است و دستورات متنی پیچیده را با دقت بیشتری اجرا میکند.
نانو بنانا ۲ اکنون بهعنوان مدل پیشفرض تولید تصویر در اپلیکیشن جمینای جایگزین نسخه پرو شده و در بخشهای مختلف محصولات گوگل شامل هوش مصنوعی موتور جستجو، گوگل لنز، ابزار ساخت ویدیو Flow و پلتفرم تبلیغات گوگل نیز در دسترس قرار گرفته است.