مدل جدید هوش مصنوعی تصویر گوگل پس از انتشار مجموعه‌ تیزرهایی با تم میوه‌ای، و همچنین ارزیابی‌های اولیه کاربران که قابلیت‌های آن را حیرت‌انگیز (به زبان انگلیسی عامیانه: Bananas) توصیف کردند، لقب Nano Banana را گرفت. از زمان معرفی، این نام مستعار همچنان روی این مدل باقی مانده است.

نام رسمی این مدل جمنای ۲.۵ Flash Image است؛ گرچه به‌اندازه Nano Banana جذاب نیست، اما توجه به آن حائز اهمیت است. این مدل طی چند هفته گذشته، به‌خصوص در مقایسه با سایر ابزارهای هوش مصنوعی تصویر، به‌سرعت مورد توجه قرار گرفته است. گوگل گزارش داده است که کاربرانش بیش از ۵ میلیارد تصویر هوش مصنوعی تولید کرده‌اند و این مدل در چند هفته اول پس از عرضه Nano Banana، باعث جذب بیش از ۱۰ میلیون کاربر جدید برای جمنای شده است. همچنین، این مدل به قرار گرفتن جمنای در صدر جدول برنامه‌های رایگان در فروشگاه App Store اپل برای مدتی کمک کرد.

با وجود سرمایه‌گذاری گوگل برای ادغام هوش مصنوعی در همه‌جا، به‌نظر می‌رسد ویرایش تصویر توسط Nano Banana یکی از بزرگ‌ترین جهش‌ها را برای گوگل در رقابت برای توسعه بهترین هوش مصنوعی رقم زده است.

کارشناس تولید تصویر هوش مصنوعی، Nano Banana را آزمایش کرده تا ببیند آیا این مدل مطابق انتظار عمل می‌کند یا صرفاً نوعی هیجان‌آفرینی (Hype) است. او متوجه شد که Nano Banana گوگل، با تمرکز تازه‌اش بر ویرایش عکس‌های موجود، بسیار تأثیرگذار است. هرچند که هنوز اشکالات جزئی دارد که از هر سرویس هوش مصنوعی انتظار می‌رود اما در اضافه کردن عناصر جدید به عکس‌های موجود به شکل عجیبی خوب عمل کرد. اگر فردی از علاقه‌مندان به هوش مصنوعی باشد، یا حتی صرفاً کسی که به یک ویرایش سریع و سفارشی نیاز دارد، این ابزار ارزش امتحان کردن را دارد. در این راهنما تجربه واقعی این کارشناس در کار کردن با ویژگی تازه جمنای، به همراه نکاتی برای کسب بهترین نتایج، ارائه شده است.

نحوه دسترسی به Nano Banana گوگل

کاربران می‌توانند از چند طریق به Nano Banana دسترسی داشته باشند:

دسترسی مستقیم از گوگل: اگر کسی بخواهد مستقیماً از طریق گوگل اقدام کند، باید برنامه اشتراک AI Pro گوگل را داشته باشد که یک اشتراک اختصاصی هوش مصنوعی با هزینه ۲۰ دلار در ماه است. پس از ثبت‌نام، می‌توان به AI Studio گوگل رفت و ۲.۵ Flash Image را به‌عنوان مدل مورد نظر برای استفاده انتخاب کرد. ویرایش عکس‌ها از طریق چت‌های جمنای امکان‌پذیر نیست، برخلاف تولید تصویر با هوش مصنوعی OpenAI در ChatGPT.

دسترسی توسعه‌دهندگان: توسعه‌دهندگان می‌توانند از طریق Vertex AI و جمنای API به این مدل دسترسی پیدا کنند. اگر کاربران با این اصطلاحات آشنا نیستند، احتمالاً به آن‌ها دسترسی ندارند؛ بنابراین نیازی به نگرانی نیست و می‌توانند به همان AI Studio که برای همه باز است، اکتفا کنند.

برنامه‌های ادوبی: کاربران همچنین می‌توانند از Nano Banana از طریق برخی برنامه‌های ادوبی استفاده کنند. Nano Banana به‌عنوان یک مدل شخص ثالث در فتوشاپ، Adobe Express و پلتفرم هوش مصنوعی آن‌ها یعنی Firefly در دسترس است. این برنامه‌ها نیز معمولاً غیررایگان هستند، اما اگر فرد از قبل از برخی برنامه‌های ادوبی استفاده کند، ارزش بررسی دارد که آیا به این قابلیت دسترسی دارد یا خیر. قبل از کلیک کردن بر روی دکمه تولید (Generate)، باید مطمئن شد که ۲.۵ Flash Image را انتخاب کرده است، زیرا ادوبی مدل‌های شخص ثالث زیادی را ارائه می‌دهد.

نکته مهم در مورد حریم خصوصی این است که سیاست عمومی حریم خصوصی جمنای گوگل می‌گوید می‌تواند از اطلاعات بارگذاری شده برای بهبود محصولات هوش مصنوعی خود استفاده کند، به همین دلیل شرکت توصیه می‌کند از بارگذاری اطلاعات حساس یا خصوصی خودداری شود. همچنین، عکس‌های ویرایش‌شده توسط Nano Banana فاقد واترمارک هستند، بنابراین هنگام اشتراک‌گذاری این تصاویر حتماً باید اعلام کرد که از هوش مصنوعی استفاده شده است. برای از دست ندادن هیچ‌کدام از محتوای فنی بی‌طرفانه و بررسی‌های آزمایشگاهی، CNET باید به‌عنوان منبع ترجیحی در گوگل اضافه شود.

نحوه استفاده از Nano Banana گوگل و کسب بهترین نتایج

هنگامی که فرد وارد AI Studio گوگل شد، می‌تواند به‌راحتی تصویر خود را برای ویرایش بارگذاری کند. اما مانند هر ابزار تصویر هوش مصنوعی، شانس موفقیت به این بستگی دارد که دستور (Prompt) چقدر خوب نوشته شود. در اینجا چند نکته برای استفاده از Nano Banana آورده شده است:

جزئی و مشخص بودن: نوشتن دستور برای هوش مصنوعی متفاوت از جستجو در گوگل است. هرچه جزئیات بیشتری ارائه شود، احتمال بیشتری وجود دارد که فرد به نتیجه دلخواه برسد. باید در مورد رنگ‌ها، سبک و زیبایی‌شناسی صحبت کرد. کلمات کلیدی عالی هستند، اما نباید نگران زیاد نوشتن بود.

مشخص کردن مواردی که نباید تغییر کنند: این نکته با توصیه‌هایی که برای تولیدکنندگان تصویر هوش مصنوعی ارائه می‌شود، متفاوت است. اکثر هوش‌های مصنوعی در درک دستورات منفی (یا چیزهایی که نباید دیده شوند) مشکل دارند. اما Nano Banana به‌خوبی در درک آنچه باید یا نباید تنظیم شود، عمل می‌کند؛ بنابراین باید آن را در دستورات گنجاند.

دقت هنگام درخواست متن: برای درخواست متن، باید بسیار دقیق بود. این نکته (که تا حدی از بهترین شیوه‌های دستورنویسی گوگل الهام گرفته شده و در آزمایش‌ها نیز تأیید شده است) اهمیت دارد؛ زیرا در غیر این صورت، نتیجه نامرتب خواهد بود. همچنین، حتماً سبک و رنگ فونت مورد نظر خود را مشخص کنید.

نمونه‌ای از نحوه ویرایش عکس: تصویر سمت چپ، عکس اصلی را نشان می‌دهد. در تصویر سمت راست که توسط Nano Banana ویرایش شده، عنصری جدید، یعنی خواهر فرد اصلی اضافه شده است که به شکلی حیرت‌انگیز شبیه او به نظر می‌رسد. (منبع: Katelyn Chedraoui/CNET)

یکی از بهترین کارهایی که می‌توان با Nano Banana انجام داد، افزودن عناصر جدید به تصویری است که از قبل موجود است. اما موارد استفاده خوب دیگری نیز وجود دارد. در اینجا چند ایده برای الهام گرفتن، بر اساس برخی از دستورات مورد علاقه کارشناسان برای آزمایش سرویس‌های هوش مصنوعی، آورده شده است:

بازی با نسخه‌های مختلف: می‌توان از مدل خواست نسخه‌های متفاوتی از عکس موجود ایجاد کند، خواه یک عکس سر با مدل موهای مختلف باشد یا تغییرات دیگر؛ برای مثال، کارشناسان مناظر طبیعی عکاسی شده را به هوش مصنوعی داده‌اند تا آن‌ها را در سبک یک دنیای تاریک، علمی-تخیلی یا فانتزی بازآفرینی کند.

استفاده از Nano Banana به‌عنوان پاک‌کن هوش مصنوعی: حذف عوامل زیاد از حد در پس‌زمینه یکی از رایج‌ترین کاربردهای نرم‌افزارهای ویرایش عکس است. هر هوش مصنوعی موفقی باید بتواند به کاربر کمک کند موانع اضافی را حذف کرده و ناحیه آسیب‌دیده را به‌طور یکپارچه در عکس ترکیب کند.

وقتی در ایده‌پردازی دچار مشکل شدید، از جمنای الهام بگیرید: همیشه توصیه می‌شود پروژه‌های ویرایش عکس تا حد امکان با افراد واقعی در میان گذاشته شود. اما وقتی این امکان وجود ندارد، می‌توان از چت‌بات برای ایده‌ها استفاده کرد. جمنای می‌تواند به کاربر کمک کند تا ایده‌های خود را به واژه‌هایی تبدیل کند که Nano Banana قادر به درک آن‌ها باشد.

