در ماههای اخیر، مدلهای تولید تصویر مبتنی بر Gemini توجه زیادی را به خود جلب کردهاند و نام Nano Banana به یکی از داغترین موضوعات دنیای هوش مصنوعی تبدیل شده است. دلیل این موضوع فقط کیفیت بالای تصاویر نیست؛ بلکه توانایی این مدلها در درک عمیق درخواست کاربر، استدلال قبل از تولید تصویر و اجرای دقیق جزئیات است.
برخلاف بسیاری از مدلهای تولید تصویر که صرفاً بر اساس کلمات کلیدی عمل میکنند، Nano Banana پیش از ساخت تصویر تلاش میکند هدف واقعی شما را درک کند. همین موضوع باعث میشود خروجی نهایی به آنچه در ذهن دارید بسیار نزدیکتر باشد.
در این راهنما، بر اساس مستندات رسمی گوگل، با قابلیتهای Nano Banana، مشخصات فنی، اصول پرامپتنویسی حرفهای و روشهای استفاده از آن در پروژههای مختلف آشنا میشویم.

Nano Banana چیست؟
Nano Banana نامی است که کاربران برای مدلهای تولید تصویر جدید گوگل انتخاب کردهاند. این مدلها بر پایه خانواده Gemini ساخته شدهاند و علاوه بر تولید تصویر، قابلیت ویرایش تصاویر، درک تصاویر مرجع، ترکیب چند تصویر، تولید متن داخل تصویر، ترجمه چندزبانه و استفاده از اطلاعات زنده اینترنت را نیز دارند.
جدیدترین نسل این خانواده یعنی Nano Banana 2 سه ویژگی مهم دارد:
۱. تولید تصاویر دقیقتر
Nano Banana 2 میتواند از اطلاعات و تصاویر بهروز موجود در وب استفاده کند. این قابلیت باعث میشود تصاویر تولیدشده برای موضوعات واقعی، رویدادهای روز، مقاصد گردشگری، آموزش و بازاریابی دقت بیشتری داشته باشند.
۲. دسترسی به قابلیتهای حرفهای
ویژگیهایی که قبلاً تنها در ابزارهای پیشرفته در دسترس بودند اکنون به صورت مستقیم در مدل وجود دارند:
- رندر دقیق متن
- ترجمه چندزبانه
- افزایش کیفیت تصویر
- خروجیهای 2K و 4K
- طراحی استوریبورد
- ساخت موکاپ محصولات
- تولید تصاویر تبلیغاتی
۳. کنترل دقیق روی خروجی
کاربران میتوانند تصاویر را در نسبتهای مختلف تولید کنند:
- 16:9
- 9:16
- 21:9
- 2:1
- 1:1
و بسیاری فرمتهای دیگر.
مشخصات فنی Nano Banana
قبل از یادگیری پرامپتنویسی، بهتر است با تواناییهای فنی مدل آشنا شویم.
پنجره متنی (Context Window)
Nano Banana 2:
- حداکثر 131,072 توکن ورودی
Nano Banana Pro:
- حداکثر 65,536 توکن ورودی
هر دو مدل:
- حداکثر 32,768 توکن خروجی
رزولوشن تصاویر
مدلها از تولید تصاویر در کیفیتهای زیر پشتیبانی میکنند:
- 512px
- 1K
- 2K
- 4K
نسبت تصویر
پشتیبانی از:
- 1:1
- 3:2
- 2:3
- 3:4
- 4:3
- 4:5
- 5:4
- 9:16
- 16:9
- 21:9
و در برخی نسخهها:
- 1:4
- 4:1
- 1:8
- 8:1
تصاویر مرجع
در یک درخواست میتوان تا 14 تصویر مرجع مختلف را به مدل ارائه کرد.
فرمتهای پشتیبانیشده:
- PNG
- JPEG
- WEBP
- HEIC
- HEIF
فایلهای متنی و PDF
Nano Banana میتواند فایلهای متنی و PDF را نیز به عنوان ورودی دریافت کند.
حداکثر حجم:
- 50 مگابایت از طریق API
- 7 مگابایت از طریق کنسول گوگل
دانش مدل
دانش پایه مدل تا ژانویه 2025 بهروزرسانی شده است (Nano-banana 2).
اطلاعات زنده اینترنت
مدل میتواند برای برخی درخواستها از اطلاعات و تصاویر بهروز موجود در وب استفاده کند.
امنیت و اعتبار محتوا
تمام تصاویر تولیدشده دارای:
- نشان C2PA
- واترمارک SynthID
هستند تا مشخص شود تصویر توسط هوش مصنوعی تولید شده است.
اصول طلایی پرامپتنویسی در Nano Banana
بخش بزرگی از کیفیت خروجی به نحوه نوشتن پرامپت بستگی دارد.
گوگل چهار اصل مهم را پیشنهاد میکند.
۱. دقیق باشید
به جای نوشتن:
“یک ماشین”
بنویسید:
“یک خودروی اسپرت قرمز رنگ در خیابان بارانی توکیو هنگام غروب”
هرچه جزئیات بیشتر باشد خروجی دقیقتر خواهد بود.
۲. مثبت بنویسید
به جای:
“بدون ماشین”
بنویسید:
“خیابانی خلوت و خالی”
مدلها معمولاً با توصیف آنچه میخواهید بهتر از توصیف آنچه نمیخواهید عمل میکنند.
۳. دوربین را کنترل کنید
اصطلاحات سینمایی و عکاسی استفاده کنید:
- Low Angle
- Aerial View
- Close Up
- Macro Shot
- Wide Shot
این واژهها تأثیر زیادی بر نتیجه نهایی دارند.
۴. گفتوگومحور کار کنید
لزومی ندارد از ابتدا به خروجی کامل برسید.
پس از تولید تصویر میتوانید بنویسید:
- نور را گرمتر کن
- لباس را مشکی کن
- زاویه دوربین را تغییر بده
و به تدریج نتیجه را بهبود دهید.
مهمترین اصل: پرامپت را با یک فعل قدرتمند شروع کنید
مثلاً:
- Create
- Generate
- Design
- Transform
- Replace
- Edit
این کار به مدل کمک میکند هدف اصلی شما را سریعتر تشخیص دهد.
پنج چارچوب حرفهای برای پرامپتنویسی
۱. تولید تصویر از متن
اگر هیچ تصویر مرجعی ندارید، از ساختار زیر استفاده کنید:
فرمول
موضوع + عمل + محیط + ترکیببندی + سبک
مثال
موضوع:
یک مدل مد با لباس قهوهای رسمی
عمل:
در حال ژست گرفتن با اعتمادبهنفس
محیط:
استودیوی قرمز تیره
ترکیببندی:
نمای نیمتنه رو به جلو
سبک:
عکاسی مجله مد روی فیلم آنالوگ با نورپردازی سینمایی


با پلتفرم هوش مصنوعی ویرا میتوانید به بهترین مدلهای نانوبنانا (نانوبنانا 2 و نانوبنانا پرو) دسترسی داشته باشید.
تولید تصویر با استفاده از تصاویر مرجع
وقتی چند تصویر مرجع دارید از ساختار زیر استفاده کنید.
فرمول
تصاویر مرجع + رابطه موردنظر + سناریوی جدید
مثال
از دو تصویر نمونه استفاده کن و تصویر صندلی را با طرح پارچه مورد نظر بساز.
این روش برای طراحی محصول، حفظ هویت برند و ثابت نگه داشتن شخصیتها بسیار مفید است.


۲. ویرایش تصویر
ویرایش تصویر با تولید تصویر متفاوت است.
در اینجا باید مشخص کنید:
- چه چیزی تغییر کند
- چه چیزی ثابت بماند
ویرایش مکالمهای
مثال:
“مرد داخل تصویر را حذف کن.”
مدل فقط همان بخش را تغییر میدهد و سایر قسمتها را حفظ میکند.

ترکیب تصاویر
میتوانید:
- تصویر اصلی
- تصویر یک شیء
را همزمان وارد کنید و از مدل بخواهید آن دو را ترکیب کند.
مثال:
قرار دادن یک محصول روی میز.


انتقال سبک (Style Transfer)
مثال:
“این عکس خیابان را به سبک نقاشی ون گوگ بازسازی کن.”
در این حالت محتوای تصویر حفظ میشود اما سبک هنری تغییر میکند.


۳. استفاده از اطلاعات زنده وب
یکی از جذابترین قابلیتهای Nano Banana امکان استفاده از اطلاعات روز است.
ساختار پرامپت
درخواست جستجو + تحلیل اطلاعات + تبدیل به تصویر
مثال
وضعیت فعلی آبوهوا و تاریخ مشهد را جستجو کن، سپس یک مشهد مینیاتوری داخل یک فنجان طراحی کن که شرایط آبوهوایی واقعی امروز در آن دیده شود.

۴. تولید متن در تصویر و بومیسازی
یکی از نقاط قوت Nano Banana تولید متن خوانا در تصویر است.
این قابلیت برای:
- پوستر
- بنر
- موکاپ محصول
- اینفوگرافیک
- تبلیغات
بسیار ارزشمند است.
قوانین مهم
متن را داخل گیومه بنویسید
مثال:
“SUMMER SALE”
یا
“تخفیف ویژه”
فونت را مشخص کنید
مثال:
- Bold Sans Serif
- Century Gothic
- Brush Script
زبان مقصد را تعیین کنید
مثال:
متن تبلیغاتی را به زبان عربی تولید کن.
یا
متن را به زبان کرهای ترجمه کن.
ترفند حرفهای
ابتدا از مدل بخواهید متن تبلیغاتی را تولید کند.
سپس در مرحله بعد همان متن را داخل تصویر قرار دهد.
این روش معمولاً نتایج بهتری ایجاد میکند.
۵. پرامپتنویسی در سطح یک Creative Director
اگر میخواهید خروجی حرفهای تولید کنید، باید مانند یک کارگردان هنری فکر کنید.
نورپردازی را طراحی کنید
نور استودیویی
سه منبع نور Softbox
نور دراماتیک
Chiaroscuro Lighting
یا
Golden Hour Backlighting
دوربین و لنز را مشخص کنید
نوع دوربین روی حس تصویر تأثیر مستقیم دارد.
مثال:
- GoPro
- Fujifilm
- Disposable Camera
لنز را تعیین کنید
Wide Angle
برای نمایش فضاهای بزرگ
Macro Lens
برای نمایش جزئیات
Shallow Depth of Field
برای ایجاد پسزمینه محو
رنگ و فیلم را تعریف کنید
مثال:
“مانند فیلم رنگی دهه ۱۹۸۰ با نویز ملایم”
یا
“رنگبندی سینمایی با تونهای سبز و آبی تیره”
جنس متریال را توصیف کنید
به جای:
“کت”
بنویسید:
“کت تویید سرمهای”
به جای:
“زره”
بنویسید:
“زره الفی حکاکیشده با نقشهای نقرهای”
هرچه جنس، بافت و متریال دقیقتر باشد خروجی واقعیتر خواهد بود.
ترکیب Nano Banana با سایر مدلهای گوگل
Nano Banana + Gemini
از Gemini برای ایدهپردازی و نوشتن پرامپتهای بهتر استفاده کنید.
Nano Banana + Veo
ابتدا فریمهای کلیدی را با Nano Banana بسازید.
سپس Veo را برای تبدیل آنها به ویدئو به کار بگیرید.
Nano Banana + Veo + Lyria
در این سناریو:
- Nano Banana تصاویر را میسازد.
- Veo ویدئو را تولید میکند.
- Lyria موسیقی اختصاصی پروژه را خلق میکند.
نتیجه یک فرآیند کامل تولید محتوای چندرسانهای مبتنی بر هوش مصنوعی خواهد بود.
جمعبندی
Nano Banana فقط یک ابزار تولید تصویر نیست؛ بلکه یک مدل چندوجهی مبتنی بر Gemini است که میتواند تصاویر را تولید، ویرایش، ترکیب و شخصیسازی کند. پشتیبانی از تصاویر مرجع، تولید متن چندزبانه، استفاده از اطلاعات زنده اینترنت، کنترل دقیق نسبت تصویر و رزولوشنهای حرفهای باعث شده این مدل به یکی از قدرتمندترین ابزارهای تولید محتوای بصری تبدیل شود.
مهمترین نکته برای موفقیت در استفاده از Nano Banana این است که مانند یک کارگردان فکر کنید، نه صرفاً یک کاربر. هرچه موضوع، نورپردازی، دوربین، ترکیببندی، رنگ و بافت را دقیقتر تعریف کنید، خروجی نهایی به تصویر ذهنی شما نزدیکتر خواهد بود.