راهنمای جامع پرامپت‌نویسی برای Nano Banana؛ هر آنچه باید بدانید

آخرین تاریخ ویرایش : ۰۱ تیر ۱۴۰۵
8 دقیقه
0 نظر
راهنمای جامع پرامپت‌نویسی نانوبنانا

در ماه‌های اخیر، مدل‌های تولید تصویر مبتنی بر Gemini توجه زیادی را به خود جلب کرده‌اند و نام Nano Banana به یکی از داغ‌ترین موضوعات دنیای هوش مصنوعی تبدیل شده است. دلیل این موضوع فقط کیفیت بالای تصاویر نیست؛ بلکه توانایی این مدل‌ها در درک عمیق درخواست کاربر، استدلال قبل از تولید تصویر و اجرای دقیق جزئیات است.

برخلاف بسیاری از مدل‌های تولید تصویر که صرفاً بر اساس کلمات کلیدی عمل می‌کنند، Nano Banana پیش از ساخت تصویر تلاش می‌کند هدف واقعی شما را درک کند. همین موضوع باعث می‌شود خروجی نهایی به آنچه در ذهن دارید بسیار نزدیک‌تر باشد.

در این راهنما، بر اساس مستندات رسمی گوگل، با قابلیت‌های Nano Banana، مشخصات فنی، اصول پرامپت‌نویسی حرفه‌ای و روش‌های استفاده از آن در پروژه‌های مختلف آشنا می‌شویم.

تصویر شاخص راهنمای جامع پرامپت‌نویسی نانوبنانا در بلاگ گوگل
تصویر مقاله اصلی راهنمای نانوبنانا در بلاگ گوگل 🙂

Nano Banana چیست؟

Nano Banana نامی است که کاربران برای مدل‌های تولید تصویر جدید گوگل انتخاب کرده‌اند. این مدل‌ها بر پایه خانواده Gemini ساخته شده‌اند و علاوه بر تولید تصویر، قابلیت ویرایش تصاویر، درک تصاویر مرجع، ترکیب چند تصویر، تولید متن داخل تصویر، ترجمه چندزبانه و استفاده از اطلاعات زنده اینترنت را نیز دارند.

جدیدترین نسل این خانواده یعنی Nano Banana 2 سه ویژگی مهم دارد:

۱. تولید تصاویر دقیق‌تر

Nano Banana 2 می‌تواند از اطلاعات و تصاویر به‌روز موجود در وب استفاده کند. این قابلیت باعث می‌شود تصاویر تولیدشده برای موضوعات واقعی، رویدادهای روز، مقاصد گردشگری، آموزش و بازاریابی دقت بیشتری داشته باشند.

۲. دسترسی به قابلیت‌های حرفه‌ای

ویژگی‌هایی که قبلاً تنها در ابزارهای پیشرفته در دسترس بودند اکنون به صورت مستقیم در مدل وجود دارند:

  • رندر دقیق متن
  • ترجمه چندزبانه
  • افزایش کیفیت تصویر
  • خروجی‌های 2K و 4K
  • طراحی استوری‌بورد
  • ساخت موکاپ محصولات
  • تولید تصاویر تبلیغاتی

۳. کنترل دقیق روی خروجی

کاربران می‌توانند تصاویر را در نسبت‌های مختلف تولید کنند:

  • 16:9
  • 9:16
  • 21:9
  • 2:1
  • 1:1

و بسیاری فرمت‌های دیگر.


مشخصات فنی Nano Banana

قبل از یادگیری پرامپت‌نویسی، بهتر است با توانایی‌های فنی مدل آشنا شویم.

پنجره متنی (Context Window)

Nano Banana 2:

  • حداکثر 131,072 توکن ورودی

Nano Banana Pro:

  • حداکثر 65,536 توکن ورودی

هر دو مدل:

  • حداکثر 32,768 توکن خروجی

رزولوشن تصاویر

مدل‌ها از تولید تصاویر در کیفیت‌های زیر پشتیبانی می‌کنند:

  • 512px
  • 1K
  • 2K
  • 4K

نسبت تصویر

پشتیبانی از:

  • 1:1
  • 3:2
  • 2:3
  • 3:4
  • 4:3
  • 4:5
  • 5:4
  • 9:16
  • 16:9
  • 21:9

و در برخی نسخه‌ها:

  • 1:4
  • 4:1
  • 1:8
  • 8:1

تصاویر مرجع

در یک درخواست می‌توان تا 14 تصویر مرجع مختلف را به مدل ارائه کرد.

فرمت‌های پشتیبانی‌شده:

  • PNG
  • JPEG
  • WEBP
  • HEIC
  • HEIF

فایل‌های متنی و PDF

Nano Banana می‌تواند فایل‌های متنی و PDF را نیز به عنوان ورودی دریافت کند.

حداکثر حجم:

  • 50 مگابایت از طریق API
  • 7 مگابایت از طریق کنسول گوگل

دانش مدل

دانش پایه مدل تا ژانویه 2025 به‌روزرسانی شده است (Nano-banana 2).


اطلاعات زنده اینترنت

مدل می‌تواند برای برخی درخواست‌ها از اطلاعات و تصاویر به‌روز موجود در وب استفاده کند.


امنیت و اعتبار محتوا

تمام تصاویر تولیدشده دارای:

  • نشان C2PA
  • واترمارک SynthID

هستند تا مشخص شود تصویر توسط هوش مصنوعی تولید شده است.


اصول طلایی پرامپت‌نویسی در Nano Banana

بخش بزرگی از کیفیت خروجی به نحوه نوشتن پرامپت بستگی دارد.

گوگل چهار اصل مهم را پیشنهاد می‌کند.

۱. دقیق باشید

به جای نوشتن:

“یک ماشین”

بنویسید:

“یک خودروی اسپرت قرمز رنگ در خیابان بارانی توکیو هنگام غروب”

هرچه جزئیات بیشتر باشد خروجی دقیق‌تر خواهد بود.


۲. مثبت بنویسید

به جای:

“بدون ماشین”

بنویسید:

“خیابانی خلوت و خالی”

مدل‌ها معمولاً با توصیف آنچه می‌خواهید بهتر از توصیف آنچه نمی‌خواهید عمل می‌کنند.


۳. دوربین را کنترل کنید

اصطلاحات سینمایی و عکاسی استفاده کنید:

  • Low Angle
  • Aerial View
  • Close Up
  • Macro Shot
  • Wide Shot

این واژه‌ها تأثیر زیادی بر نتیجه نهایی دارند.


۴. گفت‌وگومحور کار کنید

لزومی ندارد از ابتدا به خروجی کامل برسید.

پس از تولید تصویر می‌توانید بنویسید:

  • نور را گرم‌تر کن
  • لباس را مشکی کن
  • زاویه دوربین را تغییر بده

و به تدریج نتیجه را بهبود دهید.


مهم‌ترین اصل: پرامپت را با یک فعل قدرتمند شروع کنید

مثلاً:

  • Create
  • Generate
  • Design
  • Transform
  • Replace
  • Edit

این کار به مدل کمک می‌کند هدف اصلی شما را سریع‌تر تشخیص دهد.


پنج چارچوب حرفه‌ای برای پرامپت‌نویسی

۱. تولید تصویر از متن

اگر هیچ تصویر مرجعی ندارید، از ساختار زیر استفاده کنید:

فرمول

موضوع + عمل + محیط + ترکیب‌بندی + سبک

مثال

موضوع:
یک مدل مد با لباس قهوه‌ای رسمی

عمل:
در حال ژست گرفتن با اعتمادبه‌نفس

محیط:
استودیوی قرمز تیره

ترکیب‌بندی:
نمای نیم‌تنه رو به جلو

سبک:
عکاسی مجله مد روی فیلم آنالوگ با نورپردازی سینمایی

پرامپت‌نویسی نانوبنانا در پلتفرم هوش مصنوعی ویرا
ساخت تصویر منتسب به پرامپت فوق در پلتفرم هوش مصنوعی ویرا و با مدل Nano-banana 2
تصویر خروجی پرامپت مدلینگ نانوبنانا
خروجی نهایی پرامپت مورد نظر

با پلتفرم هوش مصنوعی ویرا می‌توانید به بهترین مدل‌های نانوبنانا (نانوبنانا 2 و نانوبنانا پرو) دسترسی داشته باشید.


تولید تصویر با استفاده از تصاویر مرجع

وقتی چند تصویر مرجع دارید از ساختار زیر استفاده کنید.

فرمول

تصاویر مرجع + رابطه موردنظر + سناریوی جدید

مثال

از دو تصویر نمونه استفاده کن و تصویر صندلی را با طرح پارچه مورد نظر بساز.

این روش برای طراحی محصول، حفظ هویت برند و ثابت نگه داشتن شخصیت‌ها بسیار مفید است.

تصویر نمونه صندلی و پارچه برای ترکیب در نانوبنانا در پلتفرم هوش مصنوعی ویرا
نیازی نیست حتما دو تصویر را با هم بارگذاری کنید، می‌توانید تصویر اول را داده و از مدل بخواهید کاری نکند تا تصویر بعدی را بارگذاری کرده و درخواست خود را بیان کنید.
تصویر خروجی نانوبنانا برای پرامپت ترکیب پارچه و صندلی
تصویر نهایی بر اساس پرامپت و تصاویر نمونه مورد نظر

۲. ویرایش تصویر

ویرایش تصویر با تولید تصویر متفاوت است.

در اینجا باید مشخص کنید:

  • چه چیزی تغییر کند
  • چه چیزی ثابت بماند

ویرایش مکالمه‌ای

مثال:

“مرد داخل تصویر را حذف کن.”

مدل فقط همان بخش را تغییر می‌دهد و سایر قسمت‌ها را حفظ می‌کند.

دو تصویر یکی با حضور آقای طلیسچی و دیگری بدون ایشان - حذف شده با نانوبنانا در ویرا
بنده خدا آقای طلیسچی

ترکیب تصاویر

می‌توانید:

  • تصویر اصلی
  • تصویر یک شیء

را همزمان وارد کنید و از مدل بخواهید آن دو را ترکیب کند.

مثال:

قرار دادن یک محصول روی میز.

تصویر محصول و میز برای ترکیب توسط نانوبنانا در ویرا
تصویر خروجی نانوبنانا برای پرامپت ترکیب محصول و میز

انتقال سبک (Style Transfer)

مثال:

“این عکس خیابان را به سبک نقاشی ون گوگ بازسازی کن.”

در این حالت محتوای تصویر حفظ می‌شود اما سبک هنری تغییر می‌کند.

تصویری از بلوار وکیل آباد مشهد
تصویر خروجی نانوبنانا در ویرا -  بلوار وکیل آباد مشهد به سبک نقاشی ون‌گوگ

۳. استفاده از اطلاعات زنده وب

یکی از جذاب‌ترین قابلیت‌های Nano Banana امکان استفاده از اطلاعات روز است.

ساختار پرامپت

درخواست جستجو + تحلیل اطلاعات + تبدیل به تصویر

مثال

وضعیت فعلی آب‌وهوا و تاریخ مشهد را جستجو کن، سپس یک مشهد مینیاتوری داخل یک فنجان طراحی کن که شرایط آب‌وهوایی واقعی امروز در آن دیده شود.

تصویر فانتزی شهر مشهد مینیاتوری در فنجان تولیدشده با نانوبنانا در ویرا

۴. تولید متن در تصویر و بومی‌سازی

یکی از نقاط قوت Nano Banana تولید متن خوانا در تصویر است.

این قابلیت برای:

  • پوستر
  • بنر
  • موکاپ محصول
  • اینفوگرافیک
  • تبلیغات

بسیار ارزشمند است.


قوانین مهم

متن را داخل گیومه بنویسید

مثال:

“SUMMER SALE”

یا

“تخفیف ویژه”


فونت را مشخص کنید

مثال:

  • Bold Sans Serif
  • Century Gothic
  • Brush Script

زبان مقصد را تعیین کنید

مثال:

متن تبلیغاتی را به زبان عربی تولید کن.

یا

متن را به زبان کره‌ای ترجمه کن.


ترفند حرفه‌ای

ابتدا از مدل بخواهید متن تبلیغاتی را تولید کند.

سپس در مرحله بعد همان متن را داخل تصویر قرار دهد.

این روش معمولاً نتایج بهتری ایجاد می‌کند.


۵. پرامپت‌نویسی در سطح یک Creative Director

اگر می‌خواهید خروجی حرفه‌ای تولید کنید، باید مانند یک کارگردان هنری فکر کنید.


نورپردازی را طراحی کنید

نور استودیویی

سه منبع نور Softbox

نور دراماتیک

Chiaroscuro Lighting

یا

Golden Hour Backlighting


دوربین و لنز را مشخص کنید

نوع دوربین روی حس تصویر تأثیر مستقیم دارد.

مثال:

  • GoPro
  • Fujifilm
  • Disposable Camera

لنز را تعیین کنید

Wide Angle

برای نمایش فضاهای بزرگ

Macro Lens

برای نمایش جزئیات

Shallow Depth of Field

برای ایجاد پس‌زمینه محو


رنگ و فیلم را تعریف کنید

مثال:

“مانند فیلم رنگی دهه ۱۹۸۰ با نویز ملایم”

یا

“رنگ‌بندی سینمایی با تون‌های سبز و آبی تیره”


جنس متریال را توصیف کنید

به جای:

“کت”

بنویسید:

“کت تویید سرمه‌ای”

به جای:

“زره”

بنویسید:

“زره الفی حکاکی‌شده با نقش‌های نقره‌ای”

هرچه جنس، بافت و متریال دقیق‌تر باشد خروجی واقعی‌تر خواهد بود.


ترکیب Nano Banana با سایر مدل‌های گوگل

Nano Banana + Gemini

از Gemini برای ایده‌پردازی و نوشتن پرامپت‌های بهتر استفاده کنید.


Nano Banana + Veo

ابتدا فریم‌های کلیدی را با Nano Banana بسازید.

سپس Veo را برای تبدیل آن‌ها به ویدئو به کار بگیرید.


Nano Banana + Veo + Lyria

در این سناریو:

  • Nano Banana تصاویر را می‌سازد.
  • Veo ویدئو را تولید می‌کند.
  • Lyria موسیقی اختصاصی پروژه را خلق می‌کند.

نتیجه یک فرآیند کامل تولید محتوای چندرسانه‌ای مبتنی بر هوش مصنوعی خواهد بود.


جمع‌بندی

Nano Banana فقط یک ابزار تولید تصویر نیست؛ بلکه یک مدل چندوجهی مبتنی بر Gemini است که می‌تواند تصاویر را تولید، ویرایش، ترکیب و شخصی‌سازی کند. پشتیبانی از تصاویر مرجع، تولید متن چندزبانه، استفاده از اطلاعات زنده اینترنت، کنترل دقیق نسبت تصویر و رزولوشن‌های حرفه‌ای باعث شده این مدل به یکی از قدرتمندترین ابزارهای تولید محتوای بصری تبدیل شود.

مهم‌ترین نکته برای موفقیت در استفاده از Nano Banana این است که مانند یک کارگردان فکر کنید، نه صرفاً یک کاربر. هرچه موضوع، نورپردازی، دوربین، ترکیب‌بندی، رنگ و بافت را دقیق‌تر تعریف کنید، خروجی نهایی به تصویر ذهنی شما نزدیک‌تر خواهد بود.

رضا حاتمی
رضا حاتمی متخصص هوش مصنوعی
رضا حاتمی هستم؛ علاقه‌مند و شیفتهٔ هوش مصنوعی، کسی که از مطالعه و پژوهش در این زمینه خسته نمی‌شود.
اشتراک گذاری
ثبت نظر
بنر نصب تمام صفحات