خب همین ابتدای کار یک سؤال؟ میدجورنی درست است یا میدجِرنی؟ بگذارید آخر مقاله به این سؤال بپردازیم:)
میدجورنی هوش مصنوعی ساخت تصویر است که توسط یک گروه مستقل (بدون وابستگی به شرکت یا سازمان خاصی) اداره میشود. استفاده از میدجرنی اوایل تا حدی رایگان بود و الان کاملاً پولی است. در این مقاله میخواهم این ابزار دوستداشتنی را کمی بشکافم و اگر راه و روشی برای استفاده از آن وجود دارد آموزش دهم.
در حال حاضر ۳ مدل هوش مصنوعی معتبر در زمینه تولید تصویر وجود دارند؛ دالای (DALL·E)، میدجرنی (Midjourney) و استیبل دیفیوژن (Stable Diffusion). البته مدلها بسیارند و هر کسی تعریفی برای «اعتبار» دارد، اما بهطورکلی این مدلها حداقل در مقیاس بینالمللی تا حد خوبی سرشناس هستند.
فنّاوری پشت میدجرنی چیست؟
برای این که بدانیم میدجرنی چیست و حتی برای استفاده از میدجرنی، بهترین کار این است که با نحوه کارکردش آشنا شویم. فناوری Midjourney از شبکههای مولد تخاصمی (GANs) و مدلهای ترانسفورمری بهره میگیرد تا از روی متن ورودی، تصاویری خلاقانه تولید کند. فرایندش شامل ۷ مرحله میشود:
- دریافت متن: متن توصیفی تصویر توسط کاربر به ماشین داشته میشود؛ مثلاً «تصویر یک شهر مدرن».
- فهمیدن متن به کمک مدلهای زبانی: Midjourney از مدلهای ترانسفورمری مانند GPT-3 برای پردازش زبان طبیعی (NLP) استفاده میکند تا متن را بفهمد.
- تبدیل متن به بردار ویژگیها: سیستم متن ورودی را رمزگذاری کرده و به مجموعهای از ویژگیهای برداری (مانند سبک تصویر، اشیا، فضا و عناصر بصری) تبدیل میکند.
- تولید تصویر اولیه با شبکههای مولد تخاصمی (GANs): این شبکهها از دو بخش تشکیل شدهاند: بخش مولد (Generator) بر اساس بردارهای ورودی تصویر اولیه را تولید میکند؛ بخش تشخیصدهنده (Discriminator) کیفیت آن را میسنجد. این فرایند بارها تکرار میشود.
- اعمال فیلترهای هنری: سیستم، سبکهای هنری (مانند رئالیسم، انتزاعی و…) را به تصویر اضافه میکند. مدل هر بار تصاویر متنوعی تولید میکند تا خلاقیت را نیز حفظ کند.
- خروجی اولیه برای کاربر: میدجرنی چهار تصویر به کاربر نمایش میدهد تا او یکی را انتخاب کرده و با استفاده از گزینههایی تکمیلی مانند Upscale (افزایش کیفیت) یا Variation (تولید نسخههای متنوع) آن را اصلاح کند.
- تصویر نهایی: بر اساس اصلاحات تصویر نهایی تولید شده و قابلدانلود است.
توضیح «تبدیل متن به بردار»
بردار ویژگیها مجموعهای از اعداد و نشاندهنده اطلاعات مهم از یک داده خاص (در اینجا متن) است. وقتی متن به بردار ویژگی تبدیل میشود، مدل هوش مصنوعی میتواند از این اعداد بهعنوان ورودی برای تولید خروجیهای مختلف مانند تصویر استفاده کند.
مثال:
فرض کنید شما یک جمله وارد میکنید: «یک سگ در حال بازی در پارک».
مدل هوش مصنوعی ابتدا جمله را به بخشهای مختلفی تقسیم میکند (کلماتی مانند «سگ»، «بازی»، «پارک»). سپس هر یک از این کلمات به مقادیر عددی تبدیل میشوند (بهعنوانمثال، «سگ» به یک بردار عددی خاص مرتبط است که ویژگیهای مختلفی از سگ را توصیف میکند، مانند شکل، نوع حیوان و غیره). این اعداد در نهایت در یک بردار ویژگی (یک فهرست از اعداد) قرار میگیرند که مفهوم کلی جمله را بهصورت عددی به مدل منتقل میکند.
چرا این تبدیل مهم است؟
رایانهها نمیتوانند زبان طبیعی (مانند جملات انسانی) را به شکل اصلی آن درک کنند. برای این که هوش مصنوعی بتواند از متن استفاده کند، ابتدا باید آن را به دادههای عددی (بردارها) تبدیل کند. سپس این دادههای عددی به مدل هوش مصنوعی کمک میکند تا دستورالعملهای مربوط به تولید تصویر را اجرا کند.
آموزش استفاده از میدجورنی
حال که دانستید میدجرنی چیست، آموزش استفاده از میدجرنی را شروع کنیم که دقیقاً مثل بخش قبلی دارای ۷ قدم است. پیش از شرح آنها، این نکته را یادآور شوم که میدجورنی رایگان دیگر وجود ندارد! برای استفاده از این مدل هوش مصنوعی ناچار به خرید هستید. البته میتوانید از گزینههای جایگزین رایگان استفاده کنید که بعد از مراحل آموزش استفاده از میدجرنی معرفی میکنم.
۱. دسترسی به میدجرنی
میدجرنی روی پلتفرم دیسکورد (Discord) فعالیت میکند، بنابراین اولین قدم این است که یک حساب کاربری در Discord بسازید و وارد شوید. پس از ورود به دیسکورد، به سرور رسمی میدجرنی ملحق شوید. لینک عضویت در این سرور معمولاً در وبگاه رسمی Midjourney موجود است.
۲. انتخاب کانال مناسب
در سرور میدجرنی، کانالهای مختلفی وجود دارد که میتوانید برای تولید تصاویر از آنها استفاده کنید. کانالهایی با نامهای عمومی مانند #newbies برای تازهکارها در دسترس است.
۳. واردکردن دستور (پرامپت)
پس از انتخاب کانال، میتوانید با استفاده از دستور /imagine، یک پرامپت یا توضیحات متنی وارد کنید. بهعنوانمثال: /imagine a futuristic city skyline at sunset. این توضیحات، راهنمایی برای Midjourney خواهد بود تا تصویر موردنظر شما را بر اساس الگوریتمهای هوش مصنوعی تولید کند.
بهطورکلی پرامپتنویسی بخش اصلی فرایند استفاده از میدجرنی و به معنی نوشتن توصیفاتی است که به مدل کمک میکند تا تصویر موردنظر کاربر را تولید کند. این توصیفات میتوانند شامل جزئیات مختلفی از جمله موضوع، سبک هنری، رنگها، و احساس کلی تصویر باشند. برای دستیابی به نتایج مطلوب، استفاده از زبان دقیق و توصیفی اهمیت دارد.
بهعنوانمثال، بهجای نوشتن یک پرامپت کلی مانند «یک منظره زیبا»، میتوان از عباراتی مانند “یک غروب آفتاب در یک دشت سرسبز با درختان چنار و ابرهای نقرهای” استفاده کرد. علاوه بر این، کاربران میتوانند از عبارات خاصی برای تعیین سبک هنری (مانند «در سبک امپرسیونیسم») یا حس و حال (مانند «حس آرامش و سکوت») بهره ببرند. آزمایش با ساختارهای مختلف پرامپت و ترکیب کلمات مختلف به شما کمک میکند تا به تصویر ایدئال خود نزدیکتر شوند و نتایج خلاقانهتری از میدجرنی دریافت کنند.
۴. دریافت خروجی اولیه
پس از واردکردن دستور، چنددقیقهای طول میکشد تا هوش مصنوعی Midjourney چهار نسخه اولیه از تصویر موردنظر شما را ایجاد کند. این تصاویر اولیه بهصورت یک مجموعه از گزینهها نمایش داده میشود که شما میتوانید یکی از آنها را برای اصلاح یا بهبود انتخاب نمایید.
۵. انتخاب و اصلاح تصویر
با کلیک بر روی دکمههای U یا V میتوانید یکی از تصاویر را برای اصلاح و بهبود انتخاب کنید. U، مخفف Upscale و به معنی افزایش کیفیت است که تصویر انتخابی را با وضوح بالاتری تولید میکند؛ و V مخفف Variation و به معنی تنوعبخشیدن است که تغییرات جدیدی بر اساس تصویر انتخاب شده ایجاد میکند و گزینههای متنوعتری به شما ارائه میدهد.
۶. نهایی کردن تصویر
پس از انتخاب و اصلاح، میتوانید تصویر نهایی خود را دانلود کنید یا با گزینه Upscale to Max وضوح بیشتری برای استفادههای حرفهای به دست آورید.
۷. ذخیره و استفاده از تصویر
پس از دریافت تصویر نهایی، بهراحتی میتوانید آن را از Discord دانلود کرده و برای پروژههای شخصی یا حرفهای خود استفاده کنید.
جایگزین رایگان میدجرنی
متأسفانه مسئله تولید تصویر به پردازش سنگینی نیاز دارد و تقریباً تمام مدلهای سرشناس گزینه رایگان را برداشتهاند. بااینوجود یک مدل ایرانی تبدیل متن به عکس به اسم ایماژ وجود دارد که در اپلیکیشن هوش مصنوعی ویرا عرضه میشود و کاملاً رایگان است. ویرا اولین و بزرگترین پروژه هوش مصنوعی است که بهصورت اختصاصی برای فارسیزبانان طراحی و توسعه داده شده. داخل اپلیکیشن ویرا، کاشی ایماژ را انتخاب کنید و تصویر موردنظرتان را بهرایگان تولید نمایید.
همچنین میتوانید از ربات تلگرام میدجرنی هم استفاده کنید که البته زمانی خوب بود که خود میدجرنی رایگان بود. امروزه تعداد انگشت شماری ربات میدجرنی وجود دارند که یا باید اشتراک بخرید یا در دهها کانال عضو شوید تا شاید چند تصویر رایگان در اختیار شما بگذارند. بهطورکلی، باید بیخیال گرفتن تصویر رایگان از میدجرنی شد.
کاربردهای هوش مصنوعی Midjourney
همانطور که در نحوه عملکرد میدجرنی متوجه شدید، این مدل تمرکز خاصی روی خلاقیت و بخش هنری کار دارد؛ این است که اکثر کاربران برای تولید تصاویر فراواقعگرایانه، انتزاعی، هنری و… به استفاده از میدجرنی روی میآورند. این در حالی است که برخی مدلها مثل دالای در تولید تصاویر واقعگرایانه تواناترند. مقایسه میدجرنی و دالای و یا سایر مدلها را در آینده انجام خواهم داد. علیالحساب بدانید که ترکیب رنگها و حالات در این میدجرنی آنقدر زیبا اتفاق میافتد که گاهی اوقات مخاطب را انگشتبهدهان رها میکند. در واقع جالب است بدانید که میدجرنی یکبار یواشکی برنده مسابقات هنر دیجیتالی است!
تئاتر اُپرای فضایی، داستان برندهشدن میدجرنی در مسابقات هنری!
در سال ۲۰۲۲، تصویری با عنوان «تئاتر اپرای فضایی» (به فرانسوی: Théâtre d’Opéra Spatial) که توسط مدل هوش مصنوعی Midjourney ایجاد شده بود، مقام اول را در مسابقه هنر دیجیتال نمایشگاه ایالتی کلرادو کسب کرد. در واقع آقای جیسون آلن (Jason Allen)، کسی بود که پرامپت تولید این تصویر را به میدجرنی داده بود و خروجی را روی بوم چاپ کرد. این تصویر با نام «جیسون ام. آلن بهوسیله میدجرنی» در مسابقه شرکت داده شد و جایزه هنر برتر را دریافت کرد.
این اقدام ناراحتی برخی هنرمندان دیجیتال را برانگیخت؛ آنها معتقد بودند استفاده از هوش مصنوعی در چنین مسابقاتی ناعادلانه است. بااینحال، آلن از اقدام خود دفاع کرد و اعلام کرد که تمامی قوانین مسابقه را رعایت کرده است. داوران مسابقه، نمیدانستند که میدجرنی یک مدل هوش مصنوعی تولید تصویر است، اما بعدها اعلام کردند که حتی بااطلاع از این موضوع، باز هم جایزه برتر را به آلن اعطا میکردند.
این داستان بهخوبی نشان میدهد که از میدجرنی میتوان تقریباً برای هر نوعی از تصویرسازی بهره گرفت. از هنر و طراحی گرفته تا بازاریابی، سرگرمی، آموزش و غیره.
بهبود آثار هنری بصری و کمک به هنرمندان در مفهومسازی طرحهای جدید، ایجاد تصاویر سریع و تأثیرگذار برای کمپینهای بازاریابی، کمک به توسعه هنر مفهومی، طراحی شخصیتها و محیطهای مجازی، کمک به دانشجویان در تجسم مفاهیم پیچیده از طریق تصاویر تولید شده توسط هوش مصنوعی و هر موقعیت دیگری که در ذهن میگنجد، همهوهمه میتوانند مثالهایی از کار با هوش مصنوعی Midjourney باشند.
مزایای استفاده از میدجرنی
باتوجهبه آنچه در بخش قبلی دیدیم، میتوان گفت کار با هوش مصنوعی Midjourney دارای ۴ مزیت عمده است:
- سرعت و کارایی: تولید سریع تصاویر با کیفیت بالا بر اساس توضیحات متنی.
- دسترسی: افرادی که طراح نیستند نیز میتوانند تصاویر حرفهای تولید کنند.
- الهامبخشی: کمک به خلاقان برای عبور از موانع ذهنی و کشف ایدههای جدید.
- سفارشیسازی: انعطافپذیری در ایجاد طرحهای منحصربهفرد و متناسب.
نکتهای که در استفاده از میدجرنی و بهطورکلی در استفاده از تمام مدلهای تولید تصویر وجود دارد این است که شما پس از مدتی، یاد میگیرید که مرزهای تصورات خود را گسترش دهید. میل به دریافت تصاویر خلاقانه و عجیب باعث میشود هر بار تلاش کنید تا خروجی محیرالعقولتری بگیرید و بهاینترتیب ذهنتان را بدون آگاهی و آمادگی قبلی، برای خلاقتر شدن پرورش میدهید.
چالشها و ملاحظات اخلاقی
اگرچه دیگر میدجورنی رایگان ارائه نمیشود، اما حتی همین امروز هم که پول آن را کاملاً پرداخت میکنید، به طریقی باز هم برخی مسائل اخلاقی گریبان شما را میگیرد. چند نمونه از مسائل مهم در این زمینه را در ادامه توضیح دادهام:
اصالت هنر
بحث بر سر نقش هوش مصنوعی در کاهش خلاقیت انسانی. برخی معتقدند که استفاده از هوش مصنوعی اصولاً با روح هنر ناسازگار است و چهره هنر را خدشهدار میکند. بهعبارتدیگر، ما میدانیم که تصویر اپرای فضایی بسیار زیباست و جایزه هم گرفته، اما هرچه باشد، این تصویر توسط یک ماشین تولید شده که آموزشش بر اساس میلیونها نمونه کار هنرمندان دیگر صورت گرفته؛ آن هم بدون اجازه آن هنرمندان!
دراینرابطه حتی شکایتی علیه میدجرنی وجود دارد که در آن تعدادی از هنرمندان ناراحتی و نارضایتی خود را از این که از آثار آنها بدون اجازه برای آموزش مدل استفاده شده، ابزار کردهاند. این مسئله کمی پیچیده است؛ به این خاطر که اگرچه اطلاعات در اینترنت قابلدسترسی هستند، اما تا امروز فناوری ای به اسم هوش مصنوعی وجود نداشت که بتواند در کوتاهمدتی از روی میلیونها اثر، مثل یک هنرمند توانمند و حرفهای، آثاری تولید کند که بعضاً نمونههایی از سبکهای خاص برخی هنرمندان در آن دیده میشود.
مالکیت و مسائل حقوقی
اگر کسی برای محتوای مجرمانه به سراغ استفاده از میدجرنی برود، چه کسی مالک محتوای تولید شده است؟ کاربر، مدل، یا تیم سازنده هوش مصنوعی؟ بحث مالکیت حقوقی یکی از آن مسائل جدی است که هنوز دررابطهبا موضوع هوش مصنوعی چهارچوب درستی برای آن تعریف نشده.
تا این لحظه مسئله به این صورت پیش رفته که تیم های سازنده سعی کردهاند تا حد ممکن مدل را از تولید محتوای مجرمانه دور کنند و از طرفی همیشه از کاربران درخواست شده که به اصول اخلاقی پایبند بمانند. همچنین معمولاً ذکر میشود که استفاده از یک مدل با مسئولیت کاربر صورت میپذیرد و باید در چهارچوب قوانین حرکت کند.
تعصبات فرهنگی در هوش مصنوعی
خروجی نامناسب در میدجرنی گاهی اوقات به واسطه تلاش کاربر است؛ اما گاهی هم نمود ایرادهای اخلاقی خود انسانهاست که در دیتای آموزشی وجود داشته و حالا در خروجی هوش مصنوعی بازتاب پیدا میکند. برای مثال تعصبات نژادی ممکن است روی تصاویر خروجی میدجرنی اثرگذار بوده باشد.
به همین صورت این مسئله میتواند به بسیاری از رذایل اخلاقی تعمیم پیدا کند. نگاه مغرضانه در چهارچوب نژاد، ملیت، مذهب، باور و عقیده، مرتبه اجتماعی، مرتبه اقتصادی و دهها زمینه دیگر خود را نشان میدهد. بهاینترتیب میتوان گفت که هوش مصنوعی تربیت شده دست بشر است و باید تاحدامکان آن را از تاریکیهای نوع بشر دور کرد.
جایگزینی شغلی
هنرمندان و بسیاری از تصویرسازان با ظهور مدلهای تولید تصویر ابزارنگرانی کردهاند. این مسئله در استفاده از میدجرنی هم دیده میشود. حقیقت این است که هوش مصنوعی دنیای ما را تغییر داده و چه بخواهیم و چه نخواهیم، باید سبک زندگیمان و مهارتهای شغلیمان را با آن پیوند بدهیم. افرادی که در فضای سنتی باقی میمانند کمکم از دایره رقابت حذف میشوند.
آینده Midjourney
با مشاهده روند فعلی، بهاحتمال زیاد استفاده از میدجرنی در آینده با بهبود دقت و کیفیت تصاویر، تنوع بیشتر در سبکهای هنری، و ادغام با صنایع مختلف مانند بازیسازی، سینما و معماری گره خواهد خورد. این مدل میتواند ابزار خلاقانهای برای هنرمندان باشد و نقش هوش مصنوعی در تولید آثار هنری را تقویت کند.
همچنین، احتمال ادغام با فناوریهای واقعیت مجازی و افزوده وجود دارد که آموزش استفاده از میدجورنی را کمی پیچیدهتر خواهد کرد. همچنین چالشهای اخلاقی و حقوقی پیرامون مالکیت آثار و تأثیر آن بر اشتغال هنرمندان نیز مطرح خواهد شد. آینده میدجرنی ترکیبی از نوآوری و تعامل خلاقانه انسان و هوش مصنوعی است.
نتیجهگیری
در پاسخ به سؤال ابتدای مطلب، هر دو کلمه درست هستند؛ چرا که تلفظ نام این ابزار، ترکیبی از کسره و ضمه با هم است (-ِ و -ُ)، به همین دلیل برخی آن را میدجِرنی میخوانند و برخی میدجورنی.
استفاده از میدجرنی و سایر مدلهای تولید تصویر، فضای کاری را امروزه به سطح جدید از تولید وارد کرده است. این مدلها همان قدر که میتوانند یک انسان معمولی را تبدیل به یک هنرمند کنند، قدرت ارتقای هنرمندان را نیز دارند. بهعبارتدیگر، تمام اقشار جامعه بهبود پیدا میکنند.
میدجورنی هوش مصنوعی خلاقیت و هنر است، به شما پیشنهاد میکنم حتماً یکبار با این ابزار تصویر تولید کنید تا از هنرش لذت ببرید. البته میتوانید از مدلهای دیگر هم استفاده کنید.
سوالات متداول :
میدجرنی یک مدل هوش مصنوعی است که به کاربران امکان میدهد تصاویر هنری و خلاقانه را بر اساس توصیفات متنی (پرامپتها) تولید کنند. این مدل بهویژه در حوزه هنر دیجیتال محبوب است و به هنرمندان و طراحان کمک میکند تا ایدههای خود را به تصاویر بصری تبدیل کنند.
میدجرنی از طریق پلتفرم Discord قابلدسترسی است. کاربران باید به سرور میدجرنی ملحق شوند و با ارسال پرامپتهای متنی، تصاویر موردنظر خود را درخواست کنند. برای شروع، باید یک حساب کاربری در Discord داشته باشید.
برای نوشتن یک پرامپت مؤثر، باید از توصیفات دقیق و مشخص استفاده کنید. بهجای عبارات کلی، جزئیات مانند موضوع، رنگها، احساس و سبک هنری را مشخص کنید. برای مثال، بهجای «یک باغ»، از «یک باغ گل با رنگهای زنده و نور آفتاب در حال غروب» استفاده کنید.
بله، میدجرنی تصاویر با کیفیت بالا و جزئیات هنری زیادی تولید میکند. این مدل معمولاً نتایجی با جلوههای بصری زیبا و جذاب ارائه میدهد که برای پروژههای خلاقانه بسیار مناسب است.
قوانین مربوط به استفاده تجاری از تصاویر تولید شده با میدجرنی ممکن است بسته به شرایط و قوانین استفاده متغیر باشد. معمولاً کاربران باید شرایط خدمات و حقایق مربوط به حق مالکیت و استفاده از تصاویر را مطالعه کنند.
میدجرنی امکان ایجاد نسخههای جدید و اصلاحات را فراهم میکند. پس از دریافت تصاویر اولیه، کاربران میتوانند یکی از آنها را انتخاب کرده و با استفاده از قابلیتهای Upscale و Variation، تغییرات موردنظر را اعمال کنند.
خیر، استفاده از میدجرنی نیازی به تجربه قبلی ندارد. بااینحال، آشنایی با نحوه نوشتن پرامپتهای مؤثر و استفاده از امکانات مختلف میتواند به بهبود نتایج کمک کند. بسیاری از کاربران تازهکار بهراحتی میتوانند از این ابزار بهرهبرداری کنند.
بله، میدجرنی قادر است سبکهای هنری مختلف را شبیهسازی کند. کاربران میتوانند در پرامپتهای خود به سبکهایی مانند “امپرسیونیسم”، “فوتوریسم” یا نام هنرمندان خاص اشاره کنند تا تصاویری در آن سبک تولید شود.
برای بهبود در استفاده از میدجرنی، میتوانید با آزمایش پرامپتهای مختلف و مشاهده نتایج آنها تمرین کنید. همچنین، مطالعه نظرات و تجربیات سایر کاربران و مشارکت در جوامع آنلاین میتواند به شما در بهبود مهارتهای پرامپتنویسی کمک کند.
بله، میدجرنی به طور مرتب بهروزرسانی میشود و ویژگیها و قابلیتهای جدیدی به آن اضافه میشود. این بهروزرسانیها معمولاً شامل بهبود کیفیت تصاویر، افزایش دقت در پردازش پرامپتها و افزودن قابلیتهای جدید است.