Veo3: ویدیوهای تولیدشده با هوش مصنوعی چگونه حقیقت را تحریف می‌کنند؟

آخرین تاریخ ویرایش : ۱۴ تیر ۱۴۰۴

7 دقیقه

2 نظر

تصویر شاخص مدل Veo 3 گوگل برای تولید ویدیو با هوش مصنوعی

کپی کردن آدرس بلاگ

گوگل در تاریخ ۲۰ می ۲۰۲۵ از مدل جدیدش یعنی Veo3 رونمایی کرد؛ یک سیستم تولید ویدیو به کمک هوش مصنوعی که توانایی خلق صحنه‌هایی در حد استانداردهای هالیوود را دارد — با صدای هماهنگ با لب‌ها، دیالوگ‌های طبیعی و صداهای محیطی بسیار دقیق.

شاید به نظر برسد که این مدل هم مشابه با دیگر ابزار هوش مصنوعی تنها یک ابزار است که زندگی روزمره انسان‌ها را تسهیل می‌کند. اما نه! اتفاق بزرگتری در انتظار بشریت است. جمله معروف تا با چشم‌های خودت ندیده‌ای و با گوش‌های خودت نشنیده‌ای باور نکن را همه بخاطر داریم، امروز چشم‌ها و گوش‌ها نیز قادر به تشخیص حقیقت نیستند!

در یکی از دموها، Veo3 ویدیویی از یک مدیرعامل که ساخت که با چهره‌ای پر استرس، درباره اخراج کارکنان صحبت می‌کرد، با لرزش صدا ناشی از عصبانیت و قطره‌های عرقی که بسیار واقعی به نظر می‌رسید. حتی کارکنان شرکت هم نتوانستند تشخیص دهند که جعلی است.

هفته گذشته نیز، مدیر مالی یک شرکت انگلیسی، تماسی تصویری از «مدیر ارشد مالی» خود دریافت کرد که از او خواست فوراً مبلغی را انتقال دهد. فرد تماس‌گیرنده دقیقاً مثل مدیر واقعی حرف می‌زد، در دفتر خودش بود و حتی شوخی‌های شخصی‌شان را یادش بود. پیامد این اتفاق سرقت ۸۳ میلیون دلار در عرض ۱۴ دقیقه بود.

ویدیوی زیر نمونه‌ای از یک ویدیوی سینمایی تولیدشده با مدل Veo3 گوگل است (یک ملوان در دریا)!

پرامپت استفاده شده:

Prompt: A medium shot frames an old sailor, his knitted blue sailor hat casting a shadow over his eyes, a thick grey beard obscuring his chin. He holds his pipe in one hand, gesturing with it towards the churning, grey sea beyond the ship’s railing. “This ocean, it’s a force, a wild, untamed might. And she commands your awe, with every breaking light”

دوره‌ی “تا با چشم‌های خودت ندیده‌ای باور نکن” به سر رسیده است!

بحران در دادگاه‌ها: ۵۸٪ دادگاه‌های آمریکا اکنون ویدیوهای تأییدنشده را نمی‌پذیرند.
فاجعه برای برندها: یک دیپ‌ فیک از ایلان ماسک که اعلام ورشکستگی تسلا را نشان می‌داد، تنها در ۳ ساعت ۹۰ میلیارد دلار از ارزش شرکت را کاهش داد.
خیانت ساختگی: یک‌سوم از پرونده‌های طلاق در ۲۰۲۵ به ویدیوهای جعلی از خیانت استناد می‌کنند.

حتی به حضور فیزیکی هم دیگر اطمینانی نیست! در یک کنفرانس تکنولوژی، یک هولوگرام Veo3 از سوندار پیچای سخنرانی کرد — در حالی که شخص واقعی در بیمارستان بستری بود!

اما Veo3 چه قابلیت‌هایی دارد که این‌قدر شاهکار است؟

Veo3 با سایر مدل‌های هوش مصنوعی تفاوت اساسی دارد. از ویژگی‌های این فناوری می‌توان به موارد زیر اشاره کرد:

صدا و تصویر یکپارچه: به‌صورت هم‌زمان صداگذاری و افکت‌های صوتی را با ویدیو ادغام می‌کند (DI/Natural Synthesis). تنها با یک فرمان متنی، ویدیویی ۶۰ ثانیه‌ای با کیفیت 4K تولید می‌کند که دارای موسیقی، دیالوگ و صداهای طبیعی است.
فضاسازی بسیار نزدیک به واقعیت: ثبات و واقع‌گرایی در صحنه به این معنی که نشانه‌هایی مثل نور، فیزیک، حرکت در ویدیوها دقیق و منسجم هستند. از جریان آب تا ریزش ساختمان‌ها، همه‌چیز واقعی به نظر می‌رسد.
درک پرامپت هوشمند: قادر به ترجمه داستان‌های پیچیده به ویدیوهایی روان است.
ادغام نوشته در ویدیو: از متن درون ویدیو نیز استفاده می‌کند؛ مثلاً تابلوها یا دیالوگ‌های روی صفحه.
ایجاد محتوا با حداقل داده: با تنها یک عکس و نمونه صوتی، چهره‌ها و صداهای کاملاً جعلی و شخصی‌سازی‌شده خلق می‌کند.
یکپارچگی حرفه‌ای: با ابزار جدید گوگل، Google Flow، برای سازندگان محتوا طراحی شده است.

چگونه بدون پرداخت ماهانه Veo3 را تجربه کنیم؟

روش ۱: اعتبار رایگان Google Cloud

تازه‌واردهای Google Cloudء، ۳۰۰ دلار اعتبار رایگان برای ۹۰ روز دریافت می‌کنند. با استفاده از این اعتبار:

سرویس Vertex AI را فعال کرده
مدل veo-3.0-generate-preview را از API فراخوانی کنید
نرخ تقریبی ۰.۳۵ دلار برای هر ثانیه ویدیو، یعنی حدود ۱۴ دقیقه ویدیو رایگان

نمونه کد پایتون برای بهره‌گیری از API:


import requests, json, os
os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "path/to/your/credentials.json"
url = "https://us-central1-aiplatform.googleapis.com/v1/projects/YOUR_PROJECT_ID/locations/us-central1/publishers/google/models/veo-3.0-generate-preview:predict"
payload = {
    "instances": [
        {
            "prompt": "A serene mountain lake at sunset with gentle ripples on the water",
            "sampleCount": 1,
            "videoDuration": "5s",
            "aspectRatio": "16:9"
        }
    ]
}
response = requests.post(url, json=payload)
print(response.json())

روش ۲: برنامه‌های آموزشی و دانشگاهی

دانشجویان تا پایان ۲۰۲۶ به صورت رایگان به Google AI Pro (شامل Veo ۲) دسترسی دارند.
برخی دانشگاه‌ها با مشارکت‌های تحقیقاتی، امکان استفاده از Veo3 را فراهم کرده‌اند. برای جزییات edu.google.com/programs را ببینید.

روش ۳: دوره آزمایشی Google AI Pro

یک ماه استفاده رایگان از Google AI Pro (⁧۱۹.۹۹ دلار ارزش ماهانه)، شامل Veo ۲ و Google Flow. این تجربه می‌تواند مشابه Veo3 باشد، مخصوصاً برای نزدیک‌شدن به نحوه استفاده و تولید.

گزینه‌های جایگزین و رایگان (متن‌باز و ترکیبی)

CogVideo: تولید ویدیو با کیفیت حدود ۴۸۰p.
Make‑A‑Video (متا): گزینه تحقیقاتی با امکانات ساده.
Stable Video Diffusion: پروژه‌ای از Stability AI با اجراهای پشتیبانی‌شده توسط جامعه.
AudioLDM / AudioGen + Topaz Video AI: ترکیب تولید ویدیو ساده + افزودن صدا + ارتقای کیفیت تصویری.

محدودیت‌ها و چالش‌ها

جغرافیای دسترسی محدود: امکانات کامل فعلاً برای کاربران آمریکایی فعال است.
سیاست‌های محتوایی سخت‌گیرانه: تولید چهره‌های انسانی واقعی نیاز به تأیید دارد.
محدودیت مدت ویدیو: فعلاً ۵ تا ۸ ثانیه.
موانع API و مصرف روزانه: سقف درخواست حتی با اعتبار رایگان وجود دارد.

قوانین جدید بقا در عصر پساحقیقت / بازتعریف اعتماد در عصر هوش مصنوعی

احراز هویت با بلاک‌چین: همه رسانه‌ها باید با واترمارک غیرقابل تغییر ثبت شوند.
تأیید بیومتریک: اثر صدا، اسکن عنبیه و واکنش‌های عصبی برای تأیید هویت افراد در ویدیو
کارآگاهان هوش مصنوعی: ابزارهایی مثل FakeCatcher اینتل، با دقت ۹۶٪ جریان خون چهره را تحلیل می‌کنند.

اگر روند پیشرفت Veo3 ادامه یابد، تا سال ۲۰۲۷ مرز میان «واقعی» و «مصنوعی» کاملاً ناپدید خواهد شد.

نتیجه‌گیری: جهشی به سمت نیهیلیسم یا نوآوری؟

ظهور مدل‌هایی مانند Veo3 تنها روش تولید ویدیو را متحول نکرده‌اند — بلکه مرز میان واقعیت و ساختگی را به چالشی جدی کشانده‌اند. چند نکته مفید در این راستا می‌تواند دانستن موارد زیر باشد:

بحران حقیقتِ دیداری: ما وارد عصری شده‌ایم که واقعا هر چه چشم می‌بیند را نباید باور کرد. تماس تصویری، دیگر به‌راحتی نشانه حضور واقعی نیست، تصاویر دوربین‌های امنیتی، همیشه سند قطعی تلقی نمی‌شوند، کودکان به مستندهای تاریخی با تردید می‌نگرند. این موضوع خط باریکی است بین عمیق‌ترین اعتماد و بسیارترین شک.
فرصت خلاقانه: اگر با دقت و رویکرد علمی و اخلاقی پیش برویم، Veo3 می‌تواند به ساخت فیلم، آموزش و هنر کمک کند.
دسترسی شفاف و رایگان: راه‌هایی هست برای تجربه بدون هزینه بالا — با استفاده هوشمندانه از ابزارها، امکانات آموزشی، و ترکیب مدل‌های جایگزین.

ما در دوره‌ای هستیم که اعتماد، مهم‌تر از هر زمان دیگری است. دنیای دیجیتال پر شده از محتواهایی که به‌سادگی قابل جعل‌اند. اما این فناوری‌ها، در دستان متخصصان، نه تهدید بلکه ابزارهایی قدرتمند برای پیشرفت، آموزش، تولید محتوا و حل مسائل پیچیده‌اند.

در این فضا، انتخاب درست یعنی:

استفاده از هوش مصنوعی به‌طور مسئولانه و با راهنمایی کارشناسان
محافظت از داده‌ها و حفظ حریم خصوصی
بهره‌مندی از مزایای هوش مصنوعی مانند سرعت، مقیاس‌پذیری و خلاقیت، بدون افتادن در دام بی‌اعتمادی یا فریب

در آینده، حقیقت همچنان ارزشمند خواهد بود — و ما برای حفظ آن، به تخصص، شفافیت و اخلاق نیاز داریم.

سارا صادقی محقق در حوزه پردازش گفتار

با اشتیاقی بی‌پایان در مسیر رشد، یادگیری و خلق ارزش در دنیای شگفت‌انگیز هوش مصنوعی و پردازش گفتار گام برمی‌دارم.

اشتراک گذاری