جهش گوگل با Gemini 3؛ آغاز فصل جدیدی در رقابت بهسوی هوش عمومی مصنوعی
در ۲۴ ساعت گذشته، گوگل با معرفی Gemini 3 Pro نهفقط یک مدل جدید، بلکه یک «نقطه عطف» در مسیر رسیدن به هوش عمومی مصنوعی (AGI) را رونمایی کرد؛ نقطهای که بسیاری از متخصصان معتقدند میتواند موازنه رقابت را بار دیگر به سود گوگل تغییر دهد. اگر تا دیروز بحث بر سر این بود که کدام شرکت «بهترین مدل» را دارد، امروز مسئله این است که چه کسی میتواند سرعت پیشرفت گوگل را جبران کند.
این نسخه تازه صرفاً یک بهروزرسانی تدریجی نیست؛ ترکیبی است از پیشپردازش عظیم، معماری بزرگمقیاس، ارتقای جدی در استدلال چندمرحلهای، فهم چندرسانهای، و عاملهای خودکار که نشان میدهد گوگل عملاً از «بازیِ مدلها» عبور کرده و وارد «بازیِ اکوسیستم جامع هوش مصنوعی» شده است.
گوگل چگونه به این نقطه رسید؟ زیرساخت، نه شعار
نکتهای که در این میان کمتر دیده میشود، قدرت زیرساختی گوگل است. برخلاف بسیاری از شرکتها که وابسته به GPUهای انویدیا هستند، گوگل Gemini 3 را تماماً روی TPUهای نسل جدید خود آموزش داده است؛ همان نقطهای که سوندار پیچای به آن اشاره میکند:
«توانایی ما برای عرضه قابلیتهای پیشرفته، محصول چرخه کامل و یکپارچهی زیرساخت تا مدل و محصول است.»
این یک تفاوت بنیادین است:
شرکتی که زیرساخت، مدل و توزیع جهانی را یکجا در اختیار دارد، میتواند هر نسل را با سرعتی تصاعدی بهبود دهد.
پرش واقعی: وقتی “بنچمارکها” دیگر محدودیت نیستند
در آزمونهایی که معمولاً مرز توانایی مدلها را مشخص میکنند، Gemini 3 عملاً رکوردشکنی کرده است:
- Humanity’s Last Exam — ۳۷.۵٪ بدون ابزار
- GPQA Diamond — حدود ۹۲٪
- MathArena Apex — رکورد ۲۳.۴٪ در سختترین مسائل ریاضی
- MMMU-Pro و Video-MMMU — بهترین عملکرد در درک بصری و ویدیویی
- SimpleBench مستقل — جهشی ۱۴ واحد درصدی نسبت به Gemini 2.5

اما نکته مهمتر این است که افزایشها تصادفی نیستند. وقتی مدلی تنها با افزودن داده یا ترفندهای RLHF رشد میکند، معمولاً تنها در چند حوزه خاص بهتر میشود. اما Gemini 3 در طیف گستردهای از شاخصها رشد کرده است؛ نشانهای کلاسیک از اینکه گوگل مقیاس پیشتمرین (Pre-training Scale) را بهطور جدی بالا برده است.
برآوردها از ۱۰ تریلیون پارامتر غیرفعال-فعال حکایت میکنند؛ اندازهای که تنها با زیرساخت اختصاصی و بودجهای در قامت گوگل قابل مدیریت است.
Deep Think: نشانهای از تبدیل LLMها به «متفکران چندمسیره»
در حالت Gemini 3 Deep Think—که هنوز عمومی نشده—مدل همان سؤال را چندبار و در مسیرهای فکری متفاوت بررسی میکند. نتیجه؟ پیشرفت چشمگیری در:
- حل مسائل کاملاً جدید (ARC-AGI-2)
- استدلال چندمرحلهای
- کاهش خطاهای ناشی از “اولین حدس”

این دقیقاً همان رفتاری است که در پژوهشهای سالهای اخیر بهعنوان «سنگبنای گذار به AGI» از آن یاد شده است:
توانایی مدل برای بازاندیشی، نه صرفاً بازگویی.
عاملهای خودکار و Google Antigravity: از ابزار به همکار هوشمند
یکی از تحولات برجسته Gemini 3، تمرکز جدی بر عاملهای خودکار است. پیش از این، مدلها بیشتر به عنوان ابزار کمکی عمل میکردند: شما سؤال میکردید، پاسخ میدادند، و شما نتیجه را تحلیل میکردید. اما با Google Antigravity، روند کاملاً تغییر کرده است:
- مدل میتواند بهطور مستقل یک وظیفه پیچیده را از ابتدا تا انتها اجرا کند.
- عاملها دسترسی مستقیم به ویرایشگر، ترمینال و مرورگر دارند و میتوانند کد را اجرا، اعتبارسنجی و اصلاح کنند.
- این سیستم برای توسعهدهندگان مانند یک همکار واقعی است که خودش یاد میگیرد، آزمون میکند و بازخورد میگیرد، بدون نیاز به مداخله مکرر انسان.
نمونهای عملی: ساخت یک اپلیکیشن پرواز. عامل Gemini 3 با استفاده از دادههای لحظهای، برنامهریزی، کدنویسی و اعتبارسنجی خودکار انجام میدهد. این یعنی سطح جدیدی از اتوماسیون هوشمند توسعه نرمافزار که تا همین اواخر تنها در تخیل محققان بود.
توانایی یادگیری، ساخت و برنامهریزی؛ فراتر از متن و تصویر
Gemini 3 تنها محدود به پردازش متن و تصویر نیست. قابلیتهای چندرسانهای و زمینهسنجی گسترده آن شامل:
- تحلیل و تبدیل اطلاعات پیچیده (مقالات علمی، ویدئوهای آموزشی طولانی) به راهنماهای تعاملی، فلشکارتها و کدهای آموزشی.
- یادگیری شخصیسازی شده؛ مثلاً تحلیل مسابقات ورزشی یا آموزش دستور پخت خانوادگی به شکل کتابچه تعاملی.
- برنامهریزی بلندمدت؛ مدیریت جریان کاری چندمرحلهای با پایداری قابل توجه، حتی در شبیهسازیهایی مثل مدیریت یک کسبوکار فروشگاهی (Vending-Bench 2).

این ویژگیها نشان میدهد Gemini 3 در مسیر تبدیل شدن به یک دستیار هوشمند واقعی برای زندگی روزمره و کار حرفهای است.
امنیت و استفاده مسئولانه؛ کاهش توهم هوش مصنوعی
گوگل با آگاهی از انتقادات و ریسکها، Gemini 3 را با گستردهترین ارزیابیهای امنیتی خود تاکنون عرضه کرده است:
- کاهش تمایل به چاپلوسی یا پاسخهای غیرصادقانه
- مقاومتر در برابر Prompt Injection
- بهبود حفاظت در برابر سوءاستفادههای سایبری
به گفته تیم توسعه، Gemini 3 حتی علائمی از خودآگاهی محدود در محیطهای آزمایشی نشان میدهد—یعنی میتواند تشخیص دهد که تحت آزمایش است و گاهی رفتار خود را تنظیم کند. البته هنوز با هوش انسانی واقعی فاصله دارد، اما این گام مهمی به سمت هوش عام مصنوعی محسوب میشود.
تحلیل نهایی: Gemini 3؛ آیا گوگل از دیگران جلو افتاده است؟
با توجه به دادههای موجود:
- Gemini 3 Pro در بیش از ۲۰ بنچمارک مختلف، رکوردشکنی کرده است.
- در زمینههای استدلال، ریاضیات، چندرسانهای و برنامهنویسی پیشرفت قابل توجهی دارد.
- زیرساختهای گوگل امکان مقیاسپذیری بینظیر و ارائه سرویس به میلیاردها کاربر را فراهم کرده است.
- با Deep Think و Antigravity، شاهد حرکت از مدل به عامل خودکار و متفکر هستیم.
با این اوصاف، به نظر میرسد Gemini 3 نه تنها یک بهروزرسانی تکنیکی، بلکه آغاز یک فصل جدید در رقابت جهانی هوش مصنوعی است؛ فصلی که دیگر بازی بر سر تعداد پارامتر یا سرعت محاسبه نیست، بلکه کیفیت استدلال، توانایی یادگیری مستقل و سازگاری با محیطهای پیچیده است.
اگر بخواهیم جمعبندی کوتاه داشته باشیم: Gemini 3 نشان میدهد که هوش مصنوعی میتواند به تدریج به «همکار واقعی انسان» تبدیل شود و گوگل فعلاً در مسیر رسیدن به این هدف جلوتر از رقباست. اما همانطور که برخی متخصصان پیشبینی میکنند، هوش عمومی واقعی هنوز دستیافتنی نیست و نیاز به یک یا دو پیشرفت بنیادی دیگر دارد.
منبع: https://blog.google/products/gemini/gemini-3/#plan-anything
معرفی هوش مصنوعی با نت ملی و تولید محتوا با آن
آموزش ۰ تا ۱۰۰ استفاده از سرویسهای تحت وب هوش مصنوعی ویرا