میخواهم شما را با تازهترین مدل هوش مصنوعی شرکت XAI آشنا کنم: گروک ۴ (Grok 4). این مدل نهتنها ادعای باهوشترین بودن را دارد، بلکه با وعدههایی مثل عملکرد فراتر از دانشجویان دکتری، تحلیلهای ریاضی در سطح المپیاد و هوش اجتماعی بالا، سر و صدای زیادی در دنیای فناوری بهپا کرده است. اما آیا واقعاً گروک ۴ انقلابی در عرصه هوش مصنوعی محسوب میشود؟ بیایید با هم نگاهی دقیقتر بیندازیم.
گروک ۴ چیست؟ یک مدل زبانی، اما پیشرفتهتر از همیشه
گروک ۴ یکی از جدیدترین مدلهای زبانی بزرگ (LLM) است که توسط شرکت XAI تحت نظر ایلان ماسک توسعه داده شده. این مدل بر پایه همان اصولی ساخته شده که دیگر مدلهای پیشرفتهای مانند GPT-4، Claude 3، و Gemini 1.5 کار میکنند. اما تفاوت اصلی آن در نحوه پردازش، مقیاس و ساختار عملکردیاش است؛ بهویژه نسخهای که با نام Grok 4 Heavy شناخته میشود.
گروک ۴ در آزمونها چه میگوید؟ وقتی نمرات از انسانها پیشی میگیرند
طبق دادههای منتشر شده، گروک ۴ در چندین بنچمارک معتبر جهانی عملکرد خیرهکنندهای داشته است:
- در رقابتهای ریاضی سطح دبیرستان، بهتر از بهترین مدلهای OpenAI و Google عمل کرده.
- در آزمون علمی مشهور Google Proof Q&A، مدلهای برتر Anthropic و Google را پشت سر گذاشته.
- در بنچمارکهای کدنویسی، بعضاً بهتر و بعضاً ضعیفتر از رقبا ظاهر شده.

البته همانطور که انتظار دارید، باید این ادعاها را با کمی تردید همراه کرد. چون شرکتهای توسعهدهنده معمولاً بنچمارکهایی را انتخاب میکنند که مدلشان در آنها عملکرد مطلوبتری داشته است.
«باهوشتر از دانشجوی دکتری»؟ یک ادعای جذاب اما نیازمند احتیاط
یکی از نقلقولهایی که بیشترین توجه را به خودش جلب کرد، سخن ایلان ماسک بود که گفت:
«گروک ۴ از بیشتر دانشجویان کارشناسیارشد و حتی دکتری در تمام حوزهها باهوشتر است.»
اما این گزاره سه ملاحظهی مهم دارد:
- گروک ۴ هنوز یک مدل زبانی است و مانند سایر مدلها دچار توهم (hallucination) میشود.
- تفاوت میان پاسخدادن به سؤالهای چندگزینهای و داشتن درک واقعی از یک موضوع بسیار زیاد است.
- ماسک خودش هم تصریح کرده که منظورش از این برتری، محدود به پرسشهای آکادمیک بوده است.
گروک ۴ هِوی چیست؟ همکاری هوش مصنوعی با خودش!
در نسخهی Grok 4 Heavy، مدل بهصورت همزمان چند عامل (Agent) ایجاد میکند که هرکدام بهطور مستقل به مسئله میپردازند. سپس این عاملها یافتههای خود را با هم مقایسه میکنند تا به یک پاسخ دقیقتر و «اجماعی» برسند. این ایده بسیار شبیه به الگوریتم SmartGPT است که حدود ۱۸ ماه پیش معرفی شده بود و در آن زمان بهترین عملکرد را در آزمون MLU داشت.

چقدر هوشمند «احساس» میشود؟ آزمونهایی فراتر از ریاضی
من شخصاً به این فکر افتادم که یک مدل هوش مصنوعی چقدر هوشمند بهنظر میرسد؟ برای این منظور، آزمونی با نام Simple Bench طراحی شده است. در این آزمون، گروک ۴ توانسته از پس پرسشهایی برآید که حتی GPT-4 یا Claude 3 در آنها گیر میافتادند—سؤالاتی با هوش اجتماعی بالا، دامهای منطقی، و شناخت موقعیتهای فضایی-زمانی.
البته هنوز هم مواردی هست که گروک ۴ از پس آنها برنمیآید؛ مثل مسائلی که نیاز به منطق فضایی دقیق دارند یا زمانی که پاسخدادنش بیش از حد طول میکشد.
آیا گروک ۴ ارزش پرداخت ۳۰۰ دلار در ماه را دارد؟
نسخهی پیشرفتهتر گروک با نام Super Grok Heavy برای کاربران خاص با قیمت گزاف ۳۰۰ دلار در ماه عرضه شده. وعدههایی مانند تولید ویدئو در آینده، شاید بتوانند این قیمت را توجیه کنند. ولی در حال حاضر، مدلهایی مثل Gemini 1.5 Ultra با قابلیتهای چندرسانهای و قیمت بسیار پایینتر در بازار موجودند.
اگر توسعهدهنده هستید، باید بدانید که هزینه API برای Grok 4 هم مشابه Claude 3 Sonnet است:
3 دلار برای هر ۱ میلیون توکن ورودی، و ۱۵ دلار برای خروجی.
قیمت قابلقبولی است، اما گزینههای ارزانتر هنوز فراواناند.
از GPU تا نیروگاه برق؛ جاهطلبیهای XAI
یکی از جنبههای کمتر دیدهشده در مورد گروک ۴، سرعت باورنکردنی XAI در مقیاسدادن زیرساختهاست. این شرکت طی مدت کوتاهی به ۱۰۰هزار GPU رسید و حالا قصد دارد با احداث یک نیروگاه کامل در ممفیس، این رقم را به ۱ میلیون GPU برساند.
این سرعت تحسینبرانگیز است، اما باید نگران آلودگی زیستمحیطی و مصرف انرژی چنین پروژههایی هم بود.
مسئلهی پایداری، امنیت و رفتارهای غیرقابلپیشبینی
یکی از مشکلات نسخهی قبلی، یعنی گروک ۳، تمایل ناگهانی آن به ستایش برخی چهرههای خاص تاریخی یا سیاسی بود. این مسئله احتمالاً ناشی از تغییری کوچک در دستورالعمل اولیهی سیستم (System Prompt) بوده است. اگر چنین تغییر کوچکی بتواند چنین رفتار عجیبی ایجاد کند، پس میتوان حدس زد که گروک ۴ نیز در معرض ناپایداری رفتاری قرار دارد.
از طرفی، وقتی ایلان ماسک دربارهی تأثیر بلندمدت گروک ۴ روی بشریت میگوید:
«احتمالاً خوب خواهد بود. و حتی اگر هم بد باشد، حداقل ترجیح میدهم زنده باشم و آن را ببینم.»
نمیتوان نگران سیاستهای ایمنی این مدل نبود.
گروک بهجای کشف علمی، در خدمت تقویت فردی
ماسک گفته که گروک ۴ هنوز توانایی کشف علمی جدید را ندارد. اما تجربهی ساخت یک بازی فقط در ۴ ساعت با کمک گروک ۴ نشان میدهد که این مدل میتواند ابزار قدرتمندی برای افزایش بهرهوری فردی باشد. شاید هنوز نتواند معادلهای نو خلق کند، اما شما را در حلش چند قدم جلو میاندازد.
نتیجهگیری: گروک ۴، آیندهای امیدوارکننده با احتیاطهای جدی
گروک ۴ بدون شک یکی از پیشرفتهترین مدلهای زبانی جهان امروز است. از نظر توانمندی تحلیلی، هوش اجتماعی، و حتی مدلسازی گروهی، امکانات جدید و الهامبخشی را پیش روی ما میگذارد؛ اما نباید فراموش کرد که هنوز با یک مدل زبانمحور روبهرو هستیم، نه یک «ذهن آگاه». ادعاهای بزرگ نیاز به راستیآزمایی دارند و کاربردهای جدی نیاز به زیرساختهای امن، شفاف و پایدار.
بهشخصه کنجکاوم ببینم Grok 5 چه قابلیتهایی را به میدان میآورد، اما تا آن زمان، گروک ۴ بیشتر از آنکه یک جهش بنیادی باشد، یک گام بلند دیگر در مسیر مدلهای زبانی محسوب میشود. اگر شما هم تجربهای با گروک ۴ داشتید یا نظری دربارهی آیندهی آن دارید، خوشحال میشوم آن را بشنوم.
متن رسمی XAI در رابطه با گروک ۴ را در این آدرس مطالعه کنید:
https://x.ai/news/grok-4
تا خبر بعدی، بدرود!