گروک ۴: باهوش‌ترین مدل زبانی یا یک هیاهوی تازه؟

آخرین تاریخ ویرایش : ۰۵ مرداد ۱۴۰۴
6 دقیقه
0 نظر
گروک 4

 می‌خواهم شما را با تازه‌ترین مدل هوش مصنوعی شرکت XAI آشنا کنم: گروک ۴ (Grok 4). این مدل نه‌تنها ادعای باهوش‌ترین بودن را دارد، بلکه با وعده‌هایی مثل عملکرد فراتر از دانشجویان دکتری، تحلیل‌های ریاضی در سطح المپیاد و هوش اجتماعی بالا، سر و صدای زیادی در دنیای فناوری به‌پا کرده است. اما آیا واقعاً گروک ۴ انقلابی در عرصه هوش مصنوعی محسوب می‌شود؟ بیایید با هم نگاهی دقیق‌تر بیندازیم.

 گروک ۴ چیست؟ یک مدل زبانی، اما پیشرفته‌تر از همیشه

گروک ۴ یکی از جدیدترین مدل‌های زبانی بزرگ (LLM) است که توسط شرکت XAI تحت نظر ایلان ماسک توسعه داده شده. این مدل بر پایه همان اصولی ساخته شده که دیگر مدل‌های پیشرفته‌ای مانند GPT-4، Claude 3، و Gemini 1.5 کار می‌کنند. اما تفاوت اصلی آن در نحوه پردازش، مقیاس و ساختار عملکردی‌اش است؛ به‌ویژه نسخه‌ای که با نام Grok 4 Heavy شناخته می‌شود.

 گروک ۴ در آزمون‌ها چه می‌گوید؟ وقتی نمرات از انسان‌ها پیشی می‌گیرند

طبق داده‌های منتشر شده، گروک ۴ در چندین بنچ‌مارک معتبر جهانی عملکرد خیره‌کننده‌ای داشته است:

  • در رقابت‌های ریاضی سطح دبیرستان، بهتر از بهترین مدل‌های OpenAI و Google عمل کرده.
  • در آزمون علمی مشهور Google Proof Q&A، مدل‌های برتر Anthropic و Google را پشت سر گذاشته.
  • در بنچ‌مارک‌های کدنویسی، بعضاً بهتر و بعضاً ضعیف‌تر از رقبا ظاهر شده.
گروگ 4 در بنج مارک های مختلف

البته همان‌طور که انتظار دارید، باید این ادعاها را با کمی تردید همراه کرد. چون شرکت‌های توسعه‌دهنده معمولاً بنچ‌مارک‌هایی را انتخاب می‌کنند که مدل‌شان در آن‌ها عملکرد مطلوب‌تری داشته است.

 «باهوش‌تر از دانشجوی دکتری»؟ یک ادعای جذاب اما نیازمند احتیاط

یکی از نقل‌قول‌هایی که بیشترین توجه را به خودش جلب کرد، سخن ایلان ماسک بود که گفت:

«گروک ۴ از بیشتر دانشجویان کارشناسی‌ارشد و حتی دکتری در تمام حوزه‌ها باهوش‌تر است.»

اما این گزاره سه ملاحظه‌ی مهم دارد:

  1. گروک ۴ هنوز یک مدل زبانی است و مانند سایر مدل‌ها دچار توهم (hallucination) می‌شود.
  2. تفاوت میان پاسخ‌دادن به سؤال‌های چندگزینه‌ای و داشتن درک واقعی از یک موضوع بسیار زیاد است.
  3. ماسک خودش هم تصریح کرده که منظورش از این برتری، محدود به پرسش‌های آکادمیک بوده است.

 گروک ۴ هِوی چیست؟ همکاری هوش مصنوعی با خودش!

در نسخه‌ی Grok 4 Heavy، مدل به‌صورت هم‌زمان چند عامل (Agent) ایجاد می‌کند که هرکدام به‌طور مستقل به مسئله می‌پردازند. سپس این عامل‌ها یافته‌های خود را با هم مقایسه می‌کنند تا به یک پاسخ دقیق‌تر و «اجماعی» برسند. این ایده بسیار شبیه به الگوریتم SmartGPT است که حدود ۱۸ ماه پیش معرفی شده بود و در آن زمان بهترین عملکرد را در آزمون MLU داشت.

 Grok 4 Heavy
Grok 4 Heavy

 چقدر هوشمند «احساس» می‌شود؟ آزمون‌هایی فراتر از ریاضی

من شخصاً به این فکر افتادم که یک مدل هوش مصنوعی چقدر هوشمند به‌نظر می‌رسد؟ برای این منظور، آزمونی با نام Simple Bench طراحی شده است. در این آزمون، گروک ۴ توانسته از پس پرسش‌هایی برآید که حتی GPT-4 یا Claude 3 در آن‌ها گیر می‌افتادند—سؤالاتی با هوش اجتماعی بالا، دام‌های منطقی، و شناخت موقعیت‌های فضایی-زمانی.

البته هنوز هم مواردی هست که گروک ۴ از پس آن‌ها برنمی‌آید؛ مثل مسائلی که نیاز به منطق فضایی دقیق دارند یا زمانی که پاسخ‌دادنش بیش از حد طول می‌کشد.

 آیا گروک ۴ ارزش پرداخت ۳۰۰ دلار در ماه را دارد؟

نسخه‌ی پیشرفته‌تر گروک با نام Super Grok Heavy برای کاربران خاص با قیمت گزاف ۳۰۰ دلار در ماه عرضه شده. وعده‌هایی مانند تولید ویدئو در آینده، شاید بتوانند این قیمت را توجیه کنند. ولی در حال حاضر، مدل‌هایی مثل Gemini 1.5 Ultra با قابلیت‌های چندرسانه‌ای و قیمت بسیار پایین‌تر در بازار موجودند.

اگر توسعه‌دهنده هستید، باید بدانید که هزینه API برای Grok 4 هم مشابه Claude 3 Sonnet است:
3 دلار برای هر ۱ میلیون توکن ورودی، و ۱۵ دلار برای خروجی.
قیمت قابل‌قبولی است، اما گزینه‌های ارزان‌تر هنوز فراوان‌اند.

 از GPU تا نیروگاه برق؛ جاه‌طلبی‌های XAI

یکی از جنبه‌های کمتر دیده‌شده در مورد گروک ۴، سرعت باورنکردنی XAI در مقیاس‌دادن زیرساخت‌هاست. این شرکت طی مدت کوتاهی به ۱۰۰هزار GPU رسید و حالا قصد دارد با احداث یک نیروگاه کامل در ممفیس، این رقم را به ۱ میلیون GPU برساند.

این سرعت تحسین‌برانگیز است، اما باید نگران آلودگی زیست‌محیطی و مصرف انرژی چنین پروژه‌هایی هم بود.

 مسئله‌ی پایداری، امنیت و رفتارهای غیرقابل‌پیش‌بینی

یکی از مشکلات نسخه‌ی قبلی، یعنی گروک ۳، تمایل ناگهانی آن به ستایش برخی چهره‌های خاص تاریخی یا سیاسی بود. این مسئله احتمالاً ناشی از تغییری کوچک در دستورالعمل اولیه‌ی سیستم (System Prompt) بوده است. اگر چنین تغییر کوچکی بتواند چنین رفتار عجیبی ایجاد کند، پس می‌توان حدس زد که گروک ۴ نیز در معرض ناپایداری رفتاری قرار دارد.

از طرفی، وقتی ایلان ماسک درباره‌ی تأثیر بلندمدت گروک ۴ روی بشریت می‌گوید:

«احتمالاً خوب خواهد بود. و حتی اگر هم بد باشد، حداقل ترجیح می‌دهم زنده باشم و آن را ببینم.»

نمی‌توان نگران سیاست‌های ایمنی این مدل نبود.

 گروک به‌جای کشف علمی، در خدمت تقویت فردی

ماسک گفته که گروک ۴ هنوز توانایی کشف علمی جدید را ندارد. اما تجربه‌ی ساخت یک بازی فقط در ۴ ساعت با کمک گروک ۴ نشان می‌دهد که این مدل می‌تواند ابزار قدرتمندی برای افزایش بهره‌وری فردی باشد. شاید هنوز نتواند معادله‌ای نو خلق کند، اما شما را در حلش چند قدم جلو می‌اندازد.

نتیجه‌گیری: گروک ۴، آینده‌ای امیدوارکننده با احتیاط‌های جدی

گروک ۴ بدون شک یکی از پیشرفته‌ترین مدل‌های زبانی جهان امروز است. از نظر توانمندی تحلیلی، هوش اجتماعی، و حتی مدل‌سازی گروهی، امکانات جدید و الهام‌بخشی را پیش روی ما می‌گذارد؛ اما نباید فراموش کرد که هنوز با یک مدل زبان‌محور روبه‌رو هستیم، نه یک «ذهن آگاه». ادعاهای بزرگ نیاز به راستی‌آزمایی دارند و کاربردهای جدی نیاز به زیرساخت‌های امن، شفاف و پایدار.

به‌شخصه کنجکاوم ببینم Grok 5 چه قابلیت‌هایی را به میدان می‌آورد، اما تا آن زمان، گروک ۴ بیشتر از آن‌که یک جهش بنیادی باشد، یک گام بلند دیگر در مسیر مدل‌های زبانی محسوب می‌شود. اگر شما هم تجربه‌ای با گروک ۴ داشتید یا نظری درباره‌ی آینده‌ی آن دارید، خوشحال می‌شوم آن را بشنوم.

متن رسمی XAI در رابطه با گروک ۴ را در این آدرس مطالعه کنید:
https://x.ai/news/grok-4
تا خبر بعدی، بدرود!

رضا حاتمی
رضا حاتمی نویسنده و محقق
رضا حاتمی هستم؛ علاقه‌مند و شیفتهٔ هوش مصنوعی، کسی که از مطالعه و پژوهش در این زمینه خسته نمی‌شود.
اشتراک گذاری
ثبت نظر
اپلیکیشن ویرا