هوش مصنوعی متن باز چینی با قدرت بسیار بالا

نگین فاتحی (کارشناس محتوای متنی حوزه هوش مصنوعی)

آخرین تاریخ ویرایش : ۲۲ آبان ۱۴۰۴

5 دقیقه

0 نظر

Kimi K2 Thinking مدل AI متن‌باز با ۱ تریلیون پارامتر از Moonshot AI

کپی کردن آدرس بلاگ

شرکت چینی Moonshot AI، یک مدل متن باز جدید منتشر کرد که توانست در بنچمارک‌های مختلف، با مدل‌های بسته شرکت‌های آمریکایی مثل ChatGPT‌ و Gemini رقابت سنگینی کند. این مدل یک عامل هوشمند است که برای استدلال گام‌به‌گام در حین استفاده از ابزارها آموزش دیده است.

Kimi K2 Thinking چیست؟

هوش مصنوعی Kimi K2 thinking چندین ویژگی معماری DeepSeek-R1 را به‌ ارث برده است. این مدل بر اساس معماری MoE ساخته شده و مجموع پارامترهایش ۱ تریلیون است. به‌لطف معماری MoE، فقط ۳۲ میلیارد پارامتر – از ۱ تریلیون – برای هر توکن مشخص فعال می‌شود.

معماری ترکیب متخصصان در Kimi K2 thinking مشابه R1 است. در مدل R1 هوش مصنوعی DeepSeek، چندین واحد کوچک – که Expert نامیده می‌شوند – برای هر توکن فعال می‌شود و یک متخصص مشترک واحد وجود دارد که برای همه توکن‌ها کار می‌کند.

K2 Thinking همچنین از Multi-Head Latent Attention (MLA) استفاده می‌کند؛ مکانیزمی که مقادیر توجه مدل را فشرده می‌کند تا اندازه حافظه پنهان KV را کاهش دهد.

Kimi K2 Thinking یکی از بزرگترین مدل‌هایی است که جزئیات آن در دسترس عموم قرار گرفت. این مدل می‌تواند اطلاعات را در یک پنجره زمینه ۲۵۶ کیلوبایتی پردازش کند. بنابراین مدل می‌تواند اسناد چندوجهی و بزرگ را مدیریت و انسجام پاسخ‌دهی‌اش را در مکالمات طولانی حفظ کند.

استدلال قوی در Kimi K2 Thinking

این مدل، نسخه استدلالی چت‌بات Kimi K2 Instruct است که پیش‌تر در دسترس عموم افراد قرار گرفته بود. یکی از ویژگی‌های اصلی K2 Thinking، توانایی آن در انجام «تفکر بین لایه‌ای» است. در این حالت، مراحل استدلال در پاسخ مدل و حین اجرای وظایف ساخته می‌شود.

این موضوع برای استدلال چند مرحله‌ای و وظایف تحقیقاتی خیلی مفید و موثر خواهد بود؛ چون مدل باید اطلاعات جدید را یک‌جا جمع‌ کند، استدلالش را به‌روز کند و از ابزارهای مختلف برای انجام درست وظیفه‌اش کمک بگیرد.

شرکت سازنده ادعا می‌کند که مدلش را طوری ساخته که زنجیره تفکرش را با فراخوانی‌های تابع ادغام می‌کند. بنابراین می‌تواند بخواند، فکر کند، ابزاری را فراخوانی کند، دوباره فکر کند و همین مراحل را صدها بار تکرار کند.

توانایی Kimi K2 Thinking چیست؟

Kimi K2 Thinking فعلا فقط از ورودی و خروجی متنی پشتیبانی می‌کند. این موضوع یک نقطه ضعف محسوب می‌شود؛ چون K2 رقیب چندوجهی مثل GPT-5 دارد که می‌تواند با عکس و صدا هم کار کند.

شرکت Moonshot AI تصویر زیر را منتشر کرد که امتیاز مدل استدلالی‌اش را در بنچمارک‌های مختلف نشان می‌دهد:

Kimi K2 Thinking در بنچمارک‌های هوش مصنوعی رقابت نزدیک با ChatGPT و Gemini

تصویر زیر هم از اکانت ایکس – توییتر سابق – Artificial Analysis است که نشان می‌دهد مدل K2 چقدر سریع در آزمون هوش تحلیلی (Artificial Analysis Intelligence) پیشرفت کرد و حالا با K2 Thinking، رتبه سوم و بعد از GPT-5 را گرفته است.

نقطه ضعف K2 Thinking

عملکرد بالای مدل K2 Thinking با یک نقطه ضعف قابل توجه همراه است: حجم زیاد داده. این مدل خروجی‌های بسیار طولانی تولید می‌کند و در مجموع از ۱۴۰ میلیون توکن برای تکمیل مجموعه ارزیابی‌های تحلیل‌اش بهره می‌برد.

این رقم تقریبا ۲.۵ برابر توکن‌های استفاده‌شده توسط رقیبی مثل DeepSeek V3.2 است. چنین حجم زیادی از داده‌ مستقیما روی کاربرد مدل در دنیای واقعی تأثیر منفی می‌گذارد.

این نقطه ضعف روی دو موضوع اثر منفی دارد:

۱. هزینه اجرای کوئری‌ها بالا می‌رود؛

۲. زمان لازم برای تولید و ارائه پاسخ کامل خیلی بی‌دلیل زیاد می‌شود.

نحوه استفاده از Kimi K2 Thinking

Kimi K2 Thinking را باید از Hugging Face دانلود کنید. با توجه به این‌که مدل حاضر به ۴ بیت کوانتیزه شده است، برای اجرای آن حدودا ۵۰۰ گیگابایت حافظه RAM نیاز دارید.

یکی از کاربران توانست آن را روی دو پردازنده Mac M3 Ultra با ۵۱۲ گیگابایت حافظه مستقر کند و حدود ۱۵ توکن در ثانیه دریافت کرد.

همچنین این مدل از طریق یک سرویس API که با رابط OpenAI و Anthropic سازگار است، در سرویس ابری Moonshot قابل دسترسی است.

قیمت اشتراک‌های Kimi K2 Thinking

شرکت Moonshot AI دو پلن قیمتی ارائه داده است که براساس هزینه و سرعت تقسیم شده‌اند:

۱. Base: پلن اقتصادی با قیمت ۰.۶۰ دلار به ازای هر میلیون توکن ورودی و ۲.۵۰ دلار به ازای هر میلیون توکن خروجی. اما کاربران گفته‌اند که این پلن بسیار کند است و حدود ۸ توکن خروجی در ثانیه تولید می‌کند.

۲. Turbo: سرعت این پلن حدود ۵۰ توکن در هر ثانیه است؛ اما قیمتش بالاتر از اشتراک Base است: ۱.۱۵ دلار برای هر میلیون توکن ورودی و ۸ دلار برای هر میلیون توکن خروجی.

جنجال به‌پا کردن ناخواسته از سمت Kimi K2 Thinking

انتشار Kimi K2 Thinking، جایگاه شرکت‌های چینی برتر در ساخت مدل‌های AI را بالا برد؛ شرکت‌هایی مثل DeepSeek و Qwen که توانستند بخش بزرگی از ذهنیت صنعت را تغییر دهند.

این خبر نشان می‌دهد که عملکرد نسبتا پیشرفته در مدل‌های هوش مصنوعی، دیگر منحصر به تعداد انگشت‌شماری از شرکت‌های غربی با بودجه سنگین نیست. بنابراین بعضی از متخصصان AI معتقدند که K2 Thinking کاملا ناخواسته و غیرعامدانه فشار را بر مدل‌های اختصاصی بیشتر کرد.

حالا رهبران بازار AI باید بیشتر تلاش کنند و عملکرد مدل‌هایشان را فراتر از امتیازات بنچمارک ببرند. مثلا مزیت رقابتی آن‌ها می‌تواند قابلیت اطمینان، تجربه کاربری شخصی‌سازی‌شده و ادغام‌های منحصر‌به‌فرد باشد.

نگین فاتحی کارشناس محتوای متنی حوزه هوش مصنوعی

از نوجوونی به صنعت تکنولوژی علاقه‌مند شدم و سال ۲۰۲۲ که ChatGPT حسابی غوغا کرد، شورواشتیاقم رو در حوزه AI متمرکز کردم.

اشتراک گذاری