هوش مصنوعی متن باز چینی با قدرت بسیار بالا
شرکت چینی Moonshot AI، یک مدل متن باز جدید منتشر کرد که توانست در بنچمارکهای مختلف، با مدلهای بسته شرکتهای آمریکایی مثل ChatGPT و Gemini رقابت سنگینی کند. این مدل یک عامل هوشمند است که برای استدلال گامبهگام در حین استفاده از ابزارها آموزش دیده است.
Kimi K2 Thinking چیست؟
هوش مصنوعی Kimi K2 thinking چندین ویژگی معماری DeepSeek-R1 را به ارث برده است. این مدل بر اساس معماری MoE ساخته شده و مجموع پارامترهایش ۱ تریلیون است. بهلطف معماری MoE، فقط ۳۲ میلیارد پارامتر – از ۱ تریلیون – برای هر توکن مشخص فعال میشود.
معماری ترکیب متخصصان در Kimi K2 thinking مشابه R1 است. در مدل R1 هوش مصنوعی DeepSeek، چندین واحد کوچک – که Expert نامیده میشوند – برای هر توکن فعال میشود و یک متخصص مشترک واحد وجود دارد که برای همه توکنها کار میکند.
K2 Thinking همچنین از Multi-Head Latent Attention (MLA) استفاده میکند؛ مکانیزمی که مقادیر توجه مدل را فشرده میکند تا اندازه حافظه پنهان KV را کاهش دهد.
Kimi K2 Thinking یکی از بزرگترین مدلهایی است که جزئیات آن در دسترس عموم قرار گرفت. این مدل میتواند اطلاعات را در یک پنجره زمینه ۲۵۶ کیلوبایتی پردازش کند. بنابراین مدل میتواند اسناد چندوجهی و بزرگ را مدیریت و انسجام پاسخدهیاش را در مکالمات طولانی حفظ کند.
استدلال قوی در Kimi K2 Thinking
این مدل، نسخه استدلالی چتبات Kimi K2 Instruct است که پیشتر در دسترس عموم افراد قرار گرفته بود. یکی از ویژگیهای اصلی K2 Thinking، توانایی آن در انجام «تفکر بین لایهای» است. در این حالت، مراحل استدلال در پاسخ مدل و حین اجرای وظایف ساخته میشود.
این موضوع برای استدلال چند مرحلهای و وظایف تحقیقاتی خیلی مفید و موثر خواهد بود؛ چون مدل باید اطلاعات جدید را یکجا جمع کند، استدلالش را بهروز کند و از ابزارهای مختلف برای انجام درست وظیفهاش کمک بگیرد.
شرکت سازنده ادعا میکند که مدلش را طوری ساخته که زنجیره تفکرش را با فراخوانیهای تابع ادغام میکند. بنابراین میتواند بخواند، فکر کند، ابزاری را فراخوانی کند، دوباره فکر کند و همین مراحل را صدها بار تکرار کند.
توانایی Kimi K2 Thinking چیست؟
Kimi K2 Thinking فعلا فقط از ورودی و خروجی متنی پشتیبانی میکند. این موضوع یک نقطه ضعف محسوب میشود؛ چون K2 رقیب چندوجهی مثل GPT-5 دارد که میتواند با عکس و صدا هم کار کند.
شرکت Moonshot AI تصویر زیر را منتشر کرد که امتیاز مدل استدلالیاش را در بنچمارکهای مختلف نشان میدهد:

تصویر زیر هم از اکانت ایکس – توییتر سابق – Artificial Analysis است که نشان میدهد مدل K2 چقدر سریع در آزمون هوش تحلیلی (Artificial Analysis Intelligence) پیشرفت کرد و حالا با K2 Thinking، رتبه سوم و بعد از GPT-5 را گرفته است.

نقطه ضعف K2 Thinking
عملکرد بالای مدل K2 Thinking با یک نقطه ضعف قابل توجه همراه است: حجم زیاد داده. این مدل خروجیهای بسیار طولانی تولید میکند و در مجموع از ۱۴۰ میلیون توکن برای تکمیل مجموعه ارزیابیهای تحلیلاش بهره میبرد.
این رقم تقریبا ۲.۵ برابر توکنهای استفادهشده توسط رقیبی مثل DeepSeek V3.2 است. چنین حجم زیادی از داده مستقیما روی کاربرد مدل در دنیای واقعی تأثیر منفی میگذارد.
این نقطه ضعف روی دو موضوع اثر منفی دارد:
۱. هزینه اجرای کوئریها بالا میرود؛
۲. زمان لازم برای تولید و ارائه پاسخ کامل خیلی بیدلیل زیاد میشود.
نحوه استفاده از Kimi K2 Thinking
Kimi K2 Thinking را باید از Hugging Face دانلود کنید. با توجه به اینکه مدل حاضر به ۴ بیت کوانتیزه شده است، برای اجرای آن حدودا ۵۰۰ گیگابایت حافظه RAM نیاز دارید.

یکی از کاربران توانست آن را روی دو پردازنده Mac M3 Ultra با ۵۱۲ گیگابایت حافظه مستقر کند و حدود ۱۵ توکن در ثانیه دریافت کرد.
همچنین این مدل از طریق یک سرویس API که با رابط OpenAI و Anthropic سازگار است، در سرویس ابری Moonshot قابل دسترسی است.
قیمت اشتراکهای Kimi K2 Thinking
شرکت Moonshot AI دو پلن قیمتی ارائه داده است که براساس هزینه و سرعت تقسیم شدهاند:
۱. Base: پلن اقتصادی با قیمت ۰.۶۰ دلار به ازای هر میلیون توکن ورودی و ۲.۵۰ دلار به ازای هر میلیون توکن خروجی. اما کاربران گفتهاند که این پلن بسیار کند است و حدود ۸ توکن خروجی در ثانیه تولید میکند.
۲. Turbo: سرعت این پلن حدود ۵۰ توکن در هر ثانیه است؛ اما قیمتش بالاتر از اشتراک Base است: ۱.۱۵ دلار برای هر میلیون توکن ورودی و ۸ دلار برای هر میلیون توکن خروجی.
جنجال بهپا کردن ناخواسته از سمت Kimi K2 Thinking
انتشار Kimi K2 Thinking، جایگاه شرکتهای چینی برتر در ساخت مدلهای AI را بالا برد؛ شرکتهایی مثل DeepSeek و Qwen که توانستند بخش بزرگی از ذهنیت صنعت را تغییر دهند.
این خبر نشان میدهد که عملکرد نسبتا پیشرفته در مدلهای هوش مصنوعی، دیگر منحصر به تعداد انگشتشماری از شرکتهای غربی با بودجه سنگین نیست. بنابراین بعضی از متخصصان AI معتقدند که K2 Thinking کاملا ناخواسته و غیرعامدانه فشار را بر مدلهای اختصاصی بیشتر کرد.
حالا رهبران بازار AI باید بیشتر تلاش کنند و عملکرد مدلهایشان را فراتر از امتیازات بنچمارک ببرند. مثلا مزیت رقابتی آنها میتواند قابلیت اطمینان، تجربه کاربری شخصیسازیشده و ادغامهای منحصربهفرد باشد.
چت جی پی تی و سایر مدلهای پیشرفته در یک پلتفرم واحد
معرفی هوش مصنوعی با نت ملی و تولید محتوا با آن