چرا این خبر مهم است؟
وقتی صحبت از مدلهای زبانی بزرگ (LLM) میشود، بیشتر افراد فقط به توانایی تولید متن فکر میکنند. اما حقیقت این است که این مدلها انرژیبرترین فناوریهای روزگار ما هستند. طبق آمار، تنها در ایالات متحده، مصرف برق سرورهای هوش مصنوعی در سال ۲۰۲۴ بهاندازهی تأمین انرژی میلیونها خانه بوده است. این روند نشان میدهد که اگر راهحل تازهای پیدا نکنیم، آیندهی هوش مصنوعی میتواند از نظر زیستمحیطی و اقتصادی ناپایدار باشد.
اینجاست که پروژهای بهنام SpikingBrain از چین وارد صحنه شده است؛ مدلی الهامگرفته از مغز انسان که نهتنها سریعتر بلکه فوقالعاده کممصرف است.
SpikingBrain چیست؟
SpikingBrain خانوادهای از مدلهای هوش مصنوعی است که بر اساس پردازش رویدادمحور و نورونهای شبیهسازیشده ساخته شدهاند. برخلاف مدلهای ترنسفورمری رایج که برای هر دادهی ورودی محاسبهی بیپایان انجام میدهند، SpikingBrain تنها زمانی فعال میشود که «اتفاقی مهم» رخ دهد؛ درست مانند نورونهای مغز انسان که فقط هنگام تحریک خاص شلیک میکنند.

در این پروژه دو مدل اصلی معرفی شده است:
- SpikingBrain-7B: یک مدل خطی با معماری سادهتر که برای پردازش متون طولانی بهینه شده است.
- SpikingBrain-76B: مدلی پیچیدهتر با ساختار ترکیبی و بهرهگیری از Mixture-of-Experts که توانایی بیشتری در مدلسازی زبان دارد.
چرا این رویکرد انقلابی است؟
سه نوآوری مهم SpikingBrain را متمایز میکند:
- توجه خطی و ترکیبی (Linear & Hybrid Attention):
بهجای مقیاسپذیری نمایی در طول متن، مدل با رشد خطی کار میکند. به این معنا که میتواند میلیونها کلمه را بدون انفجار هزینهی محاسباتی پردازش کند. - نورونهای شبیهسازیشده با آستانهی تطبیقی:
سازوکاری که شلیک نورونها را کنترل میکند و موجب کاهش محاسبات زائد تا بیش از ۶۹٪ میشود. - زیرساخت مستقل از انویدیا:
تیم پژوهشی، بهجای تکیه بر GPUهای انویدیا، از سختافزار بومی چین به نام MetaX بهره گرفته است. این موضوع نهتنها وابستگی به یک شرکت خاص را میشکند، بلکه نشان میدهد میتوان مدلهای عظیم را روی سکوهای سختافزاری متنوع پایدار آموزش داد.
دستاوردهای عددی شگفتانگیز
- سرعت پردازش متنهای طولانی در SpikingBrain-7B بیش از ۱۰۰ برابر سریعتر از مدلهای متداول گزارش شده است.
- در آزمایش ۴ میلیون توکنی، زمان رسیدن به اولین خروجی (TTFT) جهشی بیسابقه داشته است.
- تنها با حدود ۲ درصد دادهی آموزشی مرسوم، این مدلها عملکردی قابل مقایسه با مدلهای پیشرفتهی متنباز ارائه دادهاند.
- نسخهی فشردهی ۱ میلیارد پارامتری حتی روی CPU موبایل نیز اجرا شده و شتابی ۱۵ برابری نسبت به مدلهای مشابه نشان داده است.
پیامدها برای آیندهی هوش مصنوعی
اگر این مسیر ادامه یابد، نتایج آن فراتر از یک دستاورد فنی خواهد بود:
- پایداری زیستمحیطی: مصرف انرژی سرسامآور مراکز داده کاهش مییابد.
- دموکراتیکسازی فناوری: کشورها و شرکتهایی با منابع محدود هم میتوانند از مدلهای پیشرفته استفاده کنند.
- هوش مصنوعی شخصی روی دستگاههای کوچک: آیندهای که در آن گوشی هوشمند شما، بدون نیاز به اتصال مداوم به سرورهای ابری، مدلی همسطح GPT-4 را اجرا کند.
- جهش در سختافزارهای نورومورفیک: گزارش نشان میدهد که معماری SpikingBrain میتواند الهامبخش نسل تازهای از تراشههای الهامگرفته از مغز باشد.
جمعبندی
به نظر میآید که SpikingBrain فقط یک «بهبود تدریجی» نیست؛ بلکه نوید یک پارادایم تازه است. این پروژه نشان میدهد که برای رسیدن به هوش مصنوعی پایدار، لازم نیست همیشه بزرگتر و پرهزینهتر برویم؛ کافی است با الهام از مغز، هوشمندانهتر طراحی کنیم.
هوش مصنوعی در آستانهی دورانی تازه قرار دارد؛ دورانی که شاید در آن، «هوش شبیه مغز» جایگزین «هوش پرمصرف ماشینی» شود.