انقلاب تازه در دنیای هوش مصنوعی: آشنایی با SpikingBrain

آخرین تاریخ ویرایش : ۰۵ مهر ۱۴۰۴
4 دقیقه
0 نظر
SpikingBrain چیست؟

چرا این خبر مهم است؟

وقتی صحبت از مدل‌های زبانی بزرگ (LLM) می‌شود، بیشتر افراد فقط به توانایی تولید متن فکر می‌کنند. اما حقیقت این است که این مدل‌ها انرژی‌برترین فناوری‌های روزگار ما هستند. طبق آمار، تنها در ایالات متحده، مصرف برق سرورهای هوش مصنوعی در سال ۲۰۲۴ به‌اندازه‌ی تأمین انرژی میلیون‌ها خانه بوده است. این روند نشان می‌دهد که اگر راه‌حل تازه‌ای پیدا نکنیم، آینده‌ی هوش مصنوعی می‌تواند از نظر زیست‌محیطی و اقتصادی ناپایدار باشد.
اینجاست که پروژه‌ای به‌نام SpikingBrain از چین وارد صحنه شده است؛ مدلی الهام‌گرفته از مغز انسان که نه‌تنها سریع‌تر بلکه فوق‌العاده کم‌مصرف است.



SpikingBrain چیست؟

SpikingBrain خانواده‌ای از مدل‌های هوش مصنوعی است که بر اساس پردازش رویدادمحور و نورون‌های شبیه‌سازی‌شده ساخته شده‌اند. برخلاف مدل‌های ترنسفورمری رایج که برای هر داده‌ی ورودی محاسبه‌ی بی‌پایان انجام می‌دهند، SpikingBrain تنها زمانی فعال می‌شود که «اتفاقی مهم» رخ دهد؛ درست مانند نورون‌های مغز انسان که فقط هنگام تحریک خاص شلیک می‌کنند.

SpikingBrain چیست؟
SpikingBrain چیست؟

در این پروژه دو مدل اصلی معرفی شده است:

  • SpikingBrain-7B: یک مدل خطی با معماری ساده‌تر که برای پردازش متون طولانی بهینه شده است.
  • SpikingBrain-76B: مدلی پیچیده‌تر با ساختار ترکیبی و بهره‌گیری از Mixture-of-Experts که توانایی بیشتری در مدل‌سازی زبان دارد.

چرا این رویکرد انقلابی است؟

سه نوآوری مهم SpikingBrain را متمایز می‌کند:

  1. توجه خطی و ترکیبی (Linear & Hybrid Attention):
    به‌جای مقیاس‌پذیری نمایی در طول متن، مدل با رشد خطی کار می‌کند. به این معنا که می‌تواند میلیون‌ها کلمه را بدون انفجار هزینه‌ی محاسباتی پردازش کند.
  2. نورون‌های شبیه‌سازی‌شده با آستانه‌ی تطبیقی:
    سازوکاری که شلیک نورون‌ها را کنترل می‌کند و موجب کاهش محاسبات زائد تا بیش از ۶۹٪ می‌شود.
  3. زیرساخت مستقل از انویدیا:
    تیم پژوهشی، به‌جای تکیه بر GPUهای انویدیا، از سخت‌افزار بومی چین به نام MetaX بهره گرفته است. این موضوع نه‌تنها وابستگی به یک شرکت خاص را می‌شکند، بلکه نشان می‌دهد می‌توان مدل‌های عظیم را روی سکوهای سخت‌افزاری متنوع پایدار آموزش داد.

دستاوردهای عددی شگفت‌انگیز

  • سرعت پردازش متن‌های طولانی در SpikingBrain-7B بیش از ۱۰۰ برابر سریع‌تر از مدل‌های متداول گزارش شده است.
  • در آزمایش ۴ میلیون توکنی، زمان رسیدن به اولین خروجی (TTFT) جهشی بی‌سابقه داشته است.
  • تنها با حدود ۲ درصد داده‌ی آموزشی مرسوم، این مدل‌ها عملکردی قابل مقایسه با مدل‌های پیشرفته‌ی متن‌باز ارائه داده‌اند.
  • نسخه‌ی فشرده‌ی ۱ میلیارد پارامتری حتی روی CPU موبایل نیز اجرا شده و شتابی ۱۵ برابری نسبت به مدل‌های مشابه نشان داده است.

پیامدها برای آینده‌ی هوش مصنوعی

اگر این مسیر ادامه یابد، نتایج آن فراتر از یک دستاورد فنی خواهد بود:

  • پایداری زیست‌محیطی: مصرف انرژی سرسام‌آور مراکز داده کاهش می‌یابد.
  • دموکراتیک‌سازی فناوری: کشورها و شرکت‌هایی با منابع محدود هم می‌توانند از مدل‌های پیشرفته استفاده کنند.
  • هوش مصنوعی شخصی روی دستگاه‌های کوچک: آینده‌ای که در آن گوشی هوشمند شما، بدون نیاز به اتصال مداوم به سرورهای ابری، مدلی هم‌سطح GPT-4 را اجرا کند.
  • جهش در سخت‌افزارهای نورومورفیک: گزارش نشان می‌دهد که معماری SpikingBrain می‌تواند الهام‌بخش نسل تازه‌ای از تراشه‌های الهام‌گرفته از مغز باشد.

جمع‌بندی

به نظر می‌آید که SpikingBrain فقط یک «بهبود تدریجی» نیست؛ بلکه نوید یک پارادایم تازه است. این پروژه نشان می‌دهد که برای رسیدن به هوش مصنوعی پایدار، لازم نیست همیشه بزرگ‌تر و پرهزینه‌تر برویم؛ کافی است با الهام از مغز، هوشمندانه‌تر طراحی کنیم.

هوش مصنوعی در آستانه‌ی دورانی تازه قرار دارد؛ دورانی که شاید در آن، «هوش شبیه مغز» جایگزین «هوش پرمصرف ماشینی» شود.

رضا حاتمی
رضا حاتمی نویسنده و محقق
رضا حاتمی هستم؛ علاقه‌مند و شیفتهٔ هوش مصنوعی، کسی که از مطالعه و پژوهش در این زمینه خسته نمی‌شود.
اشتراک گذاری
ثبت نظر
اپلیکیشن ویرا