معماری هوش مصنوعی Hope گوگل؛ رویکردی جدید برای یادگیری مداوم 

آخرین تاریخ ویرایش : ۰۹ آذر ۱۴۰۴
12 دقیقه
0 نظر
هوش مصنوعی Hope گوگل

هوش مصنوعی در سال‌های اخیر، بیشترین پیشرفت را به خود دیده است. این پیشرفت در زمان کم رخ داد و حالا هر روز شاهد اخبار جدید و به‌روزرسانی‌های متعدد هستیم. علی‌رغم تمام این پیشرفت‌ها، یک مشکل همچنان پابرجا مانده است: هوش مصنوعی هنوز نمی‌تواند به‌صورت مداوم از داده‌ها یاد بگیرد و آن‌ها را فراموش نکند.

این مشکل را گوگل با رویکرد Hope در یادگیری ماشین حل کرده است. رویکردی که بعضی از کارشناسان می‌گویند مسیر رسیدن به AGI را هموار می‌کند و این تکنولوژی را به سرزمین جدیدی می‌برد. بیایید با جزئیات این رویکرد بیشتر آشنا شویم و به دل آن برویم.

مشکل از کجا شروع شد؟

در یک دهه گذشته، مدل‌های AI پیشرفت‌های باورنکردنی در یادگیری ماشین (ML) به خود دیدند. این پیشرفت‌ها به‌لطف معماری‌های قدرتمند شبکه عصبی و الگوریتم‌های مورد استفاده برای آموزش مدل‌ها رقم خورده‌اند.

بااین‌حال، علی‌رغم موفقیت مدل‌های زبانی بزرگ (LLM)، چند چالش اساسی همچنان پابرجا مانده است که دو مورد از برجسته‌ترین آن‌ها یادگیری مداوم، توانایی مدل برای کسب فعال دانش و مهارت‌های جدید است؛ بدون آن‌که این دانش در طول زمان محو شود و دانش‌های قبلی به فراموشی سپرده شوند.

همان‌طور که می‌دانید، هوش مصنوعی شبیه‌سازی از هوش انسان است. پس می‌توان برای دستیابی به رویکردی جدید و بهینه کردن عملکرد مدل‌ها، از فرآیند یادگیری و تصمیم‌گیری مغز انسان الگو گرفت.

مغز ما می‌تواند با داده‌های جدید سازگار شود و مسیرهای عصبی تازه‌ای برای آن‌ها بسازد. درواقع مغزمان با تکیه بر انعطاف‌پذیری شناختی و عصبی خود، می‌تواند دانش جدید را بدون حذف قبلی‌ها یاد بگیرد و در عمل آن‌ها را پیاده کند. 

بدون این توانایی، ما به زمینه فوری (مثل فراموشی پیش‌رونده) محدود می‌شویم که درحال‌حاضر LLMها درگیر آن هستند؛ به این معنی که دانش آن‌ها به دو چیز محدود می‌شود:

۱. زمینه فوری پنجره ورودی 

۲. اطلاعات استاتیکی که در طول فرآیند پیش آموزش یاد گرفتند.

رویکرد ساده برای حل مشکل فراموشی فاجعه‌بار

در حوزه هوش مصنوعی اصطلاحی با عنوان “Catastrophic Forgetting” داریم که در فارسی آن را «فراموشی فاجعه‌بار» ترجمه می‌کنیم. 

Catastrophic Forgetting به فارسی فراموشی فاجعه‌بار36

CF جایی است که مدل وظایف جدید را یاد می‌گیرد، اما مهارتش در انجام دادن وظایف قدیمی یا خیلی کم‌رنگ می‌شود، یا کاملا فراموش می‌شود. محققان یک روش ساده برای حل این چالش اجرا می‌کردند. آن‌ها از ترفندهای معماری شبکه یا قوانین بهینه‌سازی بهتر بهره می‌بردند تا مدل از حداکثر توانایی‌اش برای یادگیری پارامترهای جدید استفاده کند. 

گوگل چگونه به رویکرد Hope رسید؟

گوگل در وب‌سایت رسمی Research خود به‌صورت واضح اعلام کرد که مدت‌هاست معماری مدل (ساختار شبکه) و الگوریتم بهینه‌سازی (قانون آموزش) را دو چیز جداگانه در نظر می‌گیرد. این غول فناوری معتقد است که دو فناوری موجود، مانع دستیابی به یک سیستم یادگیری یکپارچه و کارآمد می‌شود.

این نگرش متفاوت گوگل باعث تحقیق و ایجاد روش جدیدی شد که در مقاله‌ای با عنوان “Nested Learning: The Illusion of Deep Learning Architectures”، مورد بحث قرار گرفت و در کنفرانس سالانه NeurIPS 2025 ارائه شد. 

گوگل می‌گوید که Nested Learning یادگیری تودرتو است و به مدل کمک می‌کند تا ورودی را یک سیستم چندوجهی ببیند؛ یعنی ورودی یک فرآیند پیوسته و دنباله‌دار نیست؛ بلکه سیستمی متشکل از ده‌ها مسئله چند سطحی و به‌هم پیوسته است که مدل به‌طور همزمان روی آن‌ها کار می‌کند.

الگوبرداری از امواج مغز برای رسیدن به رویکرد hope

استدلال گوگل این است که معماری مدل و قوانین مورد استفاده برای آموزش آن (یعنی الگوریتم بهینه‌سازی) اساسا مفاهیم یکسانی هستند. از نظر این کمپانی ابرقدرت‌مند، الگوریتم‌های بهینه‌سازی فقط سطوح مختلف بهینه‌سازی هستند که هرکدام جریان داخلی اطلاعات و نرخ به‌روزرسانی خاص خود را دارند. 

گوگل توانسته با تشخیص این ساختار ذاتی، یادگیری تودرتو را بسازد تا بُعد جدیدی به فرآیند طراحی هوش مصنوعی اضافه کند. با این رویکرد، متخصصان AI می‌توانند اجزای یادگیری ماشین را با عمق بیشتر در محاسبات آموزش دهند.

این کمپانی پیش‌رو در تحقیقات AI، رویکرد Nested Learning خود را از طریق یک معماری خود-اصلاح‌گرِ اثبات مفهوم آزمایش و اعتبارسنجی می‌کند. نام این رویکرد “Hope” یا «امید» و مخفف “Hierarchical Optimizing Processing Ensemble” است. 

طبق اظهار گوگل، معماری Hope در مدل‌سازی به سطح بالاترین عملکرد می‌رسد و مدیریت حافظه‌ بلندمدت در آن نسبت به مدل‌های پیشرفته‌ موجود بهتر است.

چرا مدل‌های LLM دانش قبلی خود را فراموش می‌کنند؟

اجازه دهید با یک مثال ساده، به شما بگوییم چگونه مدل‌های LLM فعلی دانش قبلی‌شان را فراموش می‌کنند. سپس دلایل این چالش را بررسی می‌کنیم تا نحوه حل مسئله Hope را بهتر درک کنیم.

فرض کنید به‌تازگی یک مهارت جدید را به فردی آموزش می‌دهید. در این فرآیند، یادگیرنده تمام چیزهایی که قبلا یاد گرفته و بلد بود را کاملا فراموش می‌کند. یعنی دانش جدید باعث پاک شدن دانش قبلی در حافظه او می‌شود.

این مشکل همان فراموشی فاجعه‌بار در مدل‌های LLM و سایر سیستم‌های هوش مصنوعی است.

یادگیری متوالی

فرآیند یادگیری دانش در مدل‌های هوش مصنوعی به‌شکل گام‌به‌گام (متوالی) است. بنابراین وقتی مدل چیز جدیدی یاد می‌گیرد، تنظیمات داخلی – که به آن‌ها وزن‌ می‌گوییم – خود را برای تطبیق با اطلاعات جدید تغییر می‌دهد.

این موضوع یک مشکل بزرگ درست می‌کند: تغییر تنظیمات برای تطبیق با دانش جدید، تنظیمات قبلی را مختل می‌کند و باعث می‌شود مدل داده‌های قدیمی را فراموش کند.

نحوه به‌خاطر سپردن داده‌های غیرایستا

در بسیاری از سناریوهای دنیای واقعی، توزیع داده‌ها با گذشت زمان تغییر می‌کند. وقتی یک مدل با توزیع جدیدی از داده‌ها مواجه می‌شود، معمولا یادگیری توزیع جدید را در اولویت قرار می‌دهد. این اولویت گذاشتن باعث فراموشی توزیع قبلی می‌شود.

بازنویسی حافظه

مجموعه دانش یک هوش مصنوعی در تنظیمات داخلی آن و با نام «وزن» یا “Weight” ذخیره می‌شود. وقتی داده‌های جدید وارد دیتابیس می‌شوند، مدل LLM وزن‌های قدیمی را بازنویسی می‌کند تا خطاها در کار جدید را به‌حداقل برساند. این کار درست مثل ضبط یک ویدیوی جدید روی ویدیوی قدیمی و مهم است.

فقدان سیستم حافظه

برخلاف مغز انسان که روش‌های پیچیده‌ و لایه‌بندی‌شده برای ذخیره و بازیابی انواع مختلف خاطرات دارد، مدل‌های استاندارد هوش مصنوعی به چنین سیستم‌هایی مجهز نیستند.

عدم وجود فضای کافی برای نگهداری تمام اطلاعات

اگر ظرفیت شبکه مدل کم باشد یا ساختار آن برای مدیریت همزمان چندین کار تنظیم نشده باشد، نمی‌توان هم اطلاعات قدیمی و هم دانش جدید را ذخیره کرد. محدودیت فعلی LLMها مثل این است که بخواهید تعداد زیادی کتاب بزرگ را در یک قفسه کوچک جا بدهید. مسلما نمی‌توانید همه کتاب‌ها را در همین قفسه جا بدهید و باید چندتای آن‌ها را به کتاب‌خانه دیگری ببرید.

سوگیری نسبت به داده‌های اخیر

شبکه‌های عصبی ذاتا مایلند به جدیدترین داده‌هایی که براساس آن‌ها آموزش دیده‌اند، اهمیت بیشتری بدهند. این سوگیری نسبت به داده‌های اخیر باعث می‌شود که شبکه، دانش قدیمی‌تر را بازنویسی کند؛ به‌خصوص اگر داده‌های جدید تفاوت قابل توجهی با داده‌های قدیمی‌تر داشته باشند.

چگونه رویکرد Hope مشکل فراموشی فاجعه‌بار را حل می‌کند؟

سیستم Hope تقلیدی هوشمندانه از نوروپلاستیسیته در مغز انسان است. این اصطلاح در علوم نوروساینس رایج است و به انعطاف‌پذیری مغز و ایجاد مسیرهای عصبی و رشدیافته جدید اشاره می‌کند. 

سیستم Hope تقلیدی هوشمندانه از نوروپلاستیسیته در مغز انسان

با الهام‌ گرفتن از این انعطاف‌پذیری، گوگل رویکرد یادگیری تودرتو در معماری Hope را معرفی کرد که در‌ آن، کل مدل هوش مصنوعی یک سلسله مراتب از ماژول‌های یادگیری به‌هم پیوسته است. این سلسله مراتب در مقیاس زمانی یا فرکانس منحصربه‌فرد خودش عمل کرده و به‌روزرسانی می‌شود. در ادامه این بخش، جزئیات این رویکرد را به‌طور مفصل توضیح می‌دهیم.

به‌روزرسانی‌ در چند بازه زمانی

Nested Learning معماری مدل (لایه‌های شبکه) و الگوریتم بهینه‌سازی آن (قوانین آموزشی) را در یک سیستم واحد و منسجم از مسائل بهینه‌سازی تودرتو متحد می‌کند.

Nested Learning معماری مدل (لایه‌های شبکه) و الگوریتم بهینه‌سازی آن (قوانین آموزشی)

سپس در ساختار سلسله مراتبی، مدل از نظر مفهومی به سطوح یا اجزای مختلفی تقسیم می‌شود که روی هم انباشته شده و درعین‌حال به یکدیگر وصل هستند.

به هر سطح از این ساختار لایه‌ای، یک نرخ فرکانس به‌روزرسانی متمایز اختصاص داده می‌شود.

لایه‌های سریع و داخلی

ماژول‌های سطحی به‌صورت مکرر به‌روز می‌شوند. مثلا هر چند مرحله یک‌بار یا برای هر داده ورودی جدید، این به‌روزرسانی انجام می‌شود. این ماژول‌های داخلی مسئول حافظه کوتاه‌مدت و سازگاری سریع هستند. نمونه آن در دنیای واقعی و تعاملات انسانی، همان یادگیری سبک مکالمه در یک جلسه کاری است که ما خیلی سریع خودمان را با آن تطبیق می‌دهیم.

لایه‌های کند و بیرونی

این ماژول‌ها خیلی کمتر از ماژول‌های سطحی به‌روز می‌شوند و هر چند هزار مرحله، یک‌بار به‌روزرسانی صورت می‌گیرد. این ماژول‌ها مسئول حافظه بلندمدت هستند و فقط پایدارترین، ماندگارترین و بنیادی‌ترین دانش را ذخیره می‌کنند؛ مثل قوانین دستور زبان یا مفاهیم اصلی یک حوزه تخصصی.

جلوگیری از فراموشی

حالا مدل می‌تواند سرعت‌های یادگیری را جدا کند. پس به‌روزرسانی‌های سریع و ضروری را برای یادگیری یک کار جدید، به ماژول‌های سطحی واگذار می‌کند. 

این توزیع از تداخل یا بازنویسی وزن‌های پایدار در لایه‌های کند جلوگیری می‌کند؛ لایه‌هایی که مسئول مهارت‌های بنیادی مدل هستند.

سیستم حافظه پیوسته (CMS)

Hope به‌جای تقسیم ساده بین حافظه کوتاه مدت (توجه) و بلند مدت (پیش‌خور)، طیفی از ماژول‌های حافظه به نام “Continuum Memory System” یا “CMS” را در خود جا داده است. این سیستم چندین بلوک پیش‌خور را به یکدیگر وصل می‌کند که هرکدام با فرکانس به‌روزرسانی خاص و متفاوت خود پیکربندی شده‌اند. 

CMS سیستم حافظه‌ای غنی‌تر و موثرتری برای مدل‌های LLM است که می‌تواند اطلاعات را در بازه‌های زمانی مختلف مدیریت کند.

معماری خود-اصلاح‌کننده

این معماری، یک ساختار بهینه‌سازی آموخته‌شده است. درواقع مدلی که با هوش مصنوعی Hope ساخته می‌شود، به یک معماری بازگشتی مجهز است و می‌تواند یاد بگیرد چگونه حافظه خود را به‌روزرسانی کند.

بنابراین مدل فقط به یک قانون بهینه‌سازی خارجی ثابت مثل Adam یا SGD متکی نیست؛ بلکه قوانین به‌روزرسانی بهینه خود را در لحظه یاد می‌گیرد. این فرآیند خودارجاعی، توانایی بالقوه و نسبتا نامحدودی را برای یادگیری درون‌زمینه‌ای امکان‌پذیر می‌کند.

ادعاهای گوگل درباره عملکرد بهینه‌ Hope

مجدد برمی‌گردیم به صفحه رسمی Google Research و این‌بار گفته‌های گوگل درباره اثربخشی این رویکرد را بیان می‌کنیم.

گوگل نتایج به‌دست‌آمده در وظایف مدل‌سازی زبان عمومی و استدلال را با سه معماری Hope، مدل‌های بازگشتی مدرن و ترانسفورماتورهای استاندارد مقایسه کرده و می‌گوید که هوش مصنوعی Hope پیچیدگی کمتر و دقت بالاتری داشته است.

عملکرد هوش مصنوعی hope در تست استدلال

همچنین در تست Needle-In-Haystack با ابزار هوش مصنوعی Hope، این رویکرد توانست عملکرد بهینه‌تری نسبت به معماری‌های Titan، TTT و Mamba2 از خود نشان دهد. 

تست Needle-In-Haystack با ابزار هوش مصنوعی Hope

همان‌طور که در تصویر بالا مشاهده کردید، هوش مصنوعی Hope حافظه را بهتر از سایر معماری‌ها در وظایف مختلف با زمینه طولانی مدیریت کرد. این نتیجه ثابت می‌کند که CMSها روشی کارآمدتر و موثرتر برای مدیریت توالی‌های طولانی اطلاعات هستند.

تست NIAH، میزان توانایی یک LLM را در شناسایی دقیق اطلاعات یک پنجره متنی می‌سنجد. در این تست، یک عبارت تصادفی (معروف به “Needle”) در یک متن طولانی (“Haystack”) جا داده می‌شود و مدل را وادار می‌کنند که عبارت را بازیابی کند.

نتیجه‌گیری؛ آیا Hope ما را به AGI می‌رساند؟

متخصصان می‌گویند بله؛ رسیدن به AGI با ساختن هوش مصنوعی Hope و معماری MoE خیلی نزدیک است؛ اما برخی دیگر از کارشناسان و رهبران AI می‌گویند که همچنان محدودیت‌های سخت‌افزاری و منابع محاسباتی، مشکلات بزرگ‌تری در مسیر رسیدن به AGI هستند که با این رویکرد هم حل نمی‌شود. 

با تمام این اوصاف، حالا می‌دانیم که گوگل با آزمایشگاه هوش مصنوعی و واحد DeepMind خود، تلاش دارد مدال طلای پیش‌روی در AI را دستش بگیرد و روی سکوی اول بایستد. درحال‌حاضر هم توانسته با مدالش روی این سکو بماند. اما چه کسی می‌داند مسیر AGI با چه فرازونشیب‌ها و احتمالا چالش‌های عمدی مواجه می‌شود؟ شاید رویکرد Hope هم نتواند موانع را بردارد و همچنان نزدیک به یک دهه با AGI فاصله داشته باشیم.

سوالات متداول

۱. هوش مصنوعی Hope چیست؟

ابزار هوش مصنوعی Hope به مدل‌ها اجازه می‌دهد که به‌صورت مداوم – احتمالا مادام‌العمر – دانش جدید را یاد بگیرند؛ بدون این‌که دانش قبلی را فراموش کنند.

۲. ابزار هوش مصنوعی Hope چه مشکلی را در AI حل می‌کند؟

هوش مصنوعی Hope یک رویکرد جدید و معرفی‌شده توسط گوگل است که مشکل فراموش شدن دانش قبلی را در مدل‌های LLM حل می‌کند.

۳. آیا Hope همان AGI است؟

خیر. AGI توانایی هوش مصنوعی در حل مسائل و استدلال، نزدیک به توانایی مغز انسان است؛ درحالی‌که Hope یک رویکرد ساخته‌شده توسط گوگل است که مشکل فراموشی دانش در مدل‌های کنونی را برطرف می‌کند.

نگین فاتحی
نگین فاتحی کارشناس محتوای متنی حوزه هوش مصنوعی
از نوجوونی به صنعت تکنولوژی علاقه‌مند شدم و سال ۲۰۲۲ که ChatGPT حسابی غوغا کرد، شورواشتیاقم رو در حوزه AI متمرکز کردم.
اشتراک گذاری
ثبت نظر
بنر نصب تمام صفحات