رونمایی انویدیا از فناوری Helix برای افزایش سرعت هوش مصنوعی

آخرین بروزرسانی 11 ماه قبل

زمان خواندن: 2 دقیقه

انویدیا با رونمایی از فناوری Helix گام بلندی در جهت بهبود سرعت و پاسخگویی مدل‌های هوش مصنوعی برداشته است. این فناوری نوآورانه، که با نام Helix Parallelism معرفی شده، امکان پردازش هم‌زمان اطلاعات گسترده و پاسخ‌دهی به کاربران را تا ۳۲ برابر بیشتر از قبل فراهم می‌سازد؛ آن‌هم بدون افت سرعت. Helix به‌طور خاص برای معماری نسل جدید پردازنده‌های گرافیکی انویدیا یعنی Blackwell طراحی شده و به‌گونه‌ای مهندسی شده است که بتواند دو چالش اصلی مدل‌های زبانی بزرگ را بهینه‌سازی کند: مدیریت حافظه مکالمات و بارگذاری وزن‌های عظیم شبکه‌های عصبی.

در حالت عادی، مدل‌های هوش مصنوعی برای تولید هر کلمه باید کل تاریخچه مکالمه ذخیره‌شده در حافظه موسوم به KV Cache را اسکن کنند، امری که فشار زیادی بر پهنای باند حافظه پردازنده‌های گرافیکی وارد می‌کند. به‌علاوه، بارگذاری وزن‌های سنگین لایه FFN نیز به‌طور هم‌زمان لازم است که موجب افزایش تأخیر در پاسخ‌دهی می‌شود. فناوری Helix با موازی‌سازی هوشمند این فرایندها، ابتدا با تقسیم‌بندی حافظه KV بین GPUهای مختلف، از تکرار داده‌ها جلوگیری کرده و در مرحله بعد، همان پردازنده‌ها را بلافاصله به پردازش لایه‌های بعدی مدل مشغول می‌کند. این تغییر نقش پویا با بهره‌گیری از تکنیک موازی‌سازی تنسوری (TP) و اتصال‌هایی مانند NVLink و HOP-B باعث افزایش بهره‌وری و کاهش زمان بیکاری می‌شود.

نتایج شبیه‌سازی‌ها نشان می‌دهد که فناوری Helix نه تنها می‌تواند بدون افزایش تأخیر، به تعداد کاربر بیشتری پاسخ دهد، بلکه در شرایط بار پایین نیز زمان پاسخ را تا ۱.۵ برابر کاهش می‌دهد. چنین پیشرفتی به‌طور مستقیم به بهبود عملکرد چت‌بات‌ها و دستیارهای مجازی منجر می‌شود و آن‌ها را قادر می‌سازد میلیون‌ها کلمه را به‌صورت آنی پردازش کرده و تعامل طبیعی‌تری با کاربران داشته باشند. فناوری Helix انویدیا را می‌توان نقطه عطفی در مسیر توسعه هوش مصنوعی سریع، مقیاس‌پذیر و پاسخگو دانست که همگام با نیاز روزافزون کاربران و پیچیدگی مدل‌های زبانی حرکت می‌کند.

منتخب

سردبیر