مایکروسافت با معرفی مدل هوش مصنوعی BitNet b1.58 2B4T، گامی بزرگ در جهت توسعه فناوریهای هوش مصنوعی بهینه و متنباز برداشت. این مدل که تحت مجوز MIT منتشر شده، به دلیل طراحی فشرده و کارآمد خود، قابلیت اجرا روی پردازندههای معمولی مانند اپل M2 را دارد و به توسعهدهندگان امکان میدهد تا از هوش مصنوعی در دستگاههای با منابع محدود بهره ببرند.
فناوری 1 بیتی: انقلابی در بهینهسازی
مدلهایی مانند BitNet با استفاده از وزنهای محدود به سه مقدار (-1، 0، 1)، مصرف حافظه را به شکل چشمگیری کاهش داده و سرعت اجرای برنامهها را افزایش میدهند. به گزارش تککرانچ، BitNet b1.58 2B4T با 2 میلیارد پارامتر و آموزش روی مجموعه دادهای عظیم شامل 4 تریلیون توکن (معادل حدود 33 میلیون کتاب)، نمونهای برجسته از این فناوری است.
عملکرد خیرهکننده در رقابت
آزمایشهای انجامشده نشان میدهد که BitNet b1.58 2B4T در آزمونهایی مانند GSM8K (ریاضی ابتدایی) و PIQA (منطق فیزیکی) عملکرد بهتری نسبت به رقبایی نظیر Llama 3.2 1B (متا)، Gemma 3 1B (گوگل) و Qwen 2.5 1.5B (علیبابا) داشته است. مایکروسافت اعلام کرده که این مدل تا 2 برابر سریعتر از مدلهای مشابه عمل میکند و در عین حال، تنها کسری از حافظه موردنیاز سایر مدلها را مصرف میکند.
چالشها و محدودیتها
با وجود مزایای قابلتوجه، استفاده از BitNet b1.58 2B4T نیازمند فریمورک اختصاصی مایکروسافت، bitnet.cpp، است که در حال حاضر با سختافزارهای محدودی سازگار بوده و از GPUها پشتیبانی نمیکند. این موضوع میتواند مانعی برای گسترش استفاده از این مدل در کاربردهای گستردهتر باشد.
چشمانداز آینده
مایکروسافت با این مدل نهتنها به دنبال بازتعریف استانداردهای هوش مصنوعی کممصرف است، بلکه با ارائه آن بهصورت متنباز، توسعهدهندگان سراسر جهان را به مشارکت در این فناوری نوآورانه دعوت میکند. هرچند چالشهای سختافزاری همچنان باقی است، اما BitNet b1.58 2B4T نویدبخش آیندهای است که هوش مصنوعی قدرتمند در دسترس دستگاههای روزمره قرار خواهد گرفت.
نویسنده علیرضا ناجی
سایر مقالات نویسندهعلیرضا ناجی، فعال حوزه سئو و اسکیما میباشد. وی در زمینه تحقیق و ترجمه مقالات و آموزش حوزه فناوری اطلاعات، سئو و اسکیمای حرفه ای، بازی های رایانه ای و شبکه های اجتماعی فعالیت میکند و جدیدترین عناوین را به صورت محتوی غنی منتشر مینماید.