همراه اول در نمایشگاه الکامپ ۱۴۰۳ از سه مدل زبانی بزرگ (LLM) فارسی به نامهای سیلک، آهوران و آوا رونمایی کرد. این مدلها که توسط شرکت MCINEXT گروه همراه اول توسعه یافتهاند، برای ارتقای خدمات مختلف این اپراتور، از جمله چتباتها، سیستمهای هوشمند پاسخگویی به مشتریان و تولید محتوای متنی، به کار گرفته خواهند شد.
به گفته مدیر ارشد فناوری MCINEXT، یکی از اهداف اصلی این پروژه، کاهش هزینههای عملیاتی مرتبط با خدمات ارتباط با مشتریان و گزارشگیری است. چتباتی که با استفاده از این مدلها توسعه یافته، به کاربران امکان میدهد تا بدون نیاز به تماس با مرکز تماس، به سوالات خود پاسخ دهند. این چتبات هماکنون از طریق شماره ۹۹۹۰ و گزینه ۳ قابل دسترس است.
MCINEXT پیش از این نیز در زمینه توسعه چتبات برای سازمانهایی مانند آموزش و پرورش و جهاد دانشگاهی تجربه داشته است.
مدلهای زبانی بزرگ فارسی همراه اول با استفاده از دو روش توسعه یافتهاند: آموزش LLM از پایه با استفاده از حجم زیاد دادههای فارسی و یا افزودن لایههای جدید به LLMهای متنباز موجود و سفارشیسازی آنها.
همراه اول در حال حاضر سه مدل زبانی بزرگ فارسی را ارائه میدهد:
- سیلک: این مدل از پایه با استفاده از دادگان اختصاصی فارسی آموزش داده شده است.
- آهوران: این مدل با یادگیری پیوسته و بهروزرسانی با دادههای جدید، قابلیتهای خود را ارتقا میدهد.
- آوا: این مدل برای وظایف خاص و بهرهبرداری بهینه از مدلهای پیشآموزشدیده تنظیم شده است.

اهمیت توسعه مدلهای زبان بومی و تاثیر آنها بر زبان فارسی
مدلهای زبان بومی، سیستمهای هوش مصنوعی هستند که بر روی حجم عظیمی از دادههای زبانی یک زبان خاص آموزش دیدهاند. این مدلها میتوانند متن تولید کنند، زبانها را ترجمه کنند، به سوالات پاسخ دهند و انواع دیگر وظایف را به زبان مورد نظر انجام دهند.
توسعه مدلهای زبان بومی از اهمیت بالایی برخوردار است زیرا:
- بهبود دسترسی به اطلاعات: مدلهای زبان بومی میتوانند به افراد در دسترسی به اطلاعات به زبان خود کمک کنند. این امر برای افرادی که به زبانهای رایج مانند انگلیسی مسلط نیستند، به خصوص مهم است.
- حفظ فرهنگ: مدلهای زبان بومی میتوانند برای حفظ فرهنگ و زبانهای در معرض خطر استفاده شوند. با جمعآوری و پردازش حجم عظیمی از متن به زبان مورد نظر، این مدلها میتوانند به حفظ دانش زبانی و تشویق استفاده از آن در نسلهای آینده کمک کنند.
- ایجاد نوآوری در فناوری: مدلهای زبان بومی میتوانند برای توسعه ابزارها و خدمات جدید در حوزه فناوری استفاده شوند. به عنوان مثال، میتوان از آنها برای ایجاد موتورهای جستجوی بومی، سیستمهای ترجمه ماشینی دقیقتر و دستیاران مجازی کارآمدتر استفاده کرد.
در ادامه، به برخی از کاربردهای مدلهای زبان بومی در حوزه فناوری اشاره میکنیم:
- موتورهای جستجو: موتورهای جستجوی بومی میتوانند نتایج دقیقتر و مرتبطتری را به کاربران ارائه دهند، به خصوص زمانی که به دنبال اطلاعات به زبان خود باشند.
- وبسایتها: وبسایتها میتوانند از مدلهای زبان بومی برای تولید محتوای متنی به زبانهای مختلف، ترجمه خودکار صفحات وب و ارائه خدمات به مشتریان به زبانهای مختلف استفاده کنند.
- شبکههای اجتماعی: شبکههای اجتماعی میتوانند از مدلهای زبان بومی برای تجزیه و تحلیل احساسات، شناسایی محتوای نامناسب و ارائه پیشنهادات مرتبط به کاربران استفاده کنند.
- دستیاران مجازی: دستیاران مجازی میتوانند با استفاده از مدلهای زبان بومی، دستورات و سوالات کاربران را به زبان خود درک کنند و به آنها پاسخ دهند.
- آموزش: مدلهای زبان بومی میتوانند برای ایجاد تجربیات آموزشی شخصیسازیشده، ارائه بازخورد به دانشآموزان به زبان خود و ترجمه مواد آموزشی به زبانهای مختلف استفاده شوند.

