گوگل چند وقتی است که بهسمت توسعه مدل زبانی جدیدی پیش میرود که قرار است با کمک فناوری هوش مصنوعی بتواند 1000 زبان مختلف دنیا را بفهمد. این شرکت حالا اطلاعاتی را درباره یک مدل هوش مصنوعی به اشتراک گذاشته که اولین گام مهم برای حرکت در مسیر دستیابی به این هدف بزرگ است.
گوگل در پست جدیدی در وبلاگ خود اطلاعاتی را درباره مدل گفتار جهانی (USM) به اشتراک گذاشته که درواقع خانوادهای از پیشرفتهترین مدلهای گفتاری با بیش از 2 میلیارد پارامتر است. این مدل با 12 میلیون ساعت داده گفتاری و 28 میلیارد جمله از 300 زبان آموزش داده شده و فعلاً میتواند 100 زبان را متوجه شود.
مدل گفتار جهانی که یوتوب هم برای تولید زیرنویس از آن استفاده میکند، از فناوری تشخیص گفتار خودکار (ASR) بهره میبرد. این فناوری قادر است زبانهایی مثل انگلیسی، ماندارین، امهری، سبوانو، آسامی و غیره را شناسایی و ترجمه کند.
هوش مصنوعی زبانی گوگل توسعه پیدا خواهد کرد
مدل USM بهعنوان زیربنایی برای ساخت یک سیستم گستردهتر استفاده خواهد شد که هدف نهایی گوگل است. در گزارشها پیشبینی شده که این شرکت در کنفرانس توسعهدهندگان آتی خود از 20 محصول با هوش مصنوعی پرده بردارد و این مدل هم میتواند بخشی از این محصولات جدید باشد.
بااینحال، یکی از مقاصد احتمالی برای استفاده از مدلهای زبانی به حوزه عینکهای واقعیت افزوده مربوط میشود. این شرکت در رویداد I/O قبلی خود دمویی از یک عینک هوشمند را به نمایش گذاشت که قادر بود بهصورت آنی حرفهای طرف مقابل را به زبان قابلفهم برای کاربر ترجمه کند.
البته از آن زمان تاکنون خبر دیگری در این رابطه منتشر نشده است و بهنظر میرسد که هنوز فاصله زیادی تا عرضه این ویژگی در دنیای واقعی داشته باشیم. گفتنی است که متا هم روی ابزارهای مشابهی برای ترجمه با هوش مصنوعی کار میکند که هنوز در مراحل اولیه توسعه قرار دارند.
نویسنده علیرضا ناجی
سایر مقالات نویسندهعلیرضا ناجی، فعال حوزه سئو و اسکیما میباشد. وی در زمینه تحقیق و ترجمه مقالات و آموزش حوزه فناوری اطلاعات، سئو و اسکیمای حرفه ای، بازی های رایانه ای و شبکه های اجتماعی فعالیت میکند و جدیدترین عناوین را به صورت محتوی غنی منتشر مینماید.