محققان در حوزه هوش مصنوعی، مجموعهی جدیدی از مدل هوش مصنوعی با نام Seamless Communication توسعه دادهاند که هدف آن ایجاد ارتباط طبیعی و بهتر بین زبانهاست و اساساً مفهوم مترجم جهانی گفتار را به واقعیت میپیوندد.
مدل Seamless، قابلیتهای سه مدل دیگر این شرکت یعنی SeamlessExpressive، SeamlessStreaming و SeamlessM4T v2 را در یک سیستم یکپارچه ترکیب میکند. طبق ادعای مهندسین پروژه، این هوش مصنوعی اولین سیستم در دسترس عموم است که ارتباطات کلامی بینزبانی را در لحظه فراهم میکند.
Seamless متا از سه مدل شبکه عصبی پیچیده استفاده میکند تا با حفظ سبک آوایی، احساسات و الگوهای صدای گوینده، ترجمه همزمان بیش از 100 زبان گفتاری و نوشتاری را امکانپذیر کند.
در SeamlessExpressive، تمرکز بر حفظ سبک آوا و تفاوتهای احساسی صدای گوینده در هنگام ترجمه قرار دارد. این مدل جلوی مسأله تبدیل متن به گفتار رباتیک و یکنواخت را گرفته و اظهار میکند که “ترجمهها باید ظرافتهای بیان انسان را شامل شوند.” همچنین SeamlessStreaming توانایی ترجمه تقریباً همزمان با دو ثانیه تأخیر را ارائه میدهد و به عنوان اولین مدل چندزبانه معرفی شده است که با چنین سرعتی میتواند ترجمه نزدیک به 100 زبان گفتاری و نوشتاری را ارائه کند.
محققان متا بهطور کلی ادعا میکنند که Seamless با ارائه اساس فنی موردنیاز برای تبدیل مترجم جهانی گفتار به یک فناوری واقعی، میتواند تجربیات چندبُعدی در ارتباطات بینزبانی با ماشین را بهبود بخشد.
نویسنده علیرضا ناجی
سایر مقالات نویسندهعلیرضا ناجی، فعال حوزه سئو و اسکیما میباشد. وی در زمینه تحقیق و ترجمه مقالات و آموزش حوزه فناوری اطلاعات، سئو و اسکیمای حرفه ای، بازی های رایانه ای و شبکه های اجتماعی فعالیت میکند و جدیدترین عناوین را به صورت محتوی غنی منتشر مینماید.