zhaket logo

آینده جستجو در وب با فناوری های multi-modal experience در Gemini Live

اخبار تکنولوژی

3 دقیقه زمان مطالعه

در جریان رویداد MadeByGoogle 2024، گوگل قابلیت‌های جدیدی از مدل زبان جمینای (Gemini) را معرفی کرد که یکی از مهم‌ترین ویژگی‌های آن جستجوی چندوجهی (multimodal search) است. منظور از جستجوی چندوجهی، توانایی مدل در پردازش و ترکیب اطلاعات از منابع و اشکال مختلف مانند متن، تصویر، و صدا به طور همزمان است. این ویژگی به کاربران اجازه می‌دهد تا به روش‌های جدید و پیشرفته‌ای با محتوای وب و دنیای پیرامون تعامل داشته باشند.

به طور خاص، این فناوری به شما امکان می‌دهد تا از طریق جستجو در محتواهای مختلف، بدون نیاز به تغییر بین برنامه‌ها و یا فرمت‌های مختلف به اطلاعات دسترسی پیدا کنید. برای مثال، شما می‌توانید عکسی را آپلود و سپس با استفاده از ورودی‌های صوتی یا متنی، اطلاعات بیشتری در مورد آن تصویر درخواست کنید. این قابلیت‌ها همچنین به گونه‌ای طراحی شده‌اند که بتوانند در طول مکالمات زنده (Live conversations) مورد استفاده قرار گیرند و حتی شما را به طور مستقیم به برنامه‌های دیگر متصل کنند.

این تحول در نحوه جستجو باعث می‌شود که کاربران تجربه‌ای غنی‌تر و یکپارچه‌تر از جستجو و تعامل با اطلاعات دیجیتال داشته باشند، که می‌تواند به سرعت بخشیدن به فرایند تحقیق و دسترسی به داده‌ها کمک کند.

 

 

تفاوت اصلی بین جستجوی چندوجهی و جستجوی سنتی گوگل

تفاوت اصلی بین سبک جدید جستجوی چندوجهی گوگل و جستجوی سنتی که از طریق باکس جستجو انجام می‌شود، در نوع تعامل کاربران با داده‌ها و نحوه پردازش توسط مدل‌های زبان و هوش مصنوعی است.

1. تعامل چندوجهی با داده‌ها:

جستجوی سنتی: در جستجوی فعلی گوگل، کاربران یک عبارت متنی را در باکس جستجو وارد می‌کنند و نتایج مرتبطی را دریافت می‌کنند که بیشتر بر اساس متن و الگوریتم‌های جستجوی گوگل تولید می‌شود. این روش بیشتر به جستجوی کلمات کلیدی متکی است و نتایج آن نیز به همین صورت نمایش داده می‌شود.

جستجوی چندوجهی: در جستجوی چندوجهی با جمینای، شما می‌توانید همزمان از ورودی‌های مختلف مثل متن، تصویر، و صدا استفاده کنید. مثلاً می‌توانید یک تصویر را آپلود کنید و سپس از مدل بخواهید تا بر اساس این تصویر، توضیحات متنی، تحلیل صدا، یا حتی پیشنهادات مرتبط ارائه دهد. این نوع جستجو ترکیب چندین نوع داده را به صورت همزمان پردازش می‌کند.

2. پردازش چندگانه و ترکیبی:

جستجوی سنتی: این جستجو به صورت خطی و بر اساس متن ورودی انجام می‌شود و نتایج هم به شکل لینک‌ها و توضیحات متنی ارائه می‌شود.

جستجوی چندوجهی: جمینای توانایی ترکیب و پردازش همزمان داده‌ها از منابع مختلف را دارد. به عنوان مثال، اگر شما یک عکس از یک محصول آپلود کنید، مدل می‌تواند به شما اطلاعات متنی درباره آن محصول بدهد، نظرات کاربران را بخواند، یا حتی ویدیوهای مرتبط را پیشنهاد کند.

 

 

3. تجربه یکپارچه و بلادرنگ:

جستجوی سنتی: کاربر نیاز دارد که بین برنامه‌ها یا ابزارهای مختلف برای جستجوی داده‌های مرتبط تغییر کند. مثلاً برای جستجوی یک تصویر، ممکن است نیاز باشد از جستجوی تصویری استفاده کند و سپس به جستجوی متن مراجعه کند.

جستجوی چندوجهی: با جمینای، همه این امکانات به صورت یکپارچه و در یک رابط کاربری فراهم می‌شود، به طوری که نیازی به جابه‌جایی بین برنامه‌ها نیست و کاربر می‌تواند تجربه جستجوی خود را در همان لحظه بهینه کند.

4. تعامل طبیعی و بلادرنگ با هوش مصنوعی:

جستجوی سنتی: بیشتر به پاسخ‌های آماده و ساختارمند محدود است که از پیش در پایگاه داده‌ها ذخیره شده‌اند.

جستجوی چندوجهی: مدل جمینای به صورت بلادرنگ و با توجه به ورودی‌های چندوجهی کاربر پاسخ می‌دهد و می‌تواند به طور مداوم بهبود پیدا کند و با کاربر در ارتباط بماند، مثلاً مکالمه زنده با مدل در حال جستجو داشته باشد.

این قابلیت‌ها باعث می‌شود که جستجوها بسیار سریع‌تر، دقیق‌تر و شخصی‌تر شوند، در حالی که کاربر می‌تواند با استفاده از داده‌های متنوع‌تر و در فرمت‌های مختلف، نتایج مورد نظر خود را به دست آورد.

در جریان رویداد SearchOn 2021 به آغاز عصر تحولات هوش مصنوعی پرداخته شده بود.


تحریریه ژاکت

مشاهده تیم تحریریه

0

دیدگاه ها

ارسال دیدگاه

ارسال دیدگاه