در جریان رویداد MadeByGoogle 2024، گوگل قابلیتهای جدیدی از مدل زبان جمینای (Gemini) را معرفی کرد که یکی از مهمترین ویژگیهای آن جستجوی چندوجهی (multimodal search) است. منظور از جستجوی چندوجهی، توانایی مدل در پردازش و ترکیب اطلاعات از منابع و اشکال مختلف مانند متن، تصویر، و صدا به طور همزمان است. این ویژگی به کاربران اجازه میدهد تا به روشهای جدید و پیشرفتهای با محتوای وب و دنیای پیرامون تعامل داشته باشند.
به طور خاص، این فناوری به شما امکان میدهد تا از طریق جستجو در محتواهای مختلف، بدون نیاز به تغییر بین برنامهها و یا فرمتهای مختلف به اطلاعات دسترسی پیدا کنید. برای مثال، شما میتوانید عکسی را آپلود و سپس با استفاده از ورودیهای صوتی یا متنی، اطلاعات بیشتری در مورد آن تصویر درخواست کنید. این قابلیتها همچنین به گونهای طراحی شدهاند که بتوانند در طول مکالمات زنده (Live conversations) مورد استفاده قرار گیرند و حتی شما را به طور مستقیم به برنامههای دیگر متصل کنند.
این تحول در نحوه جستجو باعث میشود که کاربران تجربهای غنیتر و یکپارچهتر از جستجو و تعامل با اطلاعات دیجیتال داشته باشند، که میتواند به سرعت بخشیدن به فرایند تحقیق و دسترسی به دادهها کمک کند.
تفاوت اصلی بین جستجوی چندوجهی و جستجوی سنتی گوگل
تفاوت اصلی بین سبک جدید جستجوی چندوجهی گوگل و جستجوی سنتی که از طریق باکس جستجو انجام میشود، در نوع تعامل کاربران با دادهها و نحوه پردازش توسط مدلهای زبان و هوش مصنوعی است.
1. تعامل چندوجهی با دادهها:
جستجوی سنتی: در جستجوی فعلی گوگل، کاربران یک عبارت متنی را در باکس جستجو وارد میکنند و نتایج مرتبطی را دریافت میکنند که بیشتر بر اساس متن و الگوریتمهای جستجوی گوگل تولید میشود. این روش بیشتر به جستجوی کلمات کلیدی متکی است و نتایج آن نیز به همین صورت نمایش داده میشود.
جستجوی چندوجهی: در جستجوی چندوجهی با جمینای، شما میتوانید همزمان از ورودیهای مختلف مثل متن، تصویر، و صدا استفاده کنید. مثلاً میتوانید یک تصویر را آپلود کنید و سپس از مدل بخواهید تا بر اساس این تصویر، توضیحات متنی، تحلیل صدا، یا حتی پیشنهادات مرتبط ارائه دهد. این نوع جستجو ترکیب چندین نوع داده را به صورت همزمان پردازش میکند.
2. پردازش چندگانه و ترکیبی:
جستجوی سنتی: این جستجو به صورت خطی و بر اساس متن ورودی انجام میشود و نتایج هم به شکل لینکها و توضیحات متنی ارائه میشود.
جستجوی چندوجهی: جمینای توانایی ترکیب و پردازش همزمان دادهها از منابع مختلف را دارد. به عنوان مثال، اگر شما یک عکس از یک محصول آپلود کنید، مدل میتواند به شما اطلاعات متنی درباره آن محصول بدهد، نظرات کاربران را بخواند، یا حتی ویدیوهای مرتبط را پیشنهاد کند.
3. تجربه یکپارچه و بلادرنگ:
جستجوی سنتی: کاربر نیاز دارد که بین برنامهها یا ابزارهای مختلف برای جستجوی دادههای مرتبط تغییر کند. مثلاً برای جستجوی یک تصویر، ممکن است نیاز باشد از جستجوی تصویری استفاده کند و سپس به جستجوی متن مراجعه کند.
جستجوی چندوجهی: با جمینای، همه این امکانات به صورت یکپارچه و در یک رابط کاربری فراهم میشود، به طوری که نیازی به جابهجایی بین برنامهها نیست و کاربر میتواند تجربه جستجوی خود را در همان لحظه بهینه کند.
4. تعامل طبیعی و بلادرنگ با هوش مصنوعی:
جستجوی سنتی: بیشتر به پاسخهای آماده و ساختارمند محدود است که از پیش در پایگاه دادهها ذخیره شدهاند.
جستجوی چندوجهی: مدل جمینای به صورت بلادرنگ و با توجه به ورودیهای چندوجهی کاربر پاسخ میدهد و میتواند به طور مداوم بهبود پیدا کند و با کاربر در ارتباط بماند، مثلاً مکالمه زنده با مدل در حال جستجو داشته باشد.
این قابلیتها باعث میشود که جستجوها بسیار سریعتر، دقیقتر و شخصیتر شوند، در حالی که کاربر میتواند با استفاده از دادههای متنوعتر و در فرمتهای مختلف، نتایج مورد نظر خود را به دست آورد.
در جریان رویداد SearchOn 2021 به آغاز عصر تحولات هوش مصنوعی پرداخته شده بود.