گزارش کنفرانس Google I/O 2025: هوش مصنوعی،از پژوهش به واقعیت

اخبار تکنولوژی 5 دقیقه زمان مطالعه بروزرسانی در2 خرداد, 1404

کنفرانس Google I/O 2025 با شعار "از پژوهش به واقعیت" (From Research to Reality) برگزار شد. گوگل در این رویداد بر تبدیل دستاوردهای تحقیقاتی هوش مصنوعی به

کنفرانس Google I/O 2025 با شعار “از پژوهش به واقعیت” (From Research to Reality) برگزار شد. گوگل در این رویداد بر تبدیل دستاوردهای تحقیقاتی هوش مصنوعی به ابزارهای کاربردی و قابل‌دسترس برای کاربران و توسعه‌دهندگان تأکید داشت.

سوندار پیچای، مدیرعامل گوگل، در سخنرانی افتتاحیه اعلام کرد که این شرکت با رویکرد “AI-first”، هوش مصنوعی را به نیروی محرکه تمامی محصولات و نوآوری‌های خود تبدیل کرده است. این تغییر پارادایم، جستجو را از محصول اصلی گوگل به یکی از نمودهای توانمندی‌های هوش مصنوعی این شرکت تبدیل کرده و نشان‌دهنده عزم گوگل برای رهبری در عصر هوش مصنوعی است.

Project Mariner

ظهور نسل جدید دستیارهای هوش مصنوعی

هوش مصنوعی مولد و دستیارهای هوشمند پیشرفته، ستارگان اصلی کنفرانس بودند. گوگل با نمایش دموهای متعدد، قابلیت‌های دستیارهای هوش مصنوعی خود را در انجام وظایف پیچیده، از رزرو سفر تا پژوهش‌های چندمرحله‌ای به نمایش گذاشت.

پروژه‌هایی مانند Project Mariner (یک ایجنت پژوهشی برای انجام وظایف وب‌محور) و Agent Mode در اپلیکیشن Gemini، نشان‌دهنده حرکت گوگل به‌سوی دستیارهای هوشمندی است که به‌صورت فعال و مستقل به کاربران کمک می‌کنند.

google Gemini Live

Gemini Live: دستیار صوتی رایگان و چندوجهی

Gemini Live، دستیار صوتی پیشرفته گوگل، اکنون به‌صورت رایگان برای همه کاربران در دسترس است. این ابزار با قابلیت‌هایی مانند استفاده از دوربین گوشی برای تحلیل محیط و اشتراک‌گذاری صفحه نمایش، تجربه‌ای تعاملی و پویا ارائه می‌دهد. گسترش این قابلیت به پلتفرم iOS و ادغام ویژگی‌های Project Astra، از جمله تحلیل بصری پیشرفته، نشان‌دهنده تلاش گوگل برای رقابت با سایر دستیارهای صوتی مطرح بازار است.

google AI Mode

AI Mode: جستجوی هوشمند و چندوجهی

گوگل با معرفی AI Mode در موتور جستجوی خود، تجربه جستجو را به سطحی جدید ارتقا داد. این حالت، پاسخ‌هایی جامع و محاوره‌ای به سوالات پیچیده ارائه می‌دهد و با تحلیل منابع متنوع، از ارائه اطلاعات نادرست جلوگیری می‌کند.

قابلیت AI Mode از همان زمان برگزاری کنفرانس در منطقه آمریکا فعال شده و با پشتیبانی از Gemini 2.5، قابلیت‌هایی مانند خلاصه‌سازی هوشمند، تحلیل داده‌ها و تولید نمودار را ارائه می‌دهد.

Search Live: جستجوی بصری با Project Astra

Search Live، که تابستان ۲۰۲۵ عرضه خواهد شد، با بهره‌گیری از Project Astra، امکان جستجوی تعاملی و بصری با استفاده از دوربین گوشی را فراهم می‌کند. این قابلیت، با کمرنگ کردن مرز بین دنیای فیزیکی و دیجیتال، کاربردهایی در آموزش، خرید آنلاین و گردشگری دارد.

به‌روزرسانی‌های Gemini 2.5 Pro و Flash

گوگل از به‌روزرسانی‌های چشمگیر مدل‌های Gemini 2.5 Pro و Flash رونمایی کرد که عملکرد بهتری در کدنویسی، استدلال پیچیده و بهینه‌سازی سرعت و هزینه دارند. حالت Deep Think در Gemini 2.5 Pro، با بررسی چندین فرضیه قبل از ارائه پاسخ، برای حل مسائل پیچیده مانند ریاضیات پیشرفته و کدنویسی طراحی شده و در بنچمارک‌های معتبر مانند UAMO رکوردشکنی کرده است.

خروجی صوتی بومی و چندوجهی

مدل‌های Gemini اکنون از خروجی صوتی بومی پشتیبانی می‌کنند که امکان تولید گفتار طبیعی با کنترل دقیق لحن و احساسات را فراهم می‌آورد. پشتیبانی از چند گوینده و تغییر زبان یکپارچه در ۲۴ زبان، این مدل‌ها را برای کاربردهای محاوره‌ای و چندرسانه‌ای ایده‌آل می‌کند.

Thought Summaries

ابزارهای توسعه‌دهندگان: Thinking Budgets و Thought Summaries

گوگل با معرفی Thinking Budgets و Thought Summaries، ابزارهایی برای کنترل هزینه‌ها و شفاف‌سازی فرآیند استدلال مدل‌های Gemini ارائه کرد. این ویژگی‌ها، توسعه اپلیکیشن‌های هوشمند را برای توسعه‌دهندگان آسان‌تر و کارآمدتر می‌کنند.

Google AI Pro

اشتراک‌های جدید Google AI: Pro و Ultra

گوگل دو سطح اشتراک جدید معرفی کرد: Google AI Pro (۱۹.۹۹ دلار در ماه) و Google AI Ultra (۲۴۹.۹۹ دلار در ماه با تخفیف اولیه). طرح Pro شامل دسترسی به Gemini 2.5 Pro، ابزارهای فیلم‌سازی Flow و ۲ ترابایت فضای ذخیره‌سازی است. طرح Ultra، برای کاربران حرفه‌ای، امکاناتی مانند Veo 3، Project Mariner و ۳۰ ترابایت فضای ذخیره‌سازی را ارائه می‌دهد.

Veo 3

تولید محتوای چندرسانه‌ای: Imagen 4، Veo 3 و Google Flow

Imagen 4: تولید تصویر با رندر دقیق متن

Imagen 4 با توانایی رندر دقیق متن در تصاویر و کیفیت بصری بهبودیافته، برای طراحی گرافیک و تبلیغات ایده‌آل است. این مدل در پلتفرم Google Flow ادغام شده است.

Veo 3: ویدیوهای واقع‌گرایانه با صدای بومی

Veo 3 با قابلیت تولید صدای بومی، ویدیوهایی با کیفیت سینمایی و افکت‌های صوتی یکپارچه تولید می‌کند. این مدل نیز در Google Flow ادغام شده و برای مشترکین Ultra در دسترس است.

Google Flow: پلتفرم فیلم‌سازی خلاقانه

Google Flow، ابزار جامع فیلم‌سازی، با ترکیب مدل‌های Veo، Imagen و Gemini، به خالقان محتوا امکان تولید ویدیوهای حرفه‌ای را می‌دهد. این پلتفرم با ابزارهای پیشرفته مانند Scenebuilder، فرآیند فیلم‌سازی را دموکراتیزه می‌کند.

NotebookLM: هوشمندتر شده است

NotebookLM با قابلیت‌های جدید مانند خلاصه‌سازی ویدیویی و صوتی، به ابزاری قدرتمند برای پژوهشگران و روزنامه‌نگاران تبدیل شده است. کاربران می‌توانند از طریق نقشه‌های ذهنی و بخش‌های پرسش و پاسخ، اطلاعات را به‌سرعت تحلیل کنند.

Project Moohan

اندروید و اکوسیستم آن: نوآوری‌های XR و Wear OS

گوگل با معرفی Android XR و همکاری با سامسونگ برای هدست Project Moohan، به رقابت با Apple Vision Pro وارد شده است. عینک‌های هوشمند مجهز به Gemini، قابلیت‌هایی مانند مسیریابی واقعیت افزوده و مدیریت نوتیفیکیشن‌ها را ارائه می‌دهند.

Wear OS 6 و Material 3 Expressive

Wear OS 6 با زبان طراحی Material 3 Expressive و ادغام Gemini، تجربه‌ای پویاتر برای دستگاه‌های پوشیدنی ارائه می‌دهد. اندروید ۱۶ نیز با رابط کاربری دسکتاپ و یکپارچگی عمیق‌تر با هوش مصنوعی معرفی شد.

ابزارهای توسعه‌دهندگان: توانمندسازی نوآوری

گوگل ابزارهای جدیدی مانند Gemini API، ML Kit GenAI، Firebase AI Logic و AI Edge Portal را معرفی کرد. همچنین، مدل‌های متن‌باز Gemma با نسخه‌های تخصصی مانند MedGemma، SignGemma و DolphinGemma گسترش یافتند.

Google Beam و SynthID: نوآوری‌های فراتر از نرم‌افزار

Google Beam: تماس‌های ویدیویی سه‌بعدی

Google Beam (پروژه سابق Starline) با تبدیل ویدیوهای دوبعدی به سه‌بعدی و ترجمه همزمان گفتار، تجربه‌ای بی‌نظیر در ارتباطات ویدیویی ارائه می‌دهد.

SynthID Detector: مقابله با اطلاعات نادرست

SynthID Detector، ابزاری برای تشخیص محتوای تولیدشده توسط هوش مصنوعی، به افزایش شفافیت و اعتماد در فضای آنلاین کمک می‌کند.

امنیت و حریم خصوصی: اولویت گوگل

گوگل با به‌روزرسانی‌هایی مانند مدیریت خودکار رمزهای عبور در کروم و پادمان‌های امنیتی پیشرفته در مدل‌های Gemini، تعهد خود به حفاظت از داده‌های کاربران را نشان داد.

Gentle Monster