کنفرانس Google I/O 2025 با شعار “از پژوهش به واقعیت” (From Research to Reality) برگزار شد. گوگل در این رویداد بر تبدیل دستاوردهای تحقیقاتی هوش مصنوعی به ابزارهای کاربردی و قابلدسترس برای کاربران و توسعهدهندگان تأکید داشت.
سوندار پیچای، مدیرعامل گوگل، در سخنرانی افتتاحیه اعلام کرد که این شرکت با رویکرد “AI-first”، هوش مصنوعی را به نیروی محرکه تمامی محصولات و نوآوریهای خود تبدیل کرده است. این تغییر پارادایم، جستجو را از محصول اصلی گوگل به یکی از نمودهای توانمندیهای هوش مصنوعی این شرکت تبدیل کرده و نشاندهنده عزم گوگل برای رهبری در عصر هوش مصنوعی است.

ظهور نسل جدید دستیارهای هوش مصنوعی
هوش مصنوعی مولد و دستیارهای هوشمند پیشرفته، ستارگان اصلی کنفرانس بودند. گوگل با نمایش دموهای متعدد، قابلیتهای دستیارهای هوش مصنوعی خود را در انجام وظایف پیچیده، از رزرو سفر تا پژوهشهای چندمرحلهای به نمایش گذاشت.
پروژههایی مانند Project Mariner (یک ایجنت پژوهشی برای انجام وظایف وبمحور) و Agent Mode در اپلیکیشن Gemini، نشاندهنده حرکت گوگل بهسوی دستیارهای هوشمندی است که بهصورت فعال و مستقل به کاربران کمک میکنند.

Gemini Live: دستیار صوتی رایگان و چندوجهی
Gemini Live، دستیار صوتی پیشرفته گوگل، اکنون بهصورت رایگان برای همه کاربران در دسترس است. این ابزار با قابلیتهایی مانند استفاده از دوربین گوشی برای تحلیل محیط و اشتراکگذاری صفحه نمایش، تجربهای تعاملی و پویا ارائه میدهد. گسترش این قابلیت به پلتفرم iOS و ادغام ویژگیهای Project Astra، از جمله تحلیل بصری پیشرفته، نشاندهنده تلاش گوگل برای رقابت با سایر دستیارهای صوتی مطرح بازار است.

AI Mode: جستجوی هوشمند و چندوجهی
گوگل با معرفی AI Mode در موتور جستجوی خود، تجربه جستجو را به سطحی جدید ارتقا داد. این حالت، پاسخهایی جامع و محاورهای به سوالات پیچیده ارائه میدهد و با تحلیل منابع متنوع، از ارائه اطلاعات نادرست جلوگیری میکند.
قابلیت AI Mode از همان زمان برگزاری کنفرانس در منطقه آمریکا فعال شده و با پشتیبانی از Gemini 2.5، قابلیتهایی مانند خلاصهسازی هوشمند، تحلیل دادهها و تولید نمودار را ارائه میدهد.

Search Live: جستجوی بصری با Project Astra
Search Live، که تابستان ۲۰۲۵ عرضه خواهد شد، با بهرهگیری از Project Astra، امکان جستجوی تعاملی و بصری با استفاده از دوربین گوشی را فراهم میکند. این قابلیت، با کمرنگ کردن مرز بین دنیای فیزیکی و دیجیتال، کاربردهایی در آموزش، خرید آنلاین و گردشگری دارد.
بهروزرسانیهای Gemini 2.5 Pro و Flash
گوگل از بهروزرسانیهای چشمگیر مدلهای Gemini 2.5 Pro و Flash رونمایی کرد که عملکرد بهتری در کدنویسی، استدلال پیچیده و بهینهسازی سرعت و هزینه دارند. حالت Deep Think در Gemini 2.5 Pro، با بررسی چندین فرضیه قبل از ارائه پاسخ، برای حل مسائل پیچیده مانند ریاضیات پیشرفته و کدنویسی طراحی شده و در بنچمارکهای معتبر مانند UAMO رکوردشکنی کرده است.
خروجی صوتی بومی و چندوجهی
مدلهای Gemini اکنون از خروجی صوتی بومی پشتیبانی میکنند که امکان تولید گفتار طبیعی با کنترل دقیق لحن و احساسات را فراهم میآورد. پشتیبانی از چند گوینده و تغییر زبان یکپارچه در ۲۴ زبان، این مدلها را برای کاربردهای محاورهای و چندرسانهای ایدهآل میکند.

ابزارهای توسعهدهندگان: Thinking Budgets و Thought Summaries
گوگل با معرفی Thinking Budgets و Thought Summaries، ابزارهایی برای کنترل هزینهها و شفافسازی فرآیند استدلال مدلهای Gemini ارائه کرد. این ویژگیها، توسعه اپلیکیشنهای هوشمند را برای توسعهدهندگان آسانتر و کارآمدتر میکنند.

اشتراکهای جدید Google AI: Pro و Ultra
گوگل دو سطح اشتراک جدید معرفی کرد: Google AI Pro (۱۹.۹۹ دلار در ماه) و Google AI Ultra (۲۴۹.۹۹ دلار در ماه با تخفیف اولیه). طرح Pro شامل دسترسی به Gemini 2.5 Pro، ابزارهای فیلمسازی Flow و ۲ ترابایت فضای ذخیرهسازی است. طرح Ultra، برای کاربران حرفهای، امکاناتی مانند Veo 3، Project Mariner و ۳۰ ترابایت فضای ذخیرهسازی را ارائه میدهد.

تولید محتوای چندرسانهای: Imagen 4، Veo 3 و Google Flow
Imagen 4: تولید تصویر با رندر دقیق متن
Imagen 4 با توانایی رندر دقیق متن در تصاویر و کیفیت بصری بهبودیافته، برای طراحی گرافیک و تبلیغات ایدهآل است. این مدل در پلتفرم Google Flow ادغام شده است.
Veo 3: ویدیوهای واقعگرایانه با صدای بومی
Veo 3 با قابلیت تولید صدای بومی، ویدیوهایی با کیفیت سینمایی و افکتهای صوتی یکپارچه تولید میکند. این مدل نیز در Google Flow ادغام شده و برای مشترکین Ultra در دسترس است.
Google Flow: پلتفرم فیلمسازی خلاقانه
Google Flow، ابزار جامع فیلمسازی، با ترکیب مدلهای Veo، Imagen و Gemini، به خالقان محتوا امکان تولید ویدیوهای حرفهای را میدهد. این پلتفرم با ابزارهای پیشرفته مانند Scenebuilder، فرآیند فیلمسازی را دموکراتیزه میکند.
NotebookLM: هوشمندتر شده است
NotebookLM با قابلیتهای جدید مانند خلاصهسازی ویدیویی و صوتی، به ابزاری قدرتمند برای پژوهشگران و روزنامهنگاران تبدیل شده است. کاربران میتوانند از طریق نقشههای ذهنی و بخشهای پرسش و پاسخ، اطلاعات را بهسرعت تحلیل کنند.

اندروید و اکوسیستم آن: نوآوریهای XR و Wear OS
گوگل با معرفی Android XR و همکاری با سامسونگ برای هدست Project Moohan، به رقابت با Apple Vision Pro وارد شده است. عینکهای هوشمند مجهز به Gemini، قابلیتهایی مانند مسیریابی واقعیت افزوده و مدیریت نوتیفیکیشنها را ارائه میدهند.
Wear OS 6 و Material 3 Expressive
Wear OS 6 با زبان طراحی Material 3 Expressive و ادغام Gemini، تجربهای پویاتر برای دستگاههای پوشیدنی ارائه میدهد. اندروید ۱۶ نیز با رابط کاربری دسکتاپ و یکپارچگی عمیقتر با هوش مصنوعی معرفی شد.
ابزارهای توسعهدهندگان: توانمندسازی نوآوری
گوگل ابزارهای جدیدی مانند Gemini API، ML Kit GenAI، Firebase AI Logic و AI Edge Portal را معرفی کرد. همچنین، مدلهای متنباز Gemma با نسخههای تخصصی مانند MedGemma، SignGemma و DolphinGemma گسترش یافتند.

Google Beam و SynthID: نوآوریهای فراتر از نرمافزار
Google Beam: تماسهای ویدیویی سهبعدی
Google Beam (پروژه سابق Starline) با تبدیل ویدیوهای دوبعدی به سهبعدی و ترجمه همزمان گفتار، تجربهای بینظیر در ارتباطات ویدیویی ارائه میدهد.
SynthID Detector: مقابله با اطلاعات نادرست
SynthID Detector، ابزاری برای تشخیص محتوای تولیدشده توسط هوش مصنوعی، به افزایش شفافیت و اعتماد در فضای آنلاین کمک میکند.
امنیت و حریم خصوصی: اولویت گوگل
گوگل با بهروزرسانیهایی مانند مدیریت خودکار رمزهای عبور در کروم و پادمانهای امنیتی پیشرفته در مدلهای Gemini، تعهد خود به حفاظت از دادههای کاربران را نشان داد.

همکاریهای استراتژیک: خودرو و عینکهای هوشمند
گوگل با ولوو برای ادغام Gemini در خودروها و با برندهای عینکسازی مانند Gentle Monster برای توسعه عینکهای Android XR همکاری میکند.