GPT-5.5 از راه رسید؛ هوشمندتر، سریع‌تر و مستقل در انجام کارها

اخبار اینترنت 4 دقیقه زمان مطالعه بروزرسانی در8 اردیبهشت, 1405

شرکت OpenAI از جدیدترین مدل هوش مصنوعی خود با نام GPT-5.5 رونمایی کرد. این مدل که هوشمندترین نسخهٔ خانوادهٔ GPT تا به امروز محسوب می‌شود، به‌گونه‌ای طراحی

شرکت OpenAI از جدیدترین مدل هوش مصنوعی خود با نام GPT-5.5 رونمایی کرد. این مدل که هوشمندترین نسخهٔ خانوادهٔ GPT تا به امروز محسوب می‌شود، به‌گونه‌ای طراحی شده تا علاوه بر پاسخ به پرسش‌های پیچیده، وظایف چندمرحله‌ای را به‌صورت مستقل برنامه‌ریزی و اجرا کند.

برخلاف نسل‌های قبلی که عمدتاً بر تولید متن متمرکز بودند، GPT-5.5 یک گام بلند به سوی «ایجنت‌های هوشمند» برداشته است؛ سیستمی که می‌تواند ابزارها را انتخاب کند، بین نرم‌افزارهای مختلف جابه‌جا شود و خروجی کار خود را بررسی و اصلاح کند.

عملکرد در بنچمارک‌های کلیدی

GPT-5.5 در آزمون‌های تخصصی، پیشرفت محسوسی نسبت به نسخهٔ قبلی نشان داده است:

برنامه‌نویسی: امتیاز ۸۲.۷٪ در Terminal-Bench 2.0 (نسبت به ۷۵.۱٪ نسخهٔ قبل) و ۷۳.۱٪ در آزمون Expert-SWE که وظایف برنامه‌نویسی طولانی‌مدت را می‌سنجد
کارهای دانش‌محور: امتیاز ۸۴.۹٪ در GDPval که توانایی انجام وظایف تخصصی در ۴۴ شغل مختلف را ارزیابی می‌کند
تعامل با کامپیوتر: امتیاز ۷۸.۷٪ در OSWorld-Verified که کار با محیط‌های واقعی نرم‌افزاری را می‌سنجد
تحقیقات علمی: عملکرد ۲۵٪ در GeneBench (تحلیل داده‌های ژنتیکی) که ۶٪ بهتر از نسخهٔ قبلی است. نسخهٔ Pro نیز به ۳۳.۲٪ رسیده است

کاربردهای واقعی در محیط‌های سازمانی

OpenAI در گزارش‌های خود به بررسی عملکرد مدل فوق در دنیای واقعی پرداخته است. تیم مالی این شرکت با استفاده از GPT-5.5 توانست بیش از ۲۴ هزار فرم مالیاتی (حدود ۷۱ هزار صفحه) را بررسی و این فرآیند را دو هفته سریع‌تر از سال قبل به پایان برساند. همچنین تیم ارتباطات OpenAI از این مدل برای تحلیل شش ماه داده‌های درخواست سخنرانی و طراحی چارچوب ارزیابی ریسک استفاده کرده که نتایج درخشانی به همراه داشته است.

در حوزهٔ برنامه‌نویسی نیز GPT-5.5 می‌تواند یک ماژول معیوب را به‌طور کامل بازنویسی کند، صدها تغییر را در شاخه‌های مختلف کد ادغام نماید و بدون راهنمایی قبلی، محل دقیق اشکال را تشخیص دهد.

کارایی و سرعت

در وظایف برنامه‌نویسی، GPT-5.5 بدون کاهش سرعت نسبت به نسل قبلی، توکن بسیار کمتری مصرف می‌کند. علاوه‌بر این کاربران می‌توانند در مواقع ضروری، حالت سریع (Fast Mode) را فعال کنند تا با حفظ بودجه مصرفی، متن خروجی را با سرعت ۱.۵ برابر تولید می‌کند.

این مدل از نظر ظرفیت پردازش نیز قدرتمندتر شده است. نسخهٔ مخصوص توسعه‌دهندگان (API) می‌تواند تا یک میلیون توکن را در یک درخواست پردازش کند؛ یعنی قادر است یک کتاب چندصد صفحه‌ای را یکجا دریافت و خروجی نهایی را آماده کند. نسخهٔ Codex این پلتفرم هم که اختصاصا برای برنامه‌نویسی طراحی شده، از پنجرهٔ ۴۰۰ هزار توکن پشتیبانی می‌کند که در نوع پیشرفت قابل توجهی محسوب می‌شود.

ایمنی در GPT-5.5

OpenAI اعلام کرده که GPT-5.5 با قوی‌ترین لایه‌های حفاظتی این شرکت تا به امروز عرضه شده است. این مدل پیش از انتشار، تحت ارزیابی‌های تخصصی در حوزه‌های حساس از جمله امنیت سایبری، زیست‌شناسی و شیمی قرار گرفته و عملکرد آن در چارچوب آمادگی OpenAI در سطح «بالا» رده‌بندی شده است.

همچنین دسته‌بندی‌کننده‌های سخت‌گیرانه‌ای برای محدود کردن درخواست‌های پر0ریسک در آن تعبیه شده و دسترسی به مدل برای کاربردهای حساس، تنها از طریق سازوکار احراز هویت (Trusted Access) امکان‌پذیر است. OpenAI تأکید کرده که عرضهٔ API این مدل نیز نیازمند اقدامات حفاظتی متفاوتی بوده و تیم این شرکت در حال همکاری نزدیک با شرکا و مشتریان برای ارائهٔ امن و مقیاس‌پذیر آن است.

مهم‌ترین ویژگی‌های GPT-5.5

هوشمندترین مدل OpenAI تا امروز: درک سریع‌تر از هدف کاربر و نیاز کمتر به توضیح گام‌به‌گام
اجرای مستقل وظایف چندمرحله‌ای: برنامه‌ریزی، استفاده از ابزار، بررسی خروجی و جابه‌جایی بین نرم‌افزارها بدون دخالت کاربر
عملکرد برتر در برنامه‌نویسی: توانایی بازنویسی کامل یک ماژول معیوب و ادغام صدها تغییر در شاخه‌های مختلف کد
تحلیل اسناد حجیم: بررسی ۲۴ هزار فرم مالیاتی در ۷۱ هزار صفحه، دو هفته سریع‌تر از انسان
کارایی بالاتر با مصرف توکن کمتر: کاهش چشمگیر مصرف توکن در وظایف برنامه‌نویسی، با سرعت برابر با GPT-5.4
پنجرهٔ متنی یک میلیون توکن: در نسخهٔ API، مناسب برای تحلیل اسناد بلند و پروژه‌های بزرگ
حالت سریع: تولید توکن با سرعت ۱.۵ برابر برای کارهای فوری
نسخهٔ Pro برای کارهای پیچیده‌تر: دقت بالاتر در ریاضیات پیشرفته و تحلیل‌های تخصصی
قوی‌ترین لایه‌های امنیتی: ارزیابی‌شده برای ریسک‌های سایبری، بیولوژیکی و شیمیایی

قیمت‌گذاری و دسترسی

GPT-5.5 از امروز به‌صورت تدریجی برای کاربران Plus، Pro، Business و Enterprise در ChatGPT و Codex عرضه می‌شود. قیمت API برای توسعه‌دهندگان، ۵ دلار به ازای هر یک میلیون توکن ورودی و ۳۰ دلار برای خروجی تعیین شده است. نسخهٔ Pro نیز با قیمت ۳۰ دلار برای ورودی و ۱۸۰ دلار برای خروجی ارائه می‌شود.

با معرفی GPT-5.5، به‌نظر می‌رسد رقابت در صنعت هوش مصنوعی از نمایش توانایی‌ها در بنچمارک‌ها عبور کرده و به سمت ارائهٔ عملکرد واقعی در انجام کارها حرکت کرده است. توانایی این مدل در بازنویسی خودکار ماژول‌های معیوب، تحلیل ده‌ها هزار صفحه سند مالی، بررسی ریسک پروژه‌ها و مدیریت هم‌زمان چند ابزار، نشان می‌دهد که صنعت هوش مصنوعی دیگر فقط یک ابزار کمکی نیست.

این مدل را می‌توان آغازگر نسلی از دستیارهای اجرایی دانست که به‌جای پاسخ دادن به پرسش‌ها، مسئولیت کامل یک وظیفه را از ابتدا تا انتها بر عهده می‌گیرند. همان نسلی که مدیرعامل گوگل نیز با اشاره به آن، چشم‌انداز روشنی از آغاز عصر ایجنتیک در محصولات گوگل، ترسیم کرد.