شرکت OpenAI از جدیدترین مدل هوش مصنوعی خود با نام GPT-5.5 رونمایی کرد. این مدل که هوشمندترین نسخهٔ خانوادهٔ GPT تا به امروز محسوب میشود، بهگونهای طراحی شده تا علاوه بر پاسخ به پرسشهای پیچیده، وظایف چندمرحلهای را بهصورت مستقل برنامهریزی و اجرا کند.
برخلاف نسلهای قبلی که عمدتاً بر تولید متن متمرکز بودند، GPT-5.5 یک گام بلند به سوی «ایجنتهای هوشمند» برداشته است؛ سیستمی که میتواند ابزارها را انتخاب کند، بین نرمافزارهای مختلف جابهجا شود و خروجی کار خود را بررسی و اصلاح کند.
عملکرد در بنچمارکهای کلیدی
GPT-5.5 در آزمونهای تخصصی، پیشرفت محسوسی نسبت به نسخهٔ قبلی نشان داده است:
-
برنامهنویسی: امتیاز ۸۲.۷٪ در Terminal-Bench 2.0 (نسبت به ۷۵.۱٪ نسخهٔ قبل) و ۷۳.۱٪ در آزمون Expert-SWE که وظایف برنامهنویسی طولانیمدت را میسنجد
-
کارهای دانشمحور: امتیاز ۸۴.۹٪ در GDPval که توانایی انجام وظایف تخصصی در ۴۴ شغل مختلف را ارزیابی میکند
-
تعامل با کامپیوتر: امتیاز ۷۸.۷٪ در OSWorld-Verified که کار با محیطهای واقعی نرمافزاری را میسنجد
-
تحقیقات علمی: عملکرد ۲۵٪ در GeneBench (تحلیل دادههای ژنتیکی) که ۶٪ بهتر از نسخهٔ قبلی است. نسخهٔ Pro نیز به ۳۳.۲٪ رسیده است
کاربردهای واقعی در محیطهای سازمانی
OpenAI در گزارشهای خود به بررسی عملکرد مدل فوق در دنیای واقعی پرداخته است. تیم مالی این شرکت با استفاده از GPT-5.5 توانست بیش از ۲۴ هزار فرم مالیاتی (حدود ۷۱ هزار صفحه) را بررسی و این فرآیند را دو هفته سریعتر از سال قبل به پایان برساند. همچنین تیم ارتباطات OpenAI از این مدل برای تحلیل شش ماه دادههای درخواست سخنرانی و طراحی چارچوب ارزیابی ریسک استفاده کرده که نتایج درخشانی به همراه داشته است.
در حوزهٔ برنامهنویسی نیز GPT-5.5 میتواند یک ماژول معیوب را بهطور کامل بازنویسی کند، صدها تغییر را در شاخههای مختلف کد ادغام نماید و بدون راهنمایی قبلی، محل دقیق اشکال را تشخیص دهد.
کارایی و سرعت
در وظایف برنامهنویسی، GPT-5.5 بدون کاهش سرعت نسبت به نسل قبلی، توکن بسیار کمتری مصرف میکند. علاوهبر این کاربران میتوانند در مواقع ضروری، حالت سریع (Fast Mode) را فعال کنند تا با حفظ بودجه مصرفی، متن خروجی را با سرعت ۱.۵ برابر تولید میکند.
این مدل از نظر ظرفیت پردازش نیز قدرتمندتر شده است. نسخهٔ مخصوص توسعهدهندگان (API) میتواند تا یک میلیون توکن را در یک درخواست پردازش کند؛ یعنی قادر است یک کتاب چندصد صفحهای را یکجا دریافت و خروجی نهایی را آماده کند. نسخهٔ Codex این پلتفرم هم که اختصاصا برای برنامهنویسی طراحی شده، از پنجرهٔ ۴۰۰ هزار توکن پشتیبانی میکند که در نوع پیشرفت قابل توجهی محسوب میشود.
ایمنی در GPT-5.5
OpenAI اعلام کرده که GPT-5.5 با قویترین لایههای حفاظتی این شرکت تا به امروز عرضه شده است. این مدل پیش از انتشار، تحت ارزیابیهای تخصصی در حوزههای حساس از جمله امنیت سایبری، زیستشناسی و شیمی قرار گرفته و عملکرد آن در چارچوب آمادگی OpenAI در سطح «بالا» ردهبندی شده است.
همچنین دستهبندیکنندههای سختگیرانهای برای محدود کردن درخواستهای پر0ریسک در آن تعبیه شده و دسترسی به مدل برای کاربردهای حساس، تنها از طریق سازوکار احراز هویت (Trusted Access) امکانپذیر است. OpenAI تأکید کرده که عرضهٔ API این مدل نیز نیازمند اقدامات حفاظتی متفاوتی بوده و تیم این شرکت در حال همکاری نزدیک با شرکا و مشتریان برای ارائهٔ امن و مقیاسپذیر آن است.
مهمترین ویژگیهای GPT-5.5
-
هوشمندترین مدل OpenAI تا امروز: درک سریعتر از هدف کاربر و نیاز کمتر به توضیح گامبهگام
-
اجرای مستقل وظایف چندمرحلهای: برنامهریزی، استفاده از ابزار، بررسی خروجی و جابهجایی بین نرمافزارها بدون دخالت کاربر
-
عملکرد برتر در برنامهنویسی: توانایی بازنویسی کامل یک ماژول معیوب و ادغام صدها تغییر در شاخههای مختلف کد
-
تحلیل اسناد حجیم: بررسی ۲۴ هزار فرم مالیاتی در ۷۱ هزار صفحه، دو هفته سریعتر از انسان
-
کارایی بالاتر با مصرف توکن کمتر: کاهش چشمگیر مصرف توکن در وظایف برنامهنویسی، با سرعت برابر با GPT-5.4
-
پنجرهٔ متنی یک میلیون توکن: در نسخهٔ API، مناسب برای تحلیل اسناد بلند و پروژههای بزرگ
-
حالت سریع: تولید توکن با سرعت ۱.۵ برابر برای کارهای فوری
-
نسخهٔ Pro برای کارهای پیچیدهتر: دقت بالاتر در ریاضیات پیشرفته و تحلیلهای تخصصی
-
قویترین لایههای امنیتی: ارزیابیشده برای ریسکهای سایبری، بیولوژیکی و شیمیایی
قیمتگذاری و دسترسی
GPT-5.5 از امروز بهصورت تدریجی برای کاربران Plus، Pro، Business و Enterprise در ChatGPT و Codex عرضه میشود. قیمت API برای توسعهدهندگان، ۵ دلار به ازای هر یک میلیون توکن ورودی و ۳۰ دلار برای خروجی تعیین شده است. نسخهٔ Pro نیز با قیمت ۳۰ دلار برای ورودی و ۱۸۰ دلار برای خروجی ارائه میشود.
با معرفی GPT-5.5، بهنظر میرسد رقابت در صنعت هوش مصنوعی از نمایش تواناییها در بنچمارکها عبور کرده و به سمت ارائهٔ عملکرد واقعی در انجام کارها حرکت کرده است. توانایی این مدل در بازنویسی خودکار ماژولهای معیوب، تحلیل دهها هزار صفحه سند مالی، بررسی ریسک پروژهها و مدیریت همزمان چند ابزار، نشان میدهد که صنعت هوش مصنوعی دیگر فقط یک ابزار کمکی نیست.
این مدل را میتوان آغازگر نسلی از دستیارهای اجرایی دانست که بهجای پاسخ دادن به پرسشها، مسئولیت کامل یک وظیفه را از ابتدا تا انتها بر عهده میگیرند. همان نسلی که مدیرعامل گوگل نیز با اشاره به آن، چشمانداز روشنی از آغاز عصر ایجنتیک در محصولات گوگل، ترسیم کرد.