استارتاپ هوش مصنوعی xAI که توسط ایلان ماسک تأسیس شده، از Grok-1.5 Vision رونمایی کرد. انتشار نسخه جدید چتبات Grok، اقدامی مهم در جهت توسعه هوش مصنوعی است که میتواند متن و تصویر را درک کند. Grok-1.5 Vision که به عنوان یک مدل چندوجهی معرفی شده، در بنچمارکهای مختلفی با مدلهای مشابه مانند GPT-4V مقایسه شده و در برخی از آنها عملکرد بهتری از خود نشان داده است.
قابلیتهای جدید Grok-1.5 Vision
Grok-1.5 Vision علاوه بر پردازش متن، قادر به پردازش نمودار، اسکرینشات و تصاویر گوناگون است. برخی از قابلیتهای جدید این هوش مصنوعی عبارتند از:
- خواندن متن در تصویر
- فهم مسائل ریاضی
- تبدیل فلوچارت به کد پایتون
- تولید یک داستان از نقاشی
- تبدیل جدول به فرمت فایل CSV
xAI مدعی است که Grok-1.5 Vision در بنچمارک RealWorldQA که برای ارزیابی میزان درک دنیای واقعی طراحی شده، از رقبای خود پیشی گرفته. نکته قابل توجه اینجاست که این بنچمارک با استفاده از 700 تصویر به همراه پرسش و پاسخ برای هر مورد ایجاد شده است.
xAI در حال تلاش برای ساختن “هوش جامع مصنوعی سودمند” با قابلیت درک جهان راه اندازی شده. این هدف نشان میدهد که در ماههای آینده بهروزرسانیهای قابلتوجهی برای درک چندوجهی و قابلیتهای هوش مصنوعی مولد به Grok اضافه خواهد شد.
چتبات Grok برای اولین بار در سال 2023 رونمایی شد و از آن زمان تاکنون پیشرفتهای زیادی داشته است. با این حال، این چتبات در این مدت بدون حاشیه هم نبوده، تا جاییکه اخیراً محققان دریافتهاند که Grok میتواند درباره اقدامات مجرمانه به کاربران اطلاعات دهد.
xAI از زمان تأسیس، در حال رقابت با OpenAI بوده. این دو شرکت پیشرو در زمینه هوش مصنوعی، دائماً در حال توسعه مدلهای جدید و پیشرفته هستند.
Grok-1.5 Vision پتانسیل کاربرد در طیف وسیعی از زمینهها از جمله آموزش، مراقبتهای بهداشتی و خدمات مشتری را دارد. xAI متعهد به توسعه هوش مصنوعی سودمند و قابل اعتمادی است که میتواند به نفع بشریت باشد.