zhaket logo

هوش مصنوعی‌ Grok-1.5 Vision می‌تواند متن و تصویر را درک کند

اخبار روز حوزه وب

2 دقیقه زمان مطالعه

استارتاپ هوش مصنوعی xAI که توسط ایلان ماسک تأسیس شده، از Grok-1.5 Vision رونمایی کرد. انتشار نسخه جدید چت‌بات Grok، اقدامی مهم در جهت توسعه هوش مصنوعی است که می‌تواند متن و تصویر را درک کند. Grok-1.5 Vision که به عنوان یک مدل چندوجهی معرفی شده، در بنچمارک‌های مختلفی با مدل‌های مشابه مانند GPT-4V مقایسه شده و در برخی از آنها عملکرد بهتری از خود نشان داده است.

قابلیت‌های جدید Grok-1.5 Vision

Grok-1.5 Vision علاوه بر پردازش متن، قادر به پردازش نمودار، اسکرین‌شات و تصاویر گوناگون است. برخی از قابلیت‌های جدید این هوش مصنوعی عبارتند از:

  • خواندن متن در تصویر
  • فهم مسائل ریاضی
  • تبدیل فلوچارت به کد پایتون
  • تولید یک داستان از نقاشی
  • تبدیل جدول به فرمت فایل CSV

xAI مدعی است که Grok-1.5 Vision در بنچمارک RealWorldQA که برای ارزیابی میزان درک دنیای واقعی طراحی شده، از رقبای خود پیشی گرفته. نکته قابل توجه اینجاست که این بنچمارک با استفاده از 700 تصویر به همراه پرسش و پاسخ برای هر مورد ایجاد شده است.

xAI در حال تلاش برای ساختن “هوش جامع مصنوعی سودمند” با قابلیت درک جهان راه اندازی شده. این هدف نشان می‌دهد که در ماه‌های آینده به‌روزرسانی‌های قابل‌توجهی برای درک چندوجهی و قابلیت‌های هوش مصنوعی مولد به Grok اضافه خواهد شد.

چت‌بات Grok برای اولین بار در سال 2023 رونمایی شد و از آن زمان تاکنون پیشرفت‌های زیادی داشته است. با این حال، این چت‌بات در این مدت بدون حاشیه هم نبوده، تا جاییکه اخیراً محققان دریافته‌اند که Grok می‌تواند درباره اقدامات مجرمانه به کاربران اطلاعات دهد.

xAI از زمان تأسیس، در حال رقابت با OpenAI بوده. این دو شرکت پیشرو در زمینه هوش مصنوعی، دائماً در حال توسعه مدل‌های جدید و پیشرفته هستند.

Grok-1.5 Vision پتانسیل کاربرد در طیف وسیعی از زمینه‌ها از جمله آموزش، مراقبت‌های بهداشتی و خدمات مشتری را دارد. xAI متعهد به توسعه هوش مصنوعی سودمند و قابل اعتمادی است که می‌تواند به نفع بشریت باشد.


تحریریه ژاکت

مشاهده تیم تحریریه

0

دیدگاه ها

ارسال دیدگاه

ارسال دیدگاه