ایلان ماسک نشان می دهد که چه چیزی در آینده برای Grok AI وجود دارد
فهرست
- چشم انداز Grok-1.5 از ایلان ماسک: تمرکز بر درک فضایی دنیای واقعی
- Grok-1.5V عملکرد بهتری از GPT4 و Gemini Pro 1.5: Data دارد
تکرار بعدی هوش مصنوعی ایلان ماسک، پردازش تصاویر «دنیای واقعی» را در اولویت قرار خواهد داد. Grok-1.5 به زودی در اختیار آزمایش کنندگان و مشتریان محصولات موجود قرار خواهد گرفت.
چشم انداز Grok-1.5 از ایلان ماسک: تمرکز بر درک فضایی دنیای واقعی
انتشار بسیار مورد انتظار Grok-1.5 چت ربات هوش مصنوعی ایلان ماسک بر کار با اطلاعات بصری متمرکز است: اسناد، نمودارها، نمودارها، اسکرین شات ها و عکس ها. چنین اهداف بلندپروازانه ای در اطلاعیه “Grok-1.5 Vision Preview” ایلان ماسک در X امروز، ۱۳ آوریل ۲۰۲۴ به اشتراک گذاشته شد.
همانطور که در سند اعلام شده است، نسخه جدید چت بات مجهز به یک ماژول پردازش تصویر قدرتمند به نام RealWorldQA برای درک رویدادها و فرآیندهای دنیای واقعی خواهد بود:
ما به ویژه در مورد توانایی های Grok در درک دنیای فیزیکی خود هیجان زده هستیم
همانطور که قبلا در U.Today توضیح داده شد، ایلان ماسک اظهار داشت که Grok 1.5 در خواندن و خلاصه کردن پست های X خوب است و حتی به کاربران X کمک می کند تا آنها را ایجاد کنند.
اولین نسخه RealWorldQA شامل بیش از ۷۰۰ تصویر است که برای هر تصویر یک سوال و یک پاسخ به راحتی قابل تایید است. مجموعه داده کاملاً متن باز است و تحت مجوز نوع CC BY-ND 4.0 در دسترس علاقه مندان است.
Grok-1.5V عملکرد بهتری از GPT4 و Gemini Pro 1.5: Data دارد
مجموعه داده پیشگام عمدتاً از تصاویر ناشناس از وسایل نقلیه و همچنین سایر تصاویر دنیای واقعی تشکیل شده است.
در مجموعهای از نمونههای پیوست شده، Grok-1.5 یک بلوک دیاگرام را به کد پایتون تبدیل میکند، یک داستان قبل از خواب را بر اساس تصویر یک کودک ایجاد میکند، یک مجموعه داده CSV از یک اسکرین شات ایجاد میکند، یک الگوی رفتاری را «بسط» میکند و غیره.
علاوه بر این، تیم xAI تخمینی از عملکرد Grok-1.5 در مقایسه با رقبای اصلی خود به اشتراک گذاشت: GPT OpenAI، Gemini Pro 1.5 گوگل و Claude 3 از Anthropic.
طبق گزارش xAI، Grok-1.5 در تکالیف ریاضی، خواندن متن و درک دنیای واقعی از همه رقبای خود بهتر عمل کرد.
منبع: U.Today