🚨 اخبار ارز دیجیتال

ایلان ماسک نشان می دهد که چه چیزی در آینده برای Grok AI وجود دارد

ایلان ماسک نشان می دهد که چه چیزی در آینده برای Grok AI وجود دارد

فهرست

  • چشم انداز Grok-1.5 از ایلان ماسک: تمرکز بر درک فضایی دنیای واقعی
  • Grok-1.5V عملکرد بهتری از GPT4 و Gemini Pro 1.5: Data دارد

تکرار بعدی هوش مصنوعی ایلان ماسک، پردازش تصاویر «دنیای واقعی» را در اولویت قرار خواهد داد. Grok-1.5 به زودی در اختیار آزمایش کنندگان و مشتریان محصولات موجود قرار خواهد گرفت.

فهرست مطالب[نمایش/مخفی]
  1. چشم انداز Grok-1.5 از ایلان ماسک: تمرکز بر درک فضایی دنیای واقعی
  2. Grok-1.5V عملکرد بهتری از GPT4 و Gemini Pro 1.5: Data دارد

چشم انداز Grok-1.5 از ایلان ماسک: تمرکز بر درک فضایی دنیای واقعی

انتشار بسیار مورد انتظار Grok-1.5 چت ربات هوش مصنوعی ایلان ماسک بر کار با اطلاعات بصری متمرکز است: اسناد، نمودارها، نمودارها، اسکرین شات ها و عکس ها. چنین اهداف بلندپروازانه ای در اطلاعیه “Grok-1.5 Vision Preview” ایلان ماسک در X امروز، 13 آوریل 2024 به اشتراک گذاشته شد.

همانطور که در سند اعلام شده است، نسخه جدید چت بات مجهز به یک ماژول پردازش تصویر قدرتمند به نام RealWorldQA برای درک رویدادها و فرآیندهای دنیای واقعی خواهد بود:

ما به ویژه در مورد توانایی های Grok در درک دنیای فیزیکی خود هیجان زده هستیم

همانطور که قبلا در U.Today توضیح داده شد، ایلان ماسک اظهار داشت که Grok 1.5 در خواندن و خلاصه کردن پست های X خوب است و حتی به کاربران X کمک می کند تا آنها را ایجاد کنند.

اولین نسخه RealWorldQA شامل بیش از 700 تصویر است که برای هر تصویر یک سوال و یک پاسخ به راحتی قابل تایید است. مجموعه داده کاملاً متن باز است و تحت مجوز نوع CC BY-ND 4.0 در دسترس علاقه مندان است.

Grok-1.5V عملکرد بهتری از GPT4 و Gemini Pro 1.5: Data دارد

مجموعه داده پیشگام عمدتاً از تصاویر ناشناس از وسایل نقلیه و همچنین سایر تصاویر دنیای واقعی تشکیل شده است.

در مجموعه‌ای از نمونه‌های پیوست شده، Grok-1.5 یک بلوک دیاگرام را به کد پایتون تبدیل می‌کند، یک داستان قبل از خواب را بر اساس تصویر یک کودک ایجاد می‌کند، یک مجموعه داده CSV از یک اسکرین شات ایجاد می‌کند، یک الگوی رفتاری را «بسط» می‌کند و غیره.

علاوه بر این، تیم xAI تخمینی از عملکرد Grok-1.5 در مقایسه با رقبای اصلی خود به اشتراک گذاشت: GPT OpenAI، Gemini Pro 1.5 گوگل و Claude 3 از Anthropic.

طبق گزارش xAI، Grok-1.5 در تکالیف ریاضی، خواندن متن و درک دنیای واقعی از همه رقبای خود بهتر عمل کرد.

منبع: U.Today

درباره نویسنده

تیم تولید محتوای تخصصی رسانه موبو ارز همواره در تلاش است تا آخرین اخبار ارز دیجیتال را پوشش دهد و با ارائه مقالات جدید و بروز در آموزش دنیای ارزهای دیجیتال شما را یاری کند.

مطالب مرتبط

دیدگاه خود را بنویسید