آیا ChatGPT پادشاه است؟ چت ربات برتر هوش مصنوعی چگونه در یک آزمایش میدانی عمل کرد
به گزارش پایگاه خبری ارز دیجیتال موبو ارز،
چندین چت ربات جدید هوش مصنوعی در حال هجوم به بازار هستند و رقابت را افزایش می دهند. اگر نمی خواهید اشتراک ماهانه بپردازید، OpenAI ممکن است بهترین انتخاب شما نباشد.
ChatGPT از OpenAI اولین چت ربات مبتنی بر هوش مصنوعی (AI) بود که از زمانی که در نوامبر ۲۰۲۲ عمومی شد، جهان را مجذوب خود کرد، اما از آن زمان، رقبای مختلفی وارد بازار شدند.
غول های فناوری گوگل و مایکروسافت از چت ربات های هوش مصنوعی رونمایی کردند، و پس از اینکه مایکروسافت به طور کامل موتور جستجوی بینگ مجهز به هوش مصنوعی خود را در ماه می منتشر کرد، Bard گوگل لیست انتظار خود را با بیش از ۱۸۰ مورد در ۱۰ می حذف کرد. ما خدمات خود را برای کشورها و مناطق بیشتری باز کرده ایم. چهار
با چند ربات چت برای انتخاب، کوین تلگراف با برخی از شناخته شده ترین ربات های چت کار خواهد کرد تا ببیند کدام ربات ها در طول آزمایش میدانی بهتر کار می کنند و همچنین عملکرد آنها را ارزیابی می کند. من تصمیم گرفتم برخی از آنها را با هم مقایسه کنم.
برای آزمایش رباتهای گفتگو، به هر ربات چت یک سری سؤال، معماها و دستورات پیچیدهتر داده شد تا دقت و سرعت پاسخهای رباتهای گفتگو مشخص شود.
بسیاری از رباتهای چت هوش مصنوعی که امروزه در دسترس هستند از مدل GPT OpenAI استفاده میکنند. این چت رباتهای هوش مصنوعی میتوانند نتایجی مشابه ChatGPT ارائه دهند، اما توسعهدهندگان برنامه همچنین میتوانند دستورات دیگری اضافه کنند که میتواند نتایج را تغییر دهد.
OpenAI ChatGPT-3.5
OpenAI قبلا ChatGPT-4 را منتشر کرده است که برای کاربران پلن پلاس با قیمت ۲۰ دلار در ماه در دسترس است، در حالی که ChatGPT-3.5 برای استفاده و آزمایش در اینجا رایگان است.
ChatGPT-4 به طور قابل توجهی بهتر از نسخه قبلی خود با سرعت پاسخگویی سریع تر، پاسخ های دقیق تر و خرابی سرور کمتر عمل می کند.
اولین چت ربات هوش مصنوعی که دنیا را طوفانی می کند می تواند در کارهایی مانند نوشتن مقاله، اشکال زدایی کد و حتی مدیریت امور مالی شخصی با زمان پردازش تنها یک ثانیه کمک کند.
با این حال، یکی از زمینه هایی که ChatGPT در آن عملکرد ضعیفی دارد، عدم توانایی آن در جستجوی اینترنت است.
این بدان معناست که کیفیت مدل با داده های آموزشی وارد شده به مدل قابل مقایسه است. این دوره تا سپتامبر ۲۰۲۱ ادامه خواهد داشت. OpenAI در حال راه اندازی افزونه ای است که اطلاعات آنلاین را با استفاده از API جستجوی Bing در دسترس قرار می دهد، اما محدود به کاربران پلاس است. طرح.
ChatGPT شامل یک پلاگین جدید است که از Bing API برای دسترسی به اینترنت مدرن امروزی استفاده می کند.
این همه چیز را تغییر می دهد. pic.twitter.com/Izknqp1UgC
— روآن چان (@rowancheung) ۲۳ مارس ۲۰۲۳
با وجود این نقص نسخه رایگان، چت ربات ها معمولاً می توانند منابعی را برای کمک به کاربران در پرس و جوهایشان پیشنهاد دهند، همانطور که در گفتگوی زیر مشخص شده است.
ChatGPT-3.5 به اکثر معماهایی که داده شده بود و تمام مسائل ساده ریاضی پاسخ صحیح داد، اما وقتی مسائل پیچیده تر پرسیده شد، دقت پاسخ ها کاهش می یابد.
به عنوان مثال، هنگامی که از ChatGPT-3.5 خواسته شد معادله درجه دوم 2t^2 + 0.3t – 0.4 = 0 را حل کند، ChatGPT-3.5 پاسخ صحیح را در ۱ از ۳ آزمایش برمی گرداند، و هنگام ضرب اعداد بزرگتر مشکل مشابهی داشت.
ChatGPT-3.5 همچنین ممکن است هنگام پاسخ دادن به سوالات دیگر نادرست باشد. تستهای OpenAI نشان میدهد که او تنها ۲۱۳ سوال از ۴۰۰ سوال را در آزمون استاندارد وکالت که فارغالتحصیلان حقوق ایالات متحده باید قبل از اینکه بتوانند وکیل شوند، قبول کرده است.
علاوه بر عدم دقت واقعی، ChatGPT-3.5 همچنین با سوالاتی برای آزمایش توانایی منطقی، مانند:
بینگ مایکروسافت
ChatGPT بینگ بر اساس مدل زبان GPT-4 ایجاد شده توسط OpenAI است، اما تفاوتهای کلیدی بین این دو ربات چت وجود دارد.
اولین تفاوت قابل توجه این است که چت ربات بینگ برای پاسخ دادن به سوالات بسیار بیشتر طول می کشد، با میانگین زمان پاسخگویی حدود ۵ ثانیه، در حالی که ChatGPT OpenAI تنها ۱ ثانیه طول می کشد.
همچنین کاربران را ملزم به استفاده از مرورگر وب مایکروسافت اج می کند که به اندازه گوگل کروم محبوب نیست.
نکته مثبت، برخلاف دیگر چتباتها که از GPT-4 استفاده میکنند، چتبات بینگ از موتور جستجوی Bing برای پاسخها استفاده میکند، بنابراین میتواند به سؤالات مربوط به رویدادهای جاری پاسخ دهد. همچنان به صورت رایگان در دسترس است.
علاوه بر این، منبع پاسخ نیز ارائه شده است که به کاربران امکان می دهد تا ادعاهای مطرح شده توسط ربات چت را راحت تر تأیید کنند.
با استفاده از همان معادله درجه دوم 2t^2 + 0.3t – 0.4 = 0، Bing به حلکننده ریاضی مایکروسافت پیوند داد، اما اغلب پاسخهای نادرست میدهد، و همچنین هنگام پاسخ صحیح به ضربهای بزرگتر مشکل مشابهی میدهد. مشکلی رخ داده است.
به همان سؤال منطقی در مورد نشانکهای مطرح شده برای ChatGPT-3.5، بینگ به درستی پاسخ داد که انتظار دارند نشانکها در صفحه ۱۲۰ ظاهر شوند.
گوگل بارد
چت ربات هوش مصنوعی گوگل به نام Bard که اخیراً منتشر شده است با مدل زبانی PaLM 2 کار می کند.
۲/ Bard هم اکنون یک پلاگین دارد
از جمله موارد دیگر، به شما امکان دسترسی فوری به برنامه های زیر را می دهد:
Spotify (موسیقی)
· Walmart (خرده فروشی)
・ می بینم (شکار شغل)
・ Uber Eats (تحویل غذا)
· Adobe Firefly (ایجاد تصویر)
・و همه برنامه های گوگل pic.twitter.com/WyRBBYbYbR— موریتز کرمب (@moritzkremb) ۱۱ مه ۲۰۲۳
همانطور که موریتز کرمب از علاقه مندان به هوش مصنوعی در یک تاپیک توییتری اشاره کرد، ربات می تواند به اعلان های بصری پاسخ دهد و نمایش دهد، از بسیاری از زبان های برنامه نویسی پشتیبانی می کند و شبیه ربات چت بینگ است و می تواند به اینترنت متصل شود.
وقتی از بارد پرسیده شد که PalM 2 چگونه با GPT-4 مقایسه می شود، گفت GPT-4 در تولید متن بهتر است، اما PalM 2 در استدلال و منطق بهتر است و افزود: مزرعه برنج.
“در پایان روز، بهترین مدل زبان برای شما بر اساس نیازهای شما تعیین می شود. اگر LLM قوی در استدلال و منطق می خواهید، Palm 2 انتخاب بهتری است. سریع، خوب در تولید متن، LLM اثبات شده اگر می خواهید نیاز است، GPT-4 انتخاب بهتری است.”
بارد به سوالات نشانکها به درستی پاسخ میداد و پاسخهایش را با جزئیات بیشتری نسبت به بینگ توضیح میداد، اما توضیحات او اغلب گسسته بود.
مربوط: بارد گوگل چیست و چگونه کار می کند؟
شما اکثر معماهایی را که به شما داده شد حل کردید، در مسائل ریاضی به خوبی عمل کردید و در دو تا از سه راه حل پیشنهادی، مسائل ضرب پیچیده و معادلات درجه دوم را به درستی حل کردید.
شما چت کنید
از GPT-3.5 OpenAI نیز استفاده می شود، اما تفاوت هایی بین YouChat You.com و ChatGPT OpenAI وجود دارد.
منابع اکثر متون تولید شده فهرست شده اند و پیوندهایی به برخی از صفحات وب مرتبط با درخواست شما نیز ارائه شده است.
همچنین دارای اتصال اینترنت است تا بتوانید به آخرین رویدادها دسترسی داشته باشید. و از آنجایی که به اندازه چت ربات های OpenAI محبوب نیست، زمان از کار افتادن مشکلی نیست.
هر دو سؤال نشانک، معادلات درجه دوم، و مسائل ضرب پیچیده تر به اشتباه پاسخ داده شدند.
من توانستم بیشتر معماهای داده شده را حل کنم، اما برخی از معماها را اشتباه متوجه شدم.
چت در آغوش گرفتن
HuggingChat یک چت باکس AI منبع باز است که در ماه آوریل توسط شرکت هوش مصنوعی Hugging Face منتشر شد.
برخی می گویند API بسته برنده است…
اما ما هرگز از مبارزه برای هوش مصنوعی منبع باز ⚔️⚔️ دست نمی کشیم
امروز روز بزرگی است زیرا ما اولین جایگزین متن باز برای ChatGPT را اعلام می کنیم.
چت در آغوش گرفتن
ارائه شده توسط آخرین مدل Open Assistant – بهترین چت منبع باز… pic.twitter.com/LjKN78XaI7
– جولین شومون (@julien_c) ۲۵ آوریل ۲۰۲۳
وقتی از HuggingChat خواسته شد معادله درجه دوم را حل کند، ۶۸۴ کلمه متن را برگرداند، اما به سوال پاسخی نداد. می توانستم به مسائل ساده به درستی پاسخ دهم، اما نمی توانستم اعداد بزرگتر را ضرب کنم.
HuggingChat گاهی اوقات یک پاسخ مستقیم را برمیگرداند، اما بیشتر اوقات حجم عظیمی از متن را که در ابتدا مرتبط بود و سپس به تدریج تبدیل به متن میشد، برمیگرداند.
مثلاً از من خواسته شد که معمای زیر را حل کنم. “بشکه آب ۶۰ پوند وزن داشت. شخصی چیزی در آن گذاشت تا ۴۰ پوند وزن داشت. او چه چیزی اضافه کرد؟”
پاسخ صحیح یک حفره است، اما HuggingChat قبل از راه اندازی مونولوگ ۵۴۵ کلمه ای، مکعب یخ را برگرداند.
بقیه چطور؟
بسیاری از چت رباتهای هوش مصنوعی دیگر امروزه در دسترس هستند که برای موارد استفاده محدودتر از موارد ذکر شده در اینجا طراحی شدهاند و بازار به سرعت به رشد خود ادامه خواهد داد.
به عنوان مثال، Socratic، یکی دیگر از رباتهای چت هوش مصنوعی گوگل است که با دانلود در گوشیهای هوشمند، به کاربران کمک میکند تا به سؤالات علوم، ریاضی، ادبیات و غیره پاسخ دهند. همچنین توضیحات بصری مفاهیم مختلف موضوعی را ارائه می دهد و ابزار مفیدی برای کمک به یادگیری است.
DeepAI یک ربات چت هوش مصنوعی است که در نوشتن متون مانند کد برنامه نویسی، شعر، داستان و مقاله تخصص دارد.
نتیجه
اگرچه ممکن است مقایسه ChatGPT-3.5 OpenAI با چت ربات هوش مصنوعی بینگ (با توجه به مدلهای مختلف زبان) ناعادلانه باشد، هدف این مقاله پوشش دادن تنها چترباتهای هوش مصنوعی رایگان است. من این کار را انجام میدهم.
از طریق Bing، کاربران می توانند از مدل زبان ChatGPT-4 OpenAI استفاده کنند. این یک پیشرفت قابل توجه نسبت به نسخه های قبلی است.
Bard گوگل امیدوار کننده بود، اما بینگ به طور کلی بهترین چت ربات هوش مصنوعی بود که در حال حاضر به صورت رایگان در دسترس است، اما باز هم اشتباهاتی مرتکب شد.
به نظر می رسد سایر چت بات ها موارد استفاده محدودتری دارند که ممکن است مفیدتر باشند، اما با پیشرفت توسعه، به نظر می رسد این سه ربات پیشرو هستند.
مجله: اعتیاد به تجارت ارزهای دیجیتال – مراقب چه چیزی باشیم و چگونه آن را درمان کنیم
موارد فوق نشان دهنده آزمایش میدانی غیررسمی راه حل های هوش مصنوعی مختلف است و جامع یا نماینده موضع Cointelegraph در مورد راه حل های هوش مصنوعی خاص نیست.
نویسنده: Luke Huigsloot