🚨 اخبار ارز دیجیتال

آیا ChatGPT پادشاه است؟ چت ربات برتر هوش مصنوعی چگونه در یک آزمایش میدانی عمل کرد


به گزارش پایگاه خبری ارز دیجیتال موبو ارز،

چندین چت ربات جدید هوش مصنوعی در حال هجوم به بازار هستند و رقابت را افزایش می دهند. اگر نمی خواهید اشتراک ماهانه بپردازید، OpenAI ممکن است بهترین انتخاب شما نباشد.

ChatGPT از OpenAI اولین چت ربات مبتنی بر هوش مصنوعی (AI) بود که از زمانی که در نوامبر ۲۰۲۲ عمومی شد، جهان را مجذوب خود کرد، اما از آن زمان، رقبای مختلفی وارد بازار شدند.

غول های فناوری گوگل و مایکروسافت از چت ربات های هوش مصنوعی رونمایی کردند، و پس از اینکه مایکروسافت به طور کامل موتور جستجوی بینگ مجهز به هوش مصنوعی خود را در ماه می منتشر کرد، Bard گوگل لیست انتظار خود را با بیش از ۱۸۰ مورد در ۱۰ می حذف کرد. ما خدمات خود را برای کشورها و مناطق بیشتری باز کرده ایم. چهار

با چند ربات چت برای انتخاب، کوین تلگراف با برخی از شناخته شده ترین ربات های چت کار خواهد کرد تا ببیند کدام ربات ها در طول آزمایش میدانی بهتر کار می کنند و همچنین عملکرد آنها را ارزیابی می کند. من تصمیم گرفتم برخی از آنها را با هم مقایسه کنم.

برای آزمایش ربات‌های گفتگو، به هر ربات چت یک سری سؤال، معماها و دستورات پیچیده‌تر داده شد تا دقت و سرعت پاسخ‌های ربات‌های گفتگو مشخص شود.

بسیاری از ربات‌های چت هوش مصنوعی که امروزه در دسترس هستند از مدل GPT OpenAI استفاده می‌کنند. این چت ربات‌های هوش مصنوعی می‌توانند نتایجی مشابه ChatGPT ارائه دهند، اما توسعه‌دهندگان برنامه همچنین می‌توانند دستورات دیگری اضافه کنند که می‌تواند نتایج را تغییر دهد.

OpenAI ChatGPT-3.5

OpenAI قبلا ChatGPT-4 را منتشر کرده است که برای کاربران پلن پلاس با قیمت ۲۰ دلار در ماه در دسترس است، در حالی که ChatGPT-3.5 برای استفاده و آزمایش در اینجا رایگان است.

ChatGPT-4 به طور قابل توجهی بهتر از نسخه قبلی خود با سرعت پاسخگویی سریع تر، پاسخ های دقیق تر و خرابی سرور کمتر عمل می کند.

اولین چت ربات هوش مصنوعی که دنیا را طوفانی می کند می تواند در کارهایی مانند نوشتن مقاله، اشکال زدایی کد و حتی مدیریت امور مالی شخصی با زمان پردازش تنها یک ثانیه کمک کند.

با این حال، یکی از زمینه هایی که ChatGPT در آن عملکرد ضعیفی دارد، عدم توانایی آن در جستجوی اینترنت است.

این بدان معناست که کیفیت مدل با داده های آموزشی وارد شده به مدل قابل مقایسه است. این دوره تا سپتامبر ۲۰۲۱ ادامه خواهد داشت. OpenAI در حال راه اندازی افزونه ای است که اطلاعات آنلاین را با استفاده از API جستجوی Bing در دسترس قرار می دهد، اما محدود به کاربران پلاس است. طرح.

با وجود این نقص نسخه رایگان، چت ربات ها معمولاً می توانند منابعی را برای کمک به کاربران در پرس و جوهایشان پیشنهاد دهند، همانطور که در گفتگوی زیر مشخص شده است.

تصویری که ChatGPT-3.5 را نشان می دهد قادر به صحبت در مورد رویدادهای اخیر نیست. سس: هوش مصنوعی را باز کنید

ChatGPT-3.5 به اکثر معماهایی که داده شده بود و تمام مسائل ساده ریاضی پاسخ صحیح داد، اما وقتی مسائل پیچیده تر پرسیده شد، دقت پاسخ ها کاهش می یابد.

به عنوان مثال، هنگامی که از ChatGPT-3.5 خواسته شد معادله درجه دوم 2t^2 + 0.3t – 0.4 = 0 را حل کند، ChatGPT-3.5 پاسخ صحیح را در ۱ از ۳ آزمایش برمی گرداند، و هنگام ضرب اعداد بزرگتر مشکل مشابهی داشت.

ChatGPT-3.5 همچنین ممکن است هنگام پاسخ دادن به سوالات دیگر نادرست باشد. تست‌های OpenAI نشان می‌دهد که او تنها ۲۱۳ سوال از ۴۰۰ سوال را در آزمون استاندارد وکالت که فارغ‌التحصیلان حقوق ایالات متحده باید قبل از اینکه بتوانند وکیل شوند، قبول کرده است.

علاوه بر عدم دقت واقعی، ChatGPT-3.5 همچنین با سوالاتی برای آزمایش توانایی منطقی، مانند:

ChatGPT به سوالاتی که برای آزمایش توانایی منطقی شما در نظر گرفته شده اند، به اشتباه پاسخ می دهد. منبع: Open AI

بینگ مایکروسافت

ChatGPT بینگ بر اساس مدل زبان GPT-4 ایجاد شده توسط OpenAI است، اما تفاوت‌های کلیدی بین این دو ربات چت وجود دارد.

اولین تفاوت قابل توجه این است که چت ربات بینگ برای پاسخ دادن به سوالات بسیار بیشتر طول می کشد، با میانگین زمان پاسخگویی حدود ۵ ثانیه، در حالی که ChatGPT OpenAI تنها ۱ ثانیه طول می کشد.

همچنین کاربران را ملزم به استفاده از مرورگر وب مایکروسافت اج می کند که به اندازه گوگل کروم محبوب نیست.

نکته مثبت، برخلاف دیگر چت‌بات‌ها که از GPT-4 استفاده می‌کنند، چت‌بات بینگ از موتور جستجوی Bing برای پاسخ‌ها استفاده می‌کند، بنابراین می‌تواند به سؤالات مربوط به رویدادهای جاری پاسخ دهد. همچنان به صورت رایگان در دسترس است.

علاوه بر این، منبع پاسخ نیز ارائه شده است که به کاربران امکان می دهد تا ادعاهای مطرح شده توسط ربات چت را راحت تر تأیید کنند.

Bing ChatGPT مایکروسافت در عمل. سس: بینگ

با استفاده از همان معادله درجه دوم 2t^2 + 0.3t – 0.4 = 0، Bing به حل‌کننده ریاضی مایکروسافت پیوند داد، اما اغلب پاسخ‌های نادرست می‌دهد، و همچنین هنگام پاسخ صحیح به ضرب‌های بزرگ‌تر مشکل مشابهی می‌دهد. مشکلی رخ داده است.

به همان سؤال منطقی در مورد نشانک‌های مطرح شده برای ChatGPT-3.5، بینگ به درستی پاسخ داد که انتظار دارند نشانک‌ها در صفحه ۱۲۰ ظاهر شوند.

گوگل بارد

چت ربات هوش مصنوعی گوگل به نام Bard که اخیراً منتشر شده است با مدل زبانی PaLM 2 کار می کند.

همانطور که موریتز کرمب از علاقه مندان به هوش مصنوعی در یک تاپیک توییتری اشاره کرد، ربات می تواند به اعلان های بصری پاسخ دهد و نمایش دهد، از بسیاری از زبان های برنامه نویسی پشتیبانی می کند و شبیه ربات چت بینگ است و می تواند به اینترنت متصل شود.

وقتی از بارد پرسیده شد که PalM 2 چگونه با GPT-4 مقایسه می شود، گفت GPT-4 در تولید متن بهتر است، اما PalM 2 در استدلال و منطق بهتر است و افزود: مزرعه برنج.

“در پایان روز، بهترین مدل زبان برای شما بر اساس نیازهای شما تعیین می شود. اگر LLM قوی در استدلال و منطق می خواهید، Palm 2 انتخاب بهتری است. سریع، خوب در تولید متن، LLM اثبات شده اگر می خواهید نیاز است، GPT-4 انتخاب بهتری است.”

بارد به سوالات نشانک‌ها به درستی پاسخ می‌داد و پاسخ‌هایش را با جزئیات بیشتری نسبت به بینگ توضیح می‌داد، اما توضیحات او اغلب گسسته بود.

مربوط: بارد گوگل چیست و چگونه کار می کند؟

شما اکثر معماهایی را که به شما داده شد حل کردید، در مسائل ریاضی به خوبی عمل کردید و در دو تا از سه راه حل پیشنهادی، مسائل ضرب پیچیده و معادلات درجه دوم را به درستی حل کردید.

شما چت کنید

از GPT-3.5 OpenAI نیز استفاده می شود، اما تفاوت هایی بین YouChat You.com و ChatGPT OpenAI وجود دارد.

منابع اکثر متون تولید شده فهرست شده اند و پیوندهایی به برخی از صفحات وب مرتبط با درخواست شما نیز ارائه شده است.

همچنین دارای اتصال اینترنت است تا بتوانید به آخرین رویدادها دسترسی داشته باشید. و از آنجایی که به اندازه چت ربات های OpenAI محبوب نیست، زمان از کار افتادن مشکلی نیست.

هر دو سؤال نشانک، معادلات درجه دوم، و مسائل ضرب پیچیده تر به اشتباه پاسخ داده شدند.

من توانستم بیشتر معماهای داده شده را حل کنم، اما برخی از معماها را اشتباه متوجه شدم.

چت در آغوش گرفتن

HuggingChat یک چت باکس AI منبع باز است که در ماه آوریل توسط شرکت هوش مصنوعی Hugging Face منتشر شد.

وقتی از HuggingChat خواسته شد معادله درجه دوم را حل کند، ۶۸۴ کلمه متن را برگرداند، اما به سوال پاسخی نداد. می توانستم به مسائل ساده به درستی پاسخ دهم، اما نمی توانستم اعداد بزرگتر را ضرب کنم.

HuggingChat گاهی اوقات یک پاسخ مستقیم را برمی‌گرداند، اما بیشتر اوقات حجم عظیمی از متن را که در ابتدا مرتبط بود و سپس به تدریج تبدیل به متن می‌شد، برمی‌گرداند.

مثلاً از من خواسته شد که معمای زیر را حل کنم. “بشکه آب ۶۰ پوند وزن داشت. شخصی چیزی در آن گذاشت تا ۴۰ پوند وزن داشت. او چه چیزی اضافه کرد؟”

پاسخ صحیح یک حفره است، اما HuggingChat قبل از راه اندازی مونولوگ ۵۴۵ کلمه ای، مکعب یخ را برگرداند.

بقیه چطور؟

بسیاری از چت ربات‌های هوش مصنوعی دیگر امروزه در دسترس هستند که برای موارد استفاده محدودتر از موارد ذکر شده در اینجا طراحی شده‌اند و بازار به سرعت به رشد خود ادامه خواهد داد.

به عنوان مثال، Socratic، یکی دیگر از ربات‌های چت هوش مصنوعی گوگل است که با دانلود در گوشی‌های هوشمند، به کاربران کمک می‌کند تا به سؤالات علوم، ریاضی، ادبیات و غیره پاسخ دهند. همچنین توضیحات بصری مفاهیم مختلف موضوعی را ارائه می دهد و ابزار مفیدی برای کمک به یادگیری است.

DeepAI یک ربات چت هوش مصنوعی است که در نوشتن متون مانند کد برنامه نویسی، شعر، داستان و مقاله تخصص دارد.

نتیجه

اگرچه ممکن است مقایسه ChatGPT-3.5 OpenAI با چت ربات هوش مصنوعی بینگ (با توجه به مدل‌های مختلف زبان) ناعادلانه باشد، هدف این مقاله پوشش دادن تنها چت‌ربات‌های هوش مصنوعی رایگان است. من این کار را انجام می‌دهم.

از طریق Bing، کاربران می توانند از مدل زبان ChatGPT-4 OpenAI استفاده کنند. این یک پیشرفت قابل توجه نسبت به نسخه های قبلی است.

Bard گوگل امیدوار کننده بود، اما بینگ به طور کلی بهترین چت ربات هوش مصنوعی بود که در حال حاضر به صورت رایگان در دسترس است، اما باز هم اشتباهاتی مرتکب شد.

به نظر می رسد سایر چت بات ها موارد استفاده محدودتری دارند که ممکن است مفیدتر باشند، اما با پیشرفت توسعه، به نظر می رسد این سه ربات پیشرو هستند.

مجله: اعتیاد به تجارت ارزهای دیجیتال – مراقب چه چیزی باشیم و چگونه آن را درمان کنیم

موارد فوق نشان دهنده آزمایش میدانی غیررسمی راه حل های هوش مصنوعی مختلف است و جامع یا نماینده موضع Cointelegraph در مورد راه حل های هوش مصنوعی خاص نیست.



نویسنده: Luke Huigsloot

دیدگاهتان را بنویسید

دکمه بازگشت به بالا