Chat GPT چیست؟
Chat GPT چیست؟ ویژگی هاو محدودیت ها
ChatGPT یک ربات چت با هوش مصنوعی (AI) است که توسط OpenAI توسعه یافته و در نوامبر 2022 راه اندازی شد. این ربات بر روی خانواده مدل های زبان بزرگ GPT-3.5 و GPT-4 OpenAI (LLM) ساخته شده است و به خوبی تنظیم شده است. (رویکردی برای انتقال یادگیری) با استفاده از تکنیک های یادگیری تحت نظارت و تقویتی.
ChatGPT بهعنوان یک نمونه اولیه در 30 نوامبر 2022 راهاندازی شد. به دلیل پاسخهای دقیق و واضح در بسیاری از حوزههای دانش، توجه ها را به خود جلب کرده. پس از انتشار ChatGPT، ارزش OpenAI در سال 2023، 29 میلیارد دلار برآورد شد.
نسخه اصلی ChatGPT بر اساس GPT-3.5 بود که نسخه ای مبتنی بر GPT-4، جدیدترین مدل OpenAI، در 14 مارس 2023 منتشر شد و برای مشترکین پولی به صورت محدود در دسترس است.
ChatGPT عضوی از خانواده مدل های زبانی ترانسفورماتور از پیش آموزش دیده (GPT) است. این برنامه (رویکردی برای انتقال یادگیری) بر روی یک نسخه بهبودیافته از GPT-3 OpenAI معروف به “GPT-3.5” تنظیم شد.
فرآیند تنظیم دقیق، هم یادگیری تحت نظارت و هم یادگیری تقویتی را در فرآیندی به نام یادگیری تقویتی از بازخورد انسانی (RLHF) تحت تأثیر قرار داد. هر دو رویکرد از مربیان انسانی برای بهبود عملکرد مدل استفاده می کنند. در مورد یادگیری تحت نظارت، مدل با مکالماتی ارائه شد که در آن مربیان هر دو طرف را بازی می کردند به عناوین کاربر و دستیار هوش مصنوعی. در مرحله یادگیری تقویتی، مربیان انسانی ابتدا پاسخ هایی را که مدل در مکالمه قبلی ایجاد کرده بود، رتبه بندی کردند. از این رتبهبندیها برای ایجاد «مدلهای پاداش» استفاده شد که مدل با استفاده از چندین تکرار از بهینهسازی سیاست پروگزیمال (PPO) بهطور دقیقتر تنظیم شد. الگوریتمهای بهینهسازی سیاست پروگزیمال یک جایگزین مقرونبهصرفه برای الگوریتمهای بهینهسازی خطمشی منطقه اعتماد هستند.
ChatGPT در ابتدا از یک زیرساخت ابر محاسباتی Microsoft Azure استفاده میکرد که توسط پردازندههای گرافیکی Nvidia پشتیبانی میشد، که مایکروسافت به طور خاص برای OpenAI ساخته بود و طبق گزارشها «صدها میلیون دلار» هزینه داشت. پس از موفقیت ChatGPT، مایکروسافت به طور چشمگیری زیرساخت OpenAI را در سال 2023 ارتقا داد.
OpenAI دادههای کاربران ChatGPT را برای آموزش بیشتر و تنظیم دقیق سرویس جمعآوری میکند. کاربران میتوانند به پاسخهایی که از ChatGPT دریافت میکنند رأی مثبت یا منفی بدهند و یک فیلد متنی را با بازخورد اضافی پر کنند.
دیدگاه خود را ثبت کنید
تمایل دارید در گفتگو شرکت کنید؟نظری بدهید!