خطای کمتر و استدلال‌های واقعی‌تر

GPT-4 چه پیشرفت‌های قابل توجهی نسبت به GPT-3 داشته است؟

21/02/1403 - 19:50

مترجم:

GPT-4 چه پیشرفت‌های قابل توجهی نسبت به GPT-3 داشته است؟

سازمان OpenAI که خالق مدل هوش زبانی چت‌جی‌پی‌تی است، در جدیدترین تلاش خود برای ساخت مدل‌های هوشمند، از نسخه چهارم چت‌جی‌پی‌تی رونمایی کرد که در مقایسه با نسخه سوم پیشرفت‌های قابل توجهی داشته است، به‌طوری که تحسین بسیاری از منتقدان را به‌همراه داشته است. جدیدترین دستاورد این سازمان نه‌تنها در زمان کوتاه‌تری به پرسش‌های کاربران پاسخ می‌دهد، بلکه با بالاترین دقت ممکن به پرسش‌های مطرح شده در حوزه‌های مختلف پاسخ می‌دهد. در این مطلب، قصد داریم به برخی از این پیشرفت‌های خیره‌کننده این مدل زبانی هوشمند نگاهی داشته باشیم.

GPT چیست؟

ترانسفورماتورهای ازپیش‌آموزش‌دیده مولد (GPT سرنام Generative Pre-trained Transformers)، توصیف‌کننده گروهی از مدل‌های یادگیری عمیق هستند که در تولید متنی شبیه به نوشتار انسانی مهارت دارند که چت‌جی‌پی‌تی یکی از آن‌ها است. چت‌جی‌پی‌تی یک مدل زبانی یادگیری عمیق (deep learning) و مبتنی بر معماری تبدیل‌کننده (Transformer) است که در سال 2018 میلادی توسط شرکت OpenAI طراحی شد و در حال حاضر نسخه‌های مختلفی از آن وجود دارد. این مدل با استفاده از مجموعه بزرگی از داده‌های زبانی ‌آموزش دیده و می‌تواند در زمان تعامل با کاربران، جملات و متن‌های جدیدی تولید کند. این مدل با استفاده از مفاهیمی مانند توجه چندگانه (multi-head attention) و معماری تبدیل‌کننده قادر به ارائه پاسخ به پرسش‌ها و تولید متن‌های طبیعی با کیفیت بالا است. چت‌جی‌پی‌تی برای مسائل متنی مانند ترجمه ماشینی، پرسش و پاسخ به زبان طبیعی، تولید متن، تشخیص احساسات و سایر وظایف مربوط به پردازش زبان طبیعی استفاده می‌شود.

در شرایطی که چند ماهی است از انتشار این مدل زبانی بزرگ زمان سپری شده است، اما در همین مدت توانسته است قابلیت‌های کاربردی خود در حوزه‌های مختلفی مثل بازاریابی و برنامه‌نویسی را نشان دهد. این مدل زبانی بزرگ با ارزیابی کدهای نوشته‌شده توسط برنامه‌نویسان قادر است مشکلات موجود در کدها را شناسایی کرده و راهکارهایی برای حل آن‌ها ارائه کند. به‌طوری که برنامه‌نویسان با صرف زمان کمتری قادر به مدیریت پروژه‌های مختلف برنامه‌نویسی هستند.

تاریخچه کوتاهی از مدل‌های ازپیش‌آموزش‌دیده مولد

مدل برت، تحول بزرگی در این زمینه به‌وجود آورد؛ زیرا یک روش یادگیری بدون ناظر بود. گوگل از برت برای تفسیر جست‌وجوهای زبان طبیعی استفاده کرد، با این‌حال برت قادر نبود برای تولید متن‌های بلند مورد استفاده قرار گیرد.

به‌طور کلی باید بگوییم انقلابی که در عرصه هوش برای زبان طبیعی رخ داد تنها با اختراع مدل‌های مختلف ترنسفورمر امکان‌پذیر شد که مدل برت (BERT) رونمایی‌شده در سال 2017 توسط شرکت گوگل، سرآغاز این تحول بزرگ بود. قبل از این تاریخ، تولید متن با سایر مدل‌های یادگیری عمیق مانند شبکه‌های عصبی بازگشت (RNNها) و شبکه‌های عصبی حافظه طولانی کوتاه مدت (LSTMها) انجام می‌شد. این مدل‌ها زمانی‌که خروجی فقط یک کلمه یا اصطلاحات کوتاه بود عملکرد خوبی داشتند، اما نمی‌توانستند محتوای طولانی‌تر و واقع‌گرایانه تولید کنند.

GPT-1

(شکل 1) تاریخچه مدل‌های ازپیش‌آموزش‌دیده مولد به اولین انتشار GPT-1 در سال 2018 باز می‌گردد. GPT-1 یک شبکه عصبی با تعداد پارامترهای بسیار بالا بود که با استفاده از آموزش خودنظارتی (self-supervised) بر روی متون بزرگ اینترنتی، مانند ویکی‌پدیا، آموزش داده شد. این مدل با استفاده از تکنیک‌های پردازش زبان طبیعی مانند مدل‌های زبانی LSTM و RNN آموزش دید و در زمان خود عملکرد قابل قبولی داشت.

شکل 1

GPT-2

(شکل 2) سازمان OpenAI در سال 2019 نسخه دوم را تحت عنوان GPT-2 معرفی کرد که در مقایسه با GPT-1، تعداد پارامترهای بیشتری داشت و توانایی تولید متن‌های طولانی و معتبر را داشت. با این حال، به‌دلیل برخی مشکلات مربوط به تولید متن‌های تقلیدی و اشتباه از سوی نویسندگان مشهور به‌صورت عمومی منتشر نشد.

شکل 2

GPT-3

(شکل 3) سازمان OpenAI در سال 2020 GPT-3 را معرفی کرد که شامل پیشرفت‌های بسیاری در مدل‌های زبانی عمیق بود. این مدل از 175 میلیارد پارامتر استفاده می‌کند و توانایی تولید متن‌های بسیار طولانی و دقیق را دارد. این مدل توانست در رده‌بندی‌های پردازش زبان طبیعی مثل ترجمه ماشینی، پاسخ به سوالات و تولید متون، به موفقیت‌های قابل توجهی دست یابد. چت‌جی‌پی‌تی با توانایی خود برای تولید متن شبیه متن انسان به‌سرعت شهرت یافت. این مدل زبانی بزرگ توانست جایگاه سریع‌ترین رشد برنامه‌های تحت وب را به خود اختصاص دهد و تنها در دو ماه به رکورد 100 میلیون کاربر فعال رسید. توسعه GPT نشان می‌دهد که این مدل‌های زبانی عمیق با استفاده از آموزش خودنظارتی بر روی داده‌های بزرگ، توانایی بالایی در پردازش زبان طبیعی دارند و در حال حاضر به‌عنوان یکی از مهم‌ترین مدل‌های پردازش زبان طبیعی شناخته می‌شوند.

شکل 3

GPT-4 چیست؟

اکنون، نسخه چهارم این مدل زبانی بزرگ را در اختیار داریم که جایگزین GPT-3.5 شده است. GPT-4 در 14 مارس 2023 به‌شکل عمومی در دسترس کاربران قرار گرفت؛ پس از آن‌که GPT-3.5 در اواخر نوامبر 2022 توانست مزایای درخشان خود در حوزه‌های مختلف به‌ویژه پزشکی را نشان دهد.

همان‌گونه که اشاره کردیم، GPT یک مدل زبانی بزرگ است که برای تولید محاوره‌‌هایی شبیه به زبان طبیعی انسان‌ها طراحی شده است. یکی از ویژگی‌های شاخص GPT-4 ترکیب عملکردهای چندوجهی توسعه یافته است. با استفاده از این ویژگی، GPT-4 می‌تواند ورودی‌های متن و تصویر را برای تولید پاسخ‌های انسان‌محور پردازش کند. این مدل هوش مصنوعی می‌تواند از تفسیر کاربرگ بارگذاری‌شده و ارائه پاسخ به پرسش‌ها تا خواندن داده‌ها از نمودار و محاسبه نتایج بر اساس اطلاعات داده‌شده مورد استفاده قرار گیرد. شکل 4، این موضوع را نشان می‌دهد.

شکل 4

GPT-4 قادر به انجام چه کارهایی است؟

با توجه به این‌که GPT-4 یک مدل زبانی بزرگ چند وجهی است، می‌تواند هم متن و هم تصویر را به‌عنوان ورودی دریافت کند و متنی شبیه به انسان‌ها را به‌عنوان خروجی ارائه دهد. به‌طور مثال، با استفاده از GPT-4 می‌توانید یک فرم اکسل را بارگذاری کنید تا این مدل زبان با اسکن آن به پرسش‌های مطرح شده پاسخ دهد. همچنین، می‌توانید گرافی را بارگذاری کنید تا محتوای آن را خوانده و محاسبات و تحلیل‌های مربوطه را روی آن انجام دهد.

واقعیت این است که عملکرد GPT-4 در مقایسه با GPT 3.5 به‌شکل قابل توجهی افزایش یافته است. سازمان OpenAI قابلیت‌های عملکردی GPT-4 را با استفاده از طیف گسترده‌ای از آزمون‌های سطح انسانی مانند آزمون SAT برای پذیرش دانشگاه، آزمون Uniform Bar و LSAT برای متخصصان حقوقی ارزیابی کرده است. نتایج نشان می‌دهند که GPT-4 عملکردی در حد انسان‌ها دارد. شکل 5، نشان می‌دهد که چگونه GPT-4 عملکردی به مراتب بالاتر از نسخه 3.5 دارد و آماده است به‌شکل جدی به سازمان‌ها در انجام وظایف مختلف کمک کند. علاوه بر این، GPT-4 از طریق معیارهای یادگیری ماشین سنتی مورد ارزیابی قرار گرفته است که در این بخش نیز موفق شد از دیگر مدل‌های زبانی بزرگ عملکرد بهتری داشته باشد.

شکل 5

یکی از نکات قابل تامل در مورد GPT-4، مهارت این مدل هوشمند در زبان‌هایی غیر از انگلیسی است. OpenAI این مدل زبانی بزرگ را در زمینه ترجمه معیار MMLU که شامل مجموعه‌ای از 14000 هزار پرسش چندگزینه‌ای در 57 موضوع به زبان‌های مختلف است با استفاده از Azure Translate مورد ارزیابی قرار داد. GPT-4 توانست در 24 زبان و از میان 26 زبان آزمایش‌شده در مقایسه با GPT-3.5 و سایر مدل‌های زبانی عملکرد به مراتب بهتری از خود نشان دهد.

GPT-4 چه ویژگی‌های جدیدی دارد؟

GPT-4 مجموعه‌ای از پیشرفت‌های بزرگ را تحت عنوان هم‌ترازی مدل (Alignment) دریافت کرده که باعث شده این مدل توانایی بهتری در درک منظور کاربر و ارائه پاسخ‌های دقیق، ایمن و محترمانه‌تر به‌دست آورد. از میان ویژگی‌های جدیدی که این GPT 4.0 به آن‌ها تجهیز شده است، دو ویژگی اهمیت بیشتری دارند.

بهبود عملکرد

اولین و مهم‌ترین ویژگی GPT-4 ارائه پاسخ‌های واقع‌بینانه و دقیق‌تر است. به بیان دقیق‌تر، تمایل مدل به پاسخ‌های دوپهلو (hallucinations) و مواردی که مدل مرتکب اشتباهات واقعی یا استدلال‌های ساختگی می‌شود، کاهش یافته است. همین مسئله باعث شده تا GPT-4 به مدل قابل‌اعتمادتری تبدیل شود. سازمان OpenAI می‌گوید: «ارزیابی‌ها و آزمون‌های ما نشان می‌دهند که GPT-4 نزدیک به 40 درصد دقیق‌تر از GPT-3.5 به پرسش‌ها پاسخ می‌دهد».

استفاده از ورودی‌های بصری در GPT-4

یکی دیگر از تغییرات قابل توجه در GPT-4 توانایی آن برای پردازش ورودی‌های تصویر در کنار متن است، البته، این ویژگی تنها در پیش‌نمایش وجود داشته و هنوز به‌شکل عمومی منتشر نشده است. این رویکرد چندوجهی به کاربران اجازه می‌دهد تا متن و تصاویر را در تعریف وظایف بینایی یا زبانی ادغام کنند. در شکل 6، این عملکرد درخشان را مشاهده می‌کنید. شکل 6، نحوه تفسیر مسائل پیچیده را به وسیله این مدل نشان می‌دهد.

شکل 6

GPT-4 در چه زمینه‌هایی کاربرد دارد؟

همان‌گونه که ممکن است حدس زده باشید، GPT-4 از مدل‌های هوشمند پیشگام به‌شمار می‌رود که قادر است متن، تصویر و کد را از محاوره‌های زبان طبیعی تولید کند؛ GPT-4 نمونه بهبودیافته و تکامل‌یافته چت‌جی‌پی‌تی است. همین مسئله باعث شده تا مدل زبانی GPT-4 کاربردهای متنوعی در حوزه‌ها و صنایع مختلف داشته باشید که برخی از آن‌ها به‌شرح زیر هستند:

تحصیل و آموزش: می‌توان از GPT-4 به عنوان یک مربی یا استاد در مدارس یا حتا دانشگاه‌ها استفاده کرد تا مهارت‌ها و موضوع‌های جدید را به دانش‌آموزان و دانشجویان آموزش دهد. همچنین، GPT-4 می‌تواند بازخوردها و راهنمایی‌های شخصی‌سازی‌شده‌ای را برای دانش‌آموزان و دانشجویان بر مبنای اهداف و پیشرفت‌های آموزشی ارائه کند.
صنعت سرگرمی: از GPT-4 می‌توان به‌عنوان یک ابزار داستان‌سرا، سناریونویس، قصه‌گو یا ترانه‌سرا به‌منظور ساخت محتوای منحصربه‌فرد و جذاب برای مخاطبان و پلتفرم‌های گوناگون استفاده کرد. همچنین، می‌توان GPT-4 را به‌عنوان یک طراح بازی یا شخصیت برای خلق تجربه‌ای چشم‌نواز و تعاملی برای گیمرها مورد استفاده قرار داد.
حوزه تجارت و کسب‌و‌کار: می‌توان از GPT-4 به‌عنوان یک متخصص بازاریابی یا فروشنده خبره با هدف ساخت پیام‌های تاثیرگذار و متقاعد‌کننده برای ارسال به مشتریان استفاده کرد. همچنین، GPT-4 را می‌توان به‌عنوان عامل پاسخ‌گوی خودکار به مشتریان و کاربران مورد استفاده قرار داد تا به پرسش‌های مشتریان در زمینه کار با یک محصول یا سرویس پاسخ دهد.
در حوزه خبرنگاری: GPT4 این ظرفیت را دارد تا در زمینه خبرنویسی و خلاصه‌سازی اخبار به‌عنوان خبرنگار یا دبیر تحریریه برای تولید مقاله‌های خبری باکیفیت و حقیقی پیرامون موضوع‌ها و رویدادهای مختلف مورد استفاده قرار گیرد.
همچنین، می‌توان این مدل زبانی را به‌عنوان یک ابزار حقیقت‌سنج برای شناسایی و تصحیح اطلاعات نادرست و اخبار جعلی به‌کار گرفت.
حوزه بهداشت و درمان: پزشکان و کادر بهداشت می‌توانند از GPT-4 برای تشخیص و درمان بیماری‌های مختلف استفاده کنند. به بیان دقیق‌تر، این مدل هوشمند قادر است با ارائه مشاوره‌های فنی دقیق به پزشکان کمک کند در زمان کوتاه‌تری بیماری‌ها را شناسایی کرده و درمان‌ها را در زمان مناسب آغاز کنند. همچنین، می‌توان از GPT-4 به‌عنوان یک روان‌شناس یا مشاور برای ارائه مشاوره در خصوص سلامت روان استفاده کرد.
حوزه قانون و قضا: به‌عنوان وکیل یا قاضی هم می‌توان از توصیه‌های GPT-4 استفاده کرد تا این مدل پرونده‌ها، قوانین و تبصره‌ها را مطالعه کرده و در زمینه بازبینی اسناد قانونی و بررسی قراردادها به سازمان‌ها کمک کند.

Bing Chat چیست؟

بینگ چت مایکروسافت، یک چت‌بات است که توسط OpenAI بر مبنای قابلیت‌های جدید GPT-4 توسعه پیدا کرده است. یوسف مهدی، معاون و مدیر ارشد مدیریت مایکروسافت، در این باره می‌گوید: «بینگ جدید موفق شد به‌سرعت نزد کاربران محبوب شود و 45 میلیون کاربر در اولین ماه راه‌اندازی جذب کند». در زمان نگارش این مقاله تعداد کاربران فعال آن به 100 میلیون کاربر روزانه رسیده است.

بینگ چت، اگرچه از نظر قابلیت شبیه به چت‌جی‌پی‌تی است، اما در مقایسه با چت‌جی‌پی‌تی محدودیت‌های دسترسی کمتری دارد و کاربران می‌توانند در طول روز پرسش‌های مختلفی را برای آن مطرح کرده و پاسخ‌ها را دریافت کنند. با این‌حال، قبل از استفاده از بینگ چت باید یک حساب کاربری ایجاد کنید و مرورگر مایکروسافت اج را برای استفاده از آن به‌کار بگیرید.

آیا برای GPT-4، واسط‌های برنامه‌نویسی کاربردی وجود دارد؟

پاسخ مثبت است. توسعه‌دهندگان می‌توانند از واسط‌های برنامه‌نویسی کاربردی GPT-4 در برنامه‌های خود استفاده کنند، البته قبل از این‌کار باید در لیست انتظار ثبت‌نام کنند و درباره نحوه استفاده از GPT-4 در برنامه خود اطلاعاتی در لیست وارد کنند. این اطلاعات شامل، توضیحاتی درباره محصول جدید، تجمیع و یکپارچه شدن GPT-4 با محصول جدید و غیره است. همچنین، توسعه‌دهندگانی که قصد استفاده از آن برای تحقیقات دانشگاهی یا تنها ارزیابی توان‌مندی‌های آن‌را دارند باید در این لیست ثبت‌نام کرده و این موارد را در درخواست خود وارد کنند. در این فرم پرسش‌هایی درباره این‌که چه ایده‌های خاصی برای استفاده از GPT-4 وجود دارند، مطرح شده است.

تفاوت GPT-4 و GPT-3.5 چیست؟

GPT 3.5 تنها ورودی و خروجی مبتنی بر متن را پردازش می‌کند، در حالی که GPT 4 قابلیت چندوجهی دارد که اجازه می‌دهد هم ورودی‌های تصویر و هم‌ متن را پردازش کند. به‌گفته OpenAI، تشخیص تفاوت بین GPT-3.5 و GPT-4 در محاوره‌های روزمره به‌دقت و توجه خیلی زیادی نیاز دارد. با این وجود، مدل جدید از نظر قابلیت اطمینان‌پذیری، خلاقیت و هوشمندی چند پله بالاتر از GPT 3.5 است که این موضوع در بنچمارک به‌خوبی مشهود است.

آیا GPT-4 می‌تواند پاسخ‌های اشتباه دهد؟

در شرایطی که GPT-4 پیشرفت قابل‌ توجهی نسبت به اسلاف خود داشته است، اما بدون عیب نیست و هنوز در برخی موارد اشتباهاتی دارد. به بیان دقیق‌تر، هنوز هم خطاهای استدلالی دارد. OpenAI این موضوع را تایید کرده، اما بر این باور است که GPT-4 بهتر از GPT-3.5 عمل می‌کند و در ارزیابی‌های واقعی 40 درصد امتیاز بالاتری به‌دست آورده است.

مطالب پربازدید

ماهنامه شبکه را از کجا تهیه کنیم؟
ماهنامه شبکه را می‌توانید از کتابخانه‌های عمومی سراسر کشور و نیز از دکه‌های روزنامه‌فروشی تهیه نمائید.

ثبت اشتراک نسخه کاغذی ماهنامه شبکه
ثبت اشتراک نسخه آنلاین

کتاب الکترونیک +Network راهنمای شبکه‌ها

برای دانلود تنها کتاب کامل ترجمه فارسی +Network اینجا کلیک کنید.

کتاب الکترونیک دوره مقدماتی آموزش پایتون

اگر قصد یادگیری برنامه‌نویسی را دارید ولی هیچ پیش‌زمینه‌ای ندارید اینجا کلیک کنید.

منبع:

https://www.zdnet.com/article/what-is-gpt-4-heres-everything-you-need-to-know/

برچسب:

GPT-4 - gpt-3

به اشتراک گذاری مطلب:

Telegram Twitter Print HTML

نظر شما چیست؟

form.antibot { display: none !important; } You must have JavaScript enabled to use this form.

GPT-4 چه پیشرفت‌های قابل توجهی نسبت به GPT-3 داشته است؟

GPT چیست؟