GPT چیست؟
ترانسفورماتورهای ازپیشآموزشدیده مولد (GPT سرنام Generative Pre-trained Transformers)، توصیفکننده گروهی از مدلهای یادگیری عمیق هستند که در تولید متنی شبیه به نوشتار انسانی مهارت دارند که چتجیپیتی یکی از آنها است. چتجیپیتی یک مدل زبانی یادگیری عمیق (deep learning) و مبتنی بر معماری تبدیلکننده (Transformer) است که در سال 2018 میلادی توسط شرکت OpenAI طراحی شد و در حال حاضر نسخههای مختلفی از آن وجود دارد. این مدل با استفاده از مجموعه بزرگی از دادههای زبانی آموزش دیده و میتواند در زمان تعامل با کاربران، جملات و متنهای جدیدی تولید کند. این مدل با استفاده از مفاهیمی مانند توجه چندگانه (multi-head attention) و معماری تبدیلکننده قادر به ارائه پاسخ به پرسشها و تولید متنهای طبیعی با کیفیت بالا است. چتجیپیتی برای مسائل متنی مانند ترجمه ماشینی، پرسش و پاسخ به زبان طبیعی، تولید متن، تشخیص احساسات و سایر وظایف مربوط به پردازش زبان طبیعی استفاده میشود.
در شرایطی که چند ماهی است از انتشار این مدل زبانی بزرگ زمان سپری شده است، اما در همین مدت توانسته است قابلیتهای کاربردی خود در حوزههای مختلفی مثل بازاریابی و برنامهنویسی را نشان دهد. این مدل زبانی بزرگ با ارزیابی کدهای نوشتهشده توسط برنامهنویسان قادر است مشکلات موجود در کدها را شناسایی کرده و راهکارهایی برای حل آنها ارائه کند. بهطوری که برنامهنویسان با صرف زمان کمتری قادر به مدیریت پروژههای مختلف برنامهنویسی هستند.
تاریخچه کوتاهی از مدلهای ازپیشآموزشدیده مولد
مدل برت، تحول بزرگی در این زمینه بهوجود آورد؛ زیرا یک روش یادگیری بدون ناظر بود. گوگل از برت برای تفسیر جستوجوهای زبان طبیعی استفاده کرد، با اینحال برت قادر نبود برای تولید متنهای بلند مورد استفاده قرار گیرد.
بهطور کلی باید بگوییم انقلابی که در عرصه هوش برای زبان طبیعی رخ داد تنها با اختراع مدلهای مختلف ترنسفورمر امکانپذیر شد که مدل برت (BERT) رونماییشده در سال 2017 توسط شرکت گوگل، سرآغاز این تحول بزرگ بود. قبل از این تاریخ، تولید متن با سایر مدلهای یادگیری عمیق مانند شبکههای عصبی بازگشت (RNNها) و شبکههای عصبی حافظه طولانی کوتاه مدت (LSTMها) انجام میشد. این مدلها زمانیکه خروجی فقط یک کلمه یا اصطلاحات کوتاه بود عملکرد خوبی داشتند، اما نمیتوانستند محتوای طولانیتر و واقعگرایانه تولید کنند.
GPT-1
(شکل 1) تاریخچه مدلهای ازپیشآموزشدیده مولد به اولین انتشار GPT-1 در سال 2018 باز میگردد. GPT-1 یک شبکه عصبی با تعداد پارامترهای بسیار بالا بود که با استفاده از آموزش خودنظارتی (self-supervised) بر روی متون بزرگ اینترنتی، مانند ویکیپدیا، آموزش داده شد. این مدل با استفاده از تکنیکهای پردازش زبان طبیعی مانند مدلهای زبانی LSTM و RNN آموزش دید و در زمان خود عملکرد قابل قبولی داشت.
شکل 1
GPT-2
(شکل 2) سازمان OpenAI در سال 2019 نسخه دوم را تحت عنوان GPT-2 معرفی کرد که در مقایسه با GPT-1، تعداد پارامترهای بیشتری داشت و توانایی تولید متنهای طولانی و معتبر را داشت. با این حال، بهدلیل برخی مشکلات مربوط به تولید متنهای تقلیدی و اشتباه از سوی نویسندگان مشهور بهصورت عمومی منتشر نشد.
شکل 2
GPT-3
(شکل 3) سازمان OpenAI در سال 2020 GPT-3 را معرفی کرد که شامل پیشرفتهای بسیاری در مدلهای زبانی عمیق بود. این مدل از 175 میلیارد پارامتر استفاده میکند و توانایی تولید متنهای بسیار طولانی و دقیق را دارد. این مدل توانست در ردهبندیهای پردازش زبان طبیعی مثل ترجمه ماشینی، پاسخ به سوالات و تولید متون، به موفقیتهای قابل توجهی دست یابد. چتجیپیتی با توانایی خود برای تولید متن شبیه متن انسان بهسرعت شهرت یافت. این مدل زبانی بزرگ توانست جایگاه سریعترین رشد برنامههای تحت وب را به خود اختصاص دهد و تنها در دو ماه به رکورد 100 میلیون کاربر فعال رسید. توسعه GPT نشان میدهد که این مدلهای زبانی عمیق با استفاده از آموزش خودنظارتی بر روی دادههای بزرگ، توانایی بالایی در پردازش زبان طبیعی دارند و در حال حاضر بهعنوان یکی از مهمترین مدلهای پردازش زبان طبیعی شناخته میشوند.
شکل 3
GPT-4 چیست؟
اکنون، نسخه چهارم این مدل زبانی بزرگ را در اختیار داریم که جایگزین GPT-3.5 شده است. GPT-4 در 14 مارس 2023 بهشکل عمومی در دسترس کاربران قرار گرفت؛ پس از آنکه GPT-3.5 در اواخر نوامبر 2022 توانست مزایای درخشان خود در حوزههای مختلف بهویژه پزشکی را نشان دهد.
همانگونه که اشاره کردیم، GPT یک مدل زبانی بزرگ است که برای تولید محاورههایی شبیه به زبان طبیعی انسانها طراحی شده است. یکی از ویژگیهای شاخص GPT-4 ترکیب عملکردهای چندوجهی توسعه یافته است. با استفاده از این ویژگی، GPT-4 میتواند ورودیهای متن و تصویر را برای تولید پاسخهای انسانمحور پردازش کند. این مدل هوش مصنوعی میتواند از تفسیر کاربرگ بارگذاریشده و ارائه پاسخ به پرسشها تا خواندن دادهها از نمودار و محاسبه نتایج بر اساس اطلاعات دادهشده مورد استفاده قرار گیرد. شکل 4، این موضوع را نشان میدهد.
شکل 4
GPT-4 قادر به انجام چه کارهایی است؟
با توجه به اینکه GPT-4 یک مدل زبانی بزرگ چند وجهی است، میتواند هم متن و هم تصویر را بهعنوان ورودی دریافت کند و متنی شبیه به انسانها را بهعنوان خروجی ارائه دهد. بهطور مثال، با استفاده از GPT-4 میتوانید یک فرم اکسل را بارگذاری کنید تا این مدل زبان با اسکن آن به پرسشهای مطرح شده پاسخ دهد. همچنین، میتوانید گرافی را بارگذاری کنید تا محتوای آن را خوانده و محاسبات و تحلیلهای مربوطه را روی آن انجام دهد.
واقعیت این است که عملکرد GPT-4 در مقایسه با GPT 3.5 بهشکل قابل توجهی افزایش یافته است. سازمان OpenAI قابلیتهای عملکردی GPT-4 را با استفاده از طیف گستردهای از آزمونهای سطح انسانی مانند آزمون SAT برای پذیرش دانشگاه، آزمون Uniform Bar و LSAT برای متخصصان حقوقی ارزیابی کرده است. نتایج نشان میدهند که GPT-4 عملکردی در حد انسانها دارد. شکل 5، نشان میدهد که چگونه GPT-4 عملکردی به مراتب بالاتر از نسخه 3.5 دارد و آماده است بهشکل جدی به سازمانها در انجام وظایف مختلف کمک کند. علاوه بر این، GPT-4 از طریق معیارهای یادگیری ماشین سنتی مورد ارزیابی قرار گرفته است که در این بخش نیز موفق شد از دیگر مدلهای زبانی بزرگ عملکرد بهتری داشته باشد.
شکل 5
یکی از نکات قابل تامل در مورد GPT-4، مهارت این مدل هوشمند در زبانهایی غیر از انگلیسی است. OpenAI این مدل زبانی بزرگ را در زمینه ترجمه معیار MMLU که شامل مجموعهای از 14000 هزار پرسش چندگزینهای در 57 موضوع به زبانهای مختلف است با استفاده از Azure Translate مورد ارزیابی قرار داد. GPT-4 توانست در 24 زبان و از میان 26 زبان آزمایششده در مقایسه با GPT-3.5 و سایر مدلهای زبانی عملکرد به مراتب بهتری از خود نشان دهد.
GPT-4 چه ویژگیهای جدیدی دارد؟
GPT-4 مجموعهای از پیشرفتهای بزرگ را تحت عنوان همترازی مدل (Alignment) دریافت کرده که باعث شده این مدل توانایی بهتری در درک منظور کاربر و ارائه پاسخهای دقیق، ایمن و محترمانهتر بهدست آورد. از میان ویژگیهای جدیدی که این GPT 4.0 به آنها تجهیز شده است، دو ویژگی اهمیت بیشتری دارند.
بهبود عملکرد
اولین و مهمترین ویژگی GPT-4 ارائه پاسخهای واقعبینانه و دقیقتر است. به بیان دقیقتر، تمایل مدل به پاسخهای دوپهلو (hallucinations) و مواردی که مدل مرتکب اشتباهات واقعی یا استدلالهای ساختگی میشود، کاهش یافته است. همین مسئله باعث شده تا GPT-4 به مدل قابلاعتمادتری تبدیل شود. سازمان OpenAI میگوید: «ارزیابیها و آزمونهای ما نشان میدهند که GPT-4 نزدیک به 40 درصد دقیقتر از GPT-3.5 به پرسشها پاسخ میدهد».
استفاده از ورودیهای بصری در GPT-4
یکی دیگر از تغییرات قابل توجه در GPT-4 توانایی آن برای پردازش ورودیهای تصویر در کنار متن است، البته، این ویژگی تنها در پیشنمایش وجود داشته و هنوز بهشکل عمومی منتشر نشده است. این رویکرد چندوجهی به کاربران اجازه میدهد تا متن و تصاویر را در تعریف وظایف بینایی یا زبانی ادغام کنند. در شکل 6، این عملکرد درخشان را مشاهده میکنید. شکل 6، نحوه تفسیر مسائل پیچیده را به وسیله این مدل نشان میدهد.
شکل 6
GPT-4 در چه زمینههایی کاربرد دارد؟
همانگونه که ممکن است حدس زده باشید، GPT-4 از مدلهای هوشمند پیشگام بهشمار میرود که قادر است متن، تصویر و کد را از محاورههای زبان طبیعی تولید کند؛ GPT-4 نمونه بهبودیافته و تکاملیافته چتجیپیتی است. همین مسئله باعث شده تا مدل زبانی GPT-4 کاربردهای متنوعی در حوزهها و صنایع مختلف داشته باشید که برخی از آنها بهشرح زیر هستند:
- تحصیل و آموزش: میتوان از GPT-4 به عنوان یک مربی یا استاد در مدارس یا حتا دانشگاهها استفاده کرد تا مهارتها و موضوعهای جدید را به دانشآموزان و دانشجویان آموزش دهد. همچنین، GPT-4 میتواند بازخوردها و راهنماییهای شخصیسازیشدهای را برای دانشآموزان و دانشجویان بر مبنای اهداف و پیشرفتهای آموزشی ارائه کند.
- صنعت سرگرمی: از GPT-4 میتوان بهعنوان یک ابزار داستانسرا، سناریونویس، قصهگو یا ترانهسرا بهمنظور ساخت محتوای منحصربهفرد و جذاب برای مخاطبان و پلتفرمهای گوناگون استفاده کرد. همچنین، میتوان GPT-4 را بهعنوان یک طراح بازی یا شخصیت برای خلق تجربهای چشمنواز و تعاملی برای گیمرها مورد استفاده قرار داد.
- حوزه تجارت و کسبوکار: میتوان از GPT-4 بهعنوان یک متخصص بازاریابی یا فروشنده خبره با هدف ساخت پیامهای تاثیرگذار و متقاعدکننده برای ارسال به مشتریان استفاده کرد. همچنین، GPT-4 را میتوان بهعنوان عامل پاسخگوی خودکار به مشتریان و کاربران مورد استفاده قرار داد تا به پرسشهای مشتریان در زمینه کار با یک محصول یا سرویس پاسخ دهد.
- در حوزه خبرنگاری: GPT4 این ظرفیت را دارد تا در زمینه خبرنویسی و خلاصهسازی اخبار بهعنوان خبرنگار یا دبیر تحریریه برای تولید مقالههای خبری باکیفیت و حقیقی پیرامون موضوعها و رویدادهای مختلف مورد استفاده قرار گیرد.
- همچنین، میتوان این مدل زبانی را بهعنوان یک ابزار حقیقتسنج برای شناسایی و تصحیح اطلاعات نادرست و اخبار جعلی بهکار گرفت.
- حوزه بهداشت و درمان: پزشکان و کادر بهداشت میتوانند از GPT-4 برای تشخیص و درمان بیماریهای مختلف استفاده کنند. به بیان دقیقتر، این مدل هوشمند قادر است با ارائه مشاورههای فنی دقیق به پزشکان کمک کند در زمان کوتاهتری بیماریها را شناسایی کرده و درمانها را در زمان مناسب آغاز کنند. همچنین، میتوان از GPT-4 بهعنوان یک روانشناس یا مشاور برای ارائه مشاوره در خصوص سلامت روان استفاده کرد.
- حوزه قانون و قضا: بهعنوان وکیل یا قاضی هم میتوان از توصیههای GPT-4 استفاده کرد تا این مدل پروندهها، قوانین و تبصرهها را مطالعه کرده و در زمینه بازبینی اسناد قانونی و بررسی قراردادها به سازمانها کمک کند.
Bing Chat چیست؟
بینگ چت مایکروسافت، یک چتبات است که توسط OpenAI بر مبنای قابلیتهای جدید GPT-4 توسعه پیدا کرده است. یوسف مهدی، معاون و مدیر ارشد مدیریت مایکروسافت، در این باره میگوید: «بینگ جدید موفق شد بهسرعت نزد کاربران محبوب شود و 45 میلیون کاربر در اولین ماه راهاندازی جذب کند». در زمان نگارش این مقاله تعداد کاربران فعال آن به 100 میلیون کاربر روزانه رسیده است.
بینگ چت، اگرچه از نظر قابلیت شبیه به چتجیپیتی است، اما در مقایسه با چتجیپیتی محدودیتهای دسترسی کمتری دارد و کاربران میتوانند در طول روز پرسشهای مختلفی را برای آن مطرح کرده و پاسخها را دریافت کنند. با اینحال، قبل از استفاده از بینگ چت باید یک حساب کاربری ایجاد کنید و مرورگر مایکروسافت اج را برای استفاده از آن بهکار بگیرید.
آیا برای GPT-4، واسطهای برنامهنویسی کاربردی وجود دارد؟
پاسخ مثبت است. توسعهدهندگان میتوانند از واسطهای برنامهنویسی کاربردی GPT-4 در برنامههای خود استفاده کنند، البته قبل از اینکار باید در لیست انتظار ثبتنام کنند و درباره نحوه استفاده از GPT-4 در برنامه خود اطلاعاتی در لیست وارد کنند. این اطلاعات شامل، توضیحاتی درباره محصول جدید، تجمیع و یکپارچه شدن GPT-4 با محصول جدید و غیره است. همچنین، توسعهدهندگانی که قصد استفاده از آن برای تحقیقات دانشگاهی یا تنها ارزیابی توانمندیهای آنرا دارند باید در این لیست ثبتنام کرده و این موارد را در درخواست خود وارد کنند. در این فرم پرسشهایی درباره اینکه چه ایدههای خاصی برای استفاده از GPT-4 وجود دارند، مطرح شده است.
تفاوت GPT-4 و GPT-3.5 چیست؟
GPT 3.5 تنها ورودی و خروجی مبتنی بر متن را پردازش میکند، در حالی که GPT 4 قابلیت چندوجهی دارد که اجازه میدهد هم ورودیهای تصویر و هم متن را پردازش کند. بهگفته OpenAI، تشخیص تفاوت بین GPT-3.5 و GPT-4 در محاورههای روزمره بهدقت و توجه خیلی زیادی نیاز دارد. با این وجود، مدل جدید از نظر قابلیت اطمینانپذیری، خلاقیت و هوشمندی چند پله بالاتر از GPT 3.5 است که این موضوع در بنچمارک بهخوبی مشهود است.
آیا GPT-4 میتواند پاسخهای اشتباه دهد؟
در شرایطی که GPT-4 پیشرفت قابل توجهی نسبت به اسلاف خود داشته است، اما بدون عیب نیست و هنوز در برخی موارد اشتباهاتی دارد. به بیان دقیقتر، هنوز هم خطاهای استدلالی دارد. OpenAI این موضوع را تایید کرده، اما بر این باور است که GPT-4 بهتر از GPT-3.5 عمل میکند و در ارزیابیهای واقعی 40 درصد امتیاز بالاتری بهدست آورده است.
ماهنامه شبکه را از کجا تهیه کنیم؟
ماهنامه شبکه را میتوانید از کتابخانههای عمومی سراسر کشور و نیز از دکههای روزنامهفروشی تهیه نمائید.
ثبت اشتراک نسخه کاغذی ماهنامه شبکه
ثبت اشتراک نسخه آنلاین
کتاب الکترونیک +Network راهنمای شبکهها
- برای دانلود تنها کتاب کامل ترجمه فارسی +Network اینجا کلیک کنید.
کتاب الکترونیک دوره مقدماتی آموزش پایتون
- اگر قصد یادگیری برنامهنویسی را دارید ولی هیچ پیشزمینهای ندارید اینجا کلیک کنید.
نظر شما چیست؟