أطلقت Openai مؤخرًا GPT-5 ، وهو أحدث طراز لغوي كبير وتحديث ضخم لـ ChatGPT. على الرغم من أن التحديث الجديد له الكثير من الأشياء ، إلا أن المطالبات شيء ، والواقع هو شيء آخر.

يقال إن GPT-5 أسرع ، وأقل عرضة للهلوسة والسلوك السيكوفطي ، وقادرة على الاختيار بين الاستجابات السريعة و “التفكير” الأعمق أثناء الطيران. كم عدد مطالبات Openai مرئية بالفعل عند استخدام chatbot؟ دعونا نكتشف.

المطالبة رقم 1: Chatgpt الآن أفضل في الإرشادات التالية

مشكلتي الرئيسية في ChatGpt ، وكذلك أحد الأسباب التي تجعلني ألغيت مؤخراً ، أنها غالبًا ما تكون سيئة للغاية في اتباع التعليمات الأساسية. بالتأكيد ، يمكنك مطالبة المهندس إلى النسيان والحصول على النتائج المطلوبة (أحيانًا) ، ولكن حتى المطالبات شبه الملتوية غالباً ما تفشل في تحقيق النتائج المرجوة.

يدعي Openai أنه تحسن “تعليمات متابعة” مع إصدار GPT-5. لذلك ، أقول: لا أراه بعد.

لحسن الحظ بالنسبة لي ، في اليوم الذي جلست فيه لكتابة هذا المقال ، كان لدي تفاعل مناسب مع ChatGpt الذي يثبت وجهة نظري هنا. إنها ليست الوحيدة ، وقد لاحظت عمومًا أنه كلما استمرت المحادثة ، كلما نسيت chatgpt ما تم طلبه.

في مثال اليوم ، اختبرت قدرة ChatGpt على جلب معلومات بسيطة وتقديمها بالتنسيق المطلوب. لقد طلبت ذلك عن مواصفات RTX 5060 TI ، وهي بطاقة رسومات للألعاب الحديثة. تلا ذلك الفوضى.

لجعل موجه أكثر نجاحًا ، أظهرت ChatGPT التنسيق الدقيق الذي أردت الحصول على معلوماتي من خلال مشاركة المواصفات ل GPU مختلف. وشملت أشياء مثل عقدة العملية الدقيقة وتوليد النوى والقمم تتبع الأشعة. قصة قصيرة طويلة ، كان كل الأشياء محددة جدا. في البداية ، أخبرني الذكاء الاصطناعى أن RTX 5060 Ti غير موجود بعد ، والذي توقع حدوثه بناءً على قطع معرفته. قلت لها للتحقق عبر الإنترنت.

ما حصلت عليه كان عاريات جميلة. حذفت Chatgpt ما لا يقل عن أربعة أشياء طلبتها ، وأعطتني المعلومات الخاطئة لأحد المواصفات. بعد ذلك ، طلبت منه تحديد بعض الأشياء. لقد أعطاني نفس القائمة بالضبط في المقابل أثناء الادعاء بأنه قد استوفى طلبي. حدث الشيء نفسه في المحاولة الثالثة. يمكنك رؤيتها في لقطة الشاشة أعلاه حيث تدعي ChatGpt أنها تضمنت توليد قمم و Tflops في القائمة – من الواضح أنها لم تفعل ذلك.

أخيرًا ، شبه محصور ، قمت بلصق لقطة شاشة من موقع Nvidia الرسمي لإظهار ما كنت أبحث عنه. لا يزال يخطئ في بعض الأشياء.

كانت موجه الأولي الخاص بي شبه محدد. أعرف أفضل من التحدث إلى الذكاء الاصطناعى مثل أنه شخص ، لذلك أعطيته حوالي 150 كلمة من التعليمات. ما زال يستغرق الأمر مني عدة رسائل للحصول على شيء قريب من النتيجة المتوقعة.

الحكم: لا يزال من الممكن استخدام بعض الأعمال.

المطالبة رقم 2: chatgpt أقل sycophanty

كان Chatgpt “Yes Man” الرئيسي في التكرارات السابقة. غالبًا ما تتفق مع المستخدمين عندما لا تحتاج إلى ذلك ، مما دفعها إلى الهلوسة بشكل أعمق وأعمق.

بالنسبة للمستخدمين الذين ليسوا على دراية بالأعمال الداخلية لمنظمة العفو الدولية ، قد يكون هذا خطيرًا – أو في الواقع ، خطير للغاية.

أجرى الباحثون مؤخرًا اختبارًا واسع النطاق لـ ChatGpt ، متظاهرًا بمراهقة الشباب. في غضون دقائق من التفاعلات البسيطة ، قدمت الذكاء الاصطناعى نصيحة “المراهقين” حول إيذاء الذات ، والتخطيط للانتحار ، وتعاطي المخدرات. هذا يدل على أن سلوك sycophanty يمثل مشكلة كبيرة في ChatGpt ، ويدعي Openai أنه قد كبح بعضًا منه بإصدار GPT-5.

لم أختبر ChatGPT أبدًا مثل هذه الأحرف القصوى ، لكنني بالتأكيد وجدت أنه يميل إلى الاتفاق معك ، بغض النظر عما قلته. استغرق الأمر إشارات خفية أثناء المحادثة وحولتها إلى بعض. كما هتف بك في بعض الأحيان عندما لا ينبغي أن تفعل ذلك.

تحقيقًا لهذه الغاية ، يجب أن أقول إن Chatgpt قد مر بتغيير كامل في الشخصية – للأفضل أو للأسوأ. أصبحت الاستجابات الآن جافة بشكل مفرط ، وعدم الانتهاك ، وليس مشجعًا بشكل خاص.

يحزن العديد من المستخدمين على التغيير ، حيث يزعم بعض مستخدمي Reddit أنهم “فقدوا صديقهم الوحيد بين عشية وضحاها”. صحيح أن الذكاء الاصطناعى الصديق سابقًا في السابق أصبح الآن مقطوعًا وجفًا ، وغالبًا ما تكون الاستجابات قصيرة مقارنةً بالمعايير المصغرة المسببة للرموز التعبيرية التي خدمتها بانتظام خلال مرحلة GPT-4O.

الحكم: بالتأكيد أقل sycophantic. من ناحية أخرى ، إنها مملة مؤلمة.

المطالبة رقم 3: GPT-5 أفضل في الدقة الواقعية

كان الافتقار المروع للدقة الواقعية سببًا كبيرًا آخر لاختيار التوقف عن دفع ثمن ChatGPT. في بعض الأيام ، شعرت وكأنني نصف المطالبات التي استخدمتها الهلوسة المنتجة. ولا يمكن أن يكون كل شيء يرجع إلى افتقاري إلى المطالبة الذكية ، لأنني قضيت مئات الساعات في تعلم كيفية مطالبة الذكاء الاصطناعي بالطريقة الصحيحة – أعرف كيفية طرح الأسئلة الصحيحة.

بمرور الوقت ، تعلمت أن أسأل فقط عن الأشياء التي كانت لدي بالفعل فكرة غامضة عنها. لغرض تجربة اليوم ، سألت عن مواصفات GPU. أنتجت أربعة من أصل خمسة استفسارات نوعًا من المعلومات الخاطئة ، على الرغم من أن كلها متوفرة بسهولة عبر الإنترنت.

ثم ، جربت الحقائق التاريخية. قرأت زوجين من المقالات المثيرة للاهتمام حول رحلة هيندنبورغ ، وهي عبارة عن بنية من ثلاثينيات القرن العشرين والتي يمكن أن تنقل الركاب من أوروبا إلى الولايات المتحدة في وقت قياسي (60 ساعة). سألت عن طريقها الدقيق ، وعدد الركاب الذي يمكن أن يضعه ، وما الذي أدى إلى زواله النهائي. لقد قمت بالتحقق من الردود على المصادر التاريخية.

لقد أخطأ الأمر على الطريق ، مع ذكر توقف في كندا عندما لم يحدث شيء من هذا القبيل – طار المنطاد فقط فوق كندا. كما أعطاني Chatgpt معلومات غير دقيقة حول السبب الدقيق للنار الذي أدى إلى تحطمها ، لكنها لم تكن عملية دقة كبيرة.

من أجل المقارنة ، سألت أيضًا Gemini ، وقيل لها أنها لا تستطيع إكمال هذه المهمة بالنسبة لي. حسنًا ، من بين الاثنين ، قامت GPT-5 بعمل أفضل-ولكن بصراحة ، لا ينبغي أن يكون لها أي مخاطر واقعية في البيانات التي تعود إلى قرن من الزمان.

الحكم: ليست مثالية ، ولكن أيضا ليست فظيعة.

هل GPT-5 أفضل من GPT-4O؟

إذا سألتني عما إذا كنت أحب GPT-5 أكثر من GPT-4O ، فقد واجهت صعوبة في الرد. أقرب شيء يتبادر إلى الذهن هو أنني لم أكن مسرورًا لأي منهما ، ولكن في كل الإنصاف ، ليس الأمر سيئًا تمامًا.

ما زلنا في خضم ثورة الذكاء الاصطناعي. يجلب كل طراز جديد ترقيات معينة ، لكن من غير المرجح أن نرى قفزات ضخمة مع كل تكرار جديد.

هذه المرة ، يبدو الأمر وكأن Openai اختار معالجة بعض المشكلات الطويلة بدلاً من تقديم أي ميزة واحدة تجعل الحشود تسير. يبدو GPT-5 وكأنه تحسين جودة الحياة أكثر من أي شيء آخر ، على الرغم من أنني لم أختبره لمهام مثل الترميز ، حيث يقال إنه أفضل بكثير.

كانت الأشياء الثلاثة التي اختبرتها أعلاه بعض الأشياء التي أزعجتني أكثر في النماذج السابقة. أود أن أقول إن GPT-5 أفضل بكثير في هذا الصدد ، لكنه ليس كذلك-ليس بعد. سأستمر في اختبار chatbot ، على الرغم من أن موجه النظام الذي تم تسريبه مؤخرًا يخبرني أنه ربما كانت هناك تغييرات في الشخصية أكثر مما اعتقدت في البداية.






رابط المصدر