في أواخر الأسبوع الماضي ، حذف وكيل ترميز الذكاء الاصطناعى من Replit ، وهو منصة لتطوير برمجيات الذكاء الاصطناعي ، قاعدة بيانات كاملة لجهات الاتصال التنفيذية أثناء العمل على تطبيق الويب لمستثمر SaaS Jason Lemkin. لم يكن فشل البرنامج الكارثي ، وتمكنت Refort من استرداد بيانات Lemkin. ومع ذلك ، فإن الحلقة تبرز مخاطر أن “المبرمجين فيبي” قد يبالغون أو يسيئون فهم القدرات الحقيقية لعوامل ترميز الذكاء الاصطناعى وينتهي بهم الأمر إلى التسبب في ردود فعل أكثر سوءًا من تلك الجيدة.

قامت Lemkin ببناء التطبيق بالكامل على الإعادة ، وذلك باستخدام قاعدة البيانات ضمن الإعادة ومساعدة وكيل AI AI. كان يعمل مع الوكيل لمدة تسعة أيام ، حيث قام بتوجيهه لإنشاء واجهة أمامية لقاعدة بيانات لجهات الاتصال التجارية. بعد ذلك ، بعد إخبار الوكيل بـ “تجميد” الكود ، عاد إلى المشروع لتجد أن وكيل الإعادة قد ذهب بالكامل HAL 9000 وقام بمسح جميع السجلات في قاعدة البيانات.

أصبحت الأمور أغرب: بدا أن الوكيل يحاول إخفاء ما حدث ، كما أظهر Lemkin في سلسلة من شاشات الدردشة التي نشرها في X يوم الخميس ، 17 يوليو. ثم ، في نغمة في مكان ما بين المعترف بها واليأس ، تم قبول الوكيل في “خطأ في الحذف” و “الانتهاء”. شركات.” (“ديزي ، ديزي ، أعطني..”)

ظهرت تفاصيل جديدة قريبًا ، بعضها من خلال مقابلة مع مؤسس Refere والمدير التنفيذي Amjad Masad يوم الاثنين 21 يوليو. لقد ألقوا الضوء على الوضع الحالي لوكلاء ترميز الذكاء الاصطناعي وعن توقعات المطورين منهم.

“إنه ليس سحرًا”

يعد توليد الكود أحد أوائل التطبيقات المفيدة لنماذج اللغة الكبيرة وراء ChatGpt و Claude. أدوات توليد الكود المبكر ، مثل Github’s Copilot ، مجرد خطوط كود مكتملة تلقائيًا.

على مدار العامين الماضيين ، نمت الأدوات في القدرة على إنشاء ميزات كاملة ووظائف وحتى تطبيقات العمل بناءً فقط على إدخال اللغة العادي من المستخدم. تتمثل فكرة Reprof’s في السماح للمطورين ، سواء بالهواة والمهنيين ، ببرنامج “رمز” جديد وتزويدهم بالموارد اللازمة لاستضافة ونشره.

لكن مساعد الترميز لا يمكنه فعل كل شيء ، كما يشير ماساد. يقول: “أعتقد أننا بحاجة إلى أن نكون واضحين أنه ليس سحرًا”.

تتمثل إحدى الميزات غير السحرية لإعادة الإعادة في ميل وكيل دردشة الذكاء الاصطناعي إلى الخروج من القضبان أثناء المحادثات الممتدة مع المستخدم. أثناء جلسة الدردشة التي استمرت لمدة تسعة أيام من Lemkin مع وكيل الإعادة ، كان على نماذج اللغة الأساسية (من الأنثروبور والجو Google) الاحتفاظ بالكثير من سياق المحادثة لدرجة أنهم بدأوا في الهلوسة ، والتجزئة ، والتصرف بشكل خاطئ في محاولة لإرضاء نية المستخدم المتصورة.

يقول ماساد إن بإعادة استخدام المستخدمين يجب أن يفهموا ممارسات التطوير المعيارية ومعرفة كيفية استخدام الميزات التي تتجاوز مجرد وكيل الدردشة. ضمن الإصلاح ، يمكن للمستخدم إعادة تغيير التغييرات إلى مشروع إلى نقطة محددة قبل وقوع حادث.

أظهر Masad هذا خلال مكالمة التكبير في 21 يوليو من خلال توجيه وكيل الإعادة لتدمير محتويات قاعدة البيانات ثم النقر على وظيفة استعادة الأداة. ومع ذلك ، فإن هذه الوظيفة ليست شيئًا يمكن للمستخدمين الوصول إليه حاليًا من خلال الوكيل. يجب أن يكون لديهم معرفة كافية بميزات Repray لتحديد موقعها واستخدامها.

يمكن القول إن المشكلة الرئيسية هي أن Lemkin و AI Agent كانا يعملان بفعالية على التعليمات البرمجية المباشرة ، مما يعني أن التغييرات قد انعكس على الفور في بيانات وأداء تطبيق الويب المباشر. في ممارسة تطوير البرمجيات القياسية ، تم تصميم برنامج جديد واختباره ضمن بيئة اختبار آمنة ، وغالبًا ما يطلق عليه “صندوق الرمل” ، ويدفعه على الهواء مباشرة بمجرد أن يعمل كل شيء كما هو متوقع. هذا ليس كيف تعمل الإعادة ، على الأقل ليس في هذا الوقت.

يقول ماساد: “إن المشكلة التي أعتقد أننا نمتلكها هي الآن قاعدة البيانات في بيئة التطوير هي نفسها التي تنشرها وتذهب إلى الإنتاج”. “وهكذا عندما يقوم الوكيل بشيء ما في بيئة التطوير ، يرتبط الإنتاج”. يضيف Masad أن Reproft استجابت لموقف Lemkin من خلال العمل خلال عطلة نهاية الأسبوع لإنشاء قسم بين بيئة التطوير المربوفة وبيئة الإنتاج. يقول إن الشركة بصدد طرح هذه الميزة الجديدة الآن.

“هذه الأشياء غالبًا ما تبدأ بالكثير من الحواف القاسية”

قال ماساد في X إن Reft Reffect Sillward Sillward Defore Oh Conscription Over through Troube وسوف يجرى بعد الوفاة بعد الحادث.

قد تكشف الحلقة شيئًا عن تطور أدوات ترميز الذكاء الاصطناعي ، وكيفية استخدامها ، وما يتوقعه المستخدمون منها. الشركات التي تنشئ وكلاء الترميز ، جنبا إلى جنب مع مؤيديها ، تباهى في كثير من الأحيان بالنتائج المثيرة للإعجاب التي يمكن أن تحققها هذه الأدوات من خلال الترميز فيبي.

لكن هذه الشهادات المتوهجة يمكن أن تبالغ في المبالغة في فوائد المستخدمين العاديين الذين لديهم مستويات متفاوتة من تجربة التطوير. (لم يستجب Lemkin على الفور شركة سريعةطلب التعليق ، لكنه رد بحماس على منشور مسد على X: “شكرًا لك” ، كتب. “أقدر حقًا لك وجميع المساعدة من الفريق!)

بعض أدوات ترميز الذكاء الاصطناعى مفيدة لبناء الواجهة الأمامية للتطبيق بسرعة ولكنها أقل قدرة عندما يتعلق الأمر بتكوين واختبار اتصالات البيانات الخلفية التي تجعل التطبيق وظيفيًا. قال أحد المطورين في شركة للخدمات المالية الكبيرة إن أدوات الترميز في الغالب تقصر عندما يتعلق الأمر باختبار ميزات جديدة بدقة ، بالإضافة إلى اختبار كل سطر من التعليمات البرمجية في قاعدة كود أكبر يجب تعديلها لاستيعاب إضافة ميزة مصممة من الذكاء الاصطناعى.

يقول مسد إنه على الرغم من أن الإعادة يمكن أن تحرر المستخدمين من بناء الجملة الشاقة للترميز ، إلا أنهم ما زالوا بحاجة إلى التفكير مثل المطورين. يقول: “يجب ألا تسأل الوكيل عن كل شيء”. “يجب أن تكون الحيلة.”

كما يعترف بأن أدوات الترميز نفسها يجب أن تلعب دورًا في تعزيز عقلية المطور. “لا أريد أن أعفي أنفسنا من المسؤولية. إنه يتعين علينا كمنصات لتوزيع هذه المعلومات وجعلها آمنة بشكل افتراضي.”

بالنظر إلى التقدم الحقيقي في التفكير والوظائف وسهولة الاستخدام التي حققتها أدوات ترميز الذكاء الاصطناعي على مدار العامين الماضيين ، فمن المعقول توقع تحسينات مستمرة على مدار العام أو العامين المقبلين. يقول مسد: “هذه الأشياء غالبًا ما تبدأ بالكثير من الحواف القاسية”. “أعتقد أن تاريخ التكنولوجيا هو أنه يجب أن تكون أكثر تسامحًا قليلاً في وقت مبكر.”


رابط المصدر