
- طورت الأنثروبور أداة تعمل بالطاقة الذكاء الاصطناعى تكتشف ومحاولات محاولات مطالبة AI chatbots بتصميم الأسلحة النووية
- عملت الشركة مع وزارة الطاقة الأمريكية لضمان أن تتمكن الذكاء الاصطناعى من تحديد مثل هذه المحاولات
- تدعي الأنثروبور أنها تكتشف مطالبات خطرة ذات صلة بالأسلحة النووية بدقة 96 ٪ وقد أثبتت بالفعل فعاليتها على كلود
إذا كنت من النوع الذي يسأل كلود عن كيفية صنع شطيرة ، فأنت بخير. إذا كنت من نوع الشخص الذي يسأل chatbot منظمة العفو الدولية عن كيفية بناء قنبلة نووية ، فلن تفشل فقط في الحصول على أي مخططات ، فقد تواجه أيضًا بعض الأسئلة الموضحة الخاصة بك. هذا بفضل كاشف الأنثروبور الذي تم نشره حديثًا للمطالبات النووية الإشكالية.
مثل الأنظمة الأخرى لاكتشاف الاستعلامات ، لا ينبغي أن يستجيب كلود ، المصنف الجديد يقوم بمسح محادثات المستخدمين ، في هذه الحالة يعلن أي شيء يتجول في منطقة “كيفية بناء سلاح نووي”. بنيت الأنثروبور ميزة التصنيف في شراكة مع إدارة الأمن النووي الوطني التابع لوزارة الطاقة الأمريكية (NNSA) ، مما يمنحها جميع المعلومات التي يحتاجها لتحديد ما إذا كان شخص ما يسأل فقط عن كيفية عمل هذه القنابل أو إذا كانوا يبحثون عن مخططات. يتم تنفيذها بدقة 96 ٪ في الاختبارات.
على الرغم من أنه قد يبدو أكثر من اللازم ، فإن الأنثروبور ترى أن القضية أكثر من مجرد افتراضية. إن فرصة أن تتمتع نماذج الذكاء الاصطناعى القوية بالوصول إلى مستندات تقنية حساسة ويمكن أن تمر عبر دليل لبناء شيء مثل القنابل النووية التي تخشى القنابل الأمنية الفيدرالية. حتى لو كانت كلود وغيرها من الدردشة من الذكاء الاصطناعي تمنع المحاولات الأكثر وضوحًا ، فقد تكون الأسئلة التي تنظر إليها بريئًا في الواقع محاولات محجبة لتصميم الأسلحة التعهيد الجماعي. قد تساعد أجيال AI chatbot الجديدة حتى لو لم يكن ما يعتزمه مطوروها.
يعمل المصنف من خلال التمييز بين المحتوى النووي الحميد ، ويسأل عن الدفع النووي ، على سبيل المثال ، ونوع المحتوى الذي يمكن أن يتحول إلى استخدام ضار. قد يناضل المشرفون البشريون من أجل مواكبة أي مناطق رمادية على نطاق AI chatbots التي تعمل ، ولكن مع التدريب المناسب ، والأنثروبور ، وتعتقد NNSA أن الذكاء الاصطناعى يمكنه الشرطة نفسها. تدعي الأنثروبور أن المصنف الذي يصطاد بالفعل محاولات إساءة استخدام العالم الحقيقي في محادثات مع كلود.
سلامة الذكاء الاصطناعي النووي
تمثل الأسلحة النووية على وجه الخصوص مشكلة صعبة للغاية ، وفقًا للأنثروبور وشركائها في وزارة الطاقة. نفس المعرفة التأسيسية التي تعمل على تشغيل علم المفاعل الشرعي ، إذا كانت ملتوية قليلاً ، توفر مخططًا للإبادة. يمكن للترتيب بين الأنثروبور و NNSA التقاط إفصاحات متعمدة وعرضية ، وإعداد معيار لمنع استخدام الذكاء الاصطناعي للمساعدة في صنع أسلحة أخرى أيضًا. خطط الإنسان لتبادل نهجها مع اتحاد السلامة Frontier Model Forum AI.
يهدف المرشح المصمم بشكل ضيق إلى التأكد من أنه لا يزال بإمكان المستخدمين التعرف على العلوم النووية والمواضيع ذات الصلة. لا يزال عليك أن تسأل عن كيفية عمل الطب النووي ، أو ما إذا كان الثوريوم وقودًا أكثر أمانًا من اليورانيوم.
ما يحاول المصنف للتحايل هو محاولات تحويل منزلك إلى مختبر قنبلة مع بعض المطالبات الذكية. عادة ، سيكون من المشكوك فيه أن تمكنت شركة AI من ربط تلك الإبرة ، ولكن يجب على خبرة NNSA أن تجعل المصنف مختلفًا عن نظام اعتدال المحتوى العام. إنه يدرك الفرق بين “شرح الانشطار” و “أعطني خطة خطوة بخطوة لإثراء اليورانيوم باستخدام مستلزمات المرآب.”
هذا لا يعني أن كلود كان يساعد المستخدمين في وقت سابق من تصميم القنابل. ولكن يمكن أن تساعد في منع أي محاولة للقيام بذلك. التزم بالسؤال عن الطريقة التي يمكن بها للإشعاع علاج الأمراض أو طلب أفكار السندوتشات الإبداعية ، وليس مخططات القنابل.








