
أعطانا Tiktok عامية مثل ريز، في حين أن x شاع نسبة و Doomscroll. لكن وفقًا لبحث جديد من جامعة ولاية فلوريدا ، فإن أحدث لغة تشكيل القوة ليست شخصًا أو منصة: إنها ذكاء اصطناعي.
في دراسة تمت مراجعتها من قبل النظراء المنشورة في أرشيف جامعة كورنيل ، وجد باحثو FSU أن الذكاء الاصطناعى يؤثر ليس فقط على كيفية الكتابة ، ولكن كيف نتحدث. بعد تحليل أكثر من 22 مليون كلمة من البودكاست غير المكشوف ، لاحظ الفريق زيادة في المصطلحات التي تفضلها نماذج اللغة الكبيرة (LLMS) مثل chatgpt Openai (الخوضو تباهىو دقيق، و جارنر على سبيل المثال لا الحصر) ، في حين بقي استخدام مرادفاتهم مسطحة نسبيا.
يطلق الباحثون هذا على “التأثير المتسرب” أو “التسرب المعجمي”. على عكس العامية التي تنتشرها الثقافات الفرعية أو وسائل الإعلام ، ينشأ هذا التحول مع خوارزمية. في علم النفس المعرفي ، يُعرف هذا بالتعلم الضمني ، حيث يتم تخزين خيارات الصياغة المتكررة وخيارات الكلمات دون وعي في الذاكرة. وبالمثل ، يبرز أبحاث اللغة أيضًا ظاهرة تُعرف باسم التحضير ، حيث يؤدي التعرض لكلمات محددة أو بناء جملة إلى زيادة احتمال استخدامها لاحقًا. في غضون بضع سنوات فقط ، انتقلت المفردات المفضلة لدى Chatbot إلى الشاشة وفي محادثة يومية.
يقول توم جوزيك ، أستاذ اللغويات الحسابي في FSU ومؤلف الدراسة: “قد تضع الذكاء الاصطناعي حرفيًا الكلمات في أفواهنا ، حيث أن التعرض المتكرر يقود الناس إلى استيعاب الكلمات الطنانة وإعادة استخدامها التي ربما لم يختاروها بشكل طبيعي”. “القلق الأعمق هو أن نفس الآلية يمكن أن تشكل ليس فقط المفردات ولكن أيضًا المعتقدات والقيم.”
قام فريق الدراسة-Juzek ، و Bryce Anderson ، و Riley Galpin-بتحليل 1،326 حلقة من البودكاست للتكنولوجيا والعلوم ، بالتساوي بين فترة ما قبل الفصل (2019 إلى 2021) وفترة ما بعد الفصل (2023 إلى 2025). لقد استندوا إلى النصوص حيثما أمكن ، أو قاموا بإنشائها مع نموذج الهمس Openai ، مما أدى إلى مجموعة بيانات تبلغ حوالي 22 مليون كلمة. ثم قارنوا معدلات الاستخدام في كل ملايين من الكلمات الطنانة المرتبطة بـ AI ضد المرادفات الوثيقة لاختبار ما إذا كانت التحولات تعكس الانجراف العادي أو التأثير المتميز على طراز AI.
“كان من المهم أن تكون هذه لغة غير مسبقة ، لذلك ركزنا على عروض المحادثة –ليكس فريدمانو radiolabو الفيلانييقول جوزيك: “لالتقاط شيء قريب من الكلام التلقائي ، استبعدنا صراحة المصادر مثل محادثات المؤتمرات أو المحاضرات ، والتي غالباً ما يتم كتابة نصية وقد يتم بمساعدة AI”.
ويوضح أن LLMs لا تتفوق على الكلمات الطنانة أثناء التدريب على مجموعات البيانات الضخمة. ينشأ التأثير لاحقًا ، أثناء تعلم التفضيل البشري. يقول جوزيك: “من ما نعرفه ، يميل المقيمون إلى أن يكونوا صغارًا ، لذا قد تختلف الأفكار حول ما يعتبر الكتابة الرسمية”. “ينطوي صقل النموذج الذكري على مقايضات صعبة لتحقيق الفائدة والصدق/التأريض ، والحصول على بيانات التفضيل عالية الجودة أمر مكلف ويصعب الحصول عليه. غالبًا ما يكافئ البشر على الأسلوب على المادة ، لذلك قد تلتقط النماذج” كلمات “مصقولة في هذه العملية.”
وجدت دراسة مماثلة في ألمانيا أنماطًا شبه متطابقة على YouTube ، مما يشير إلى أن هذه الظاهرة تتجاوز البودكاست الأمريكي إلى اللغات والسياقات الأخرى.
هل منظمة العفو الدولية توحيد الخطاب البشري؟
الآثار المترتبة على ما بعد اختيار الكلمات. إذا كانت نماذج Openai أو Anthropic أو Google تطفو على نحو مختلف ، فيمكن أن يعتمد السكان أنماط خطاب متميزة بشكل متميز. يحذر الخبراء من أن هذا يمكن أن يسطح اللهجات ، ومحو العامية الإقليمية ، والإبداع المبلل.
يقول موتي مورافيا ، المؤسس و CTO من LEO AI ، من خلال تضخيم وتسقط نسخة “أعلى قيمة” من تلك الأنماط التي تم تعلمها من ملايين التفاعلات ، فإنها تحول بشكل كبير توازن بين أشكال اللغة التي تهيمن عليها “. “على الرغم من أنه يمكنك وضع معلمات للتنوع ، فإن الهدف الرئيسي لنماذج الذكاء الاصطناعى هو زيادة الجودة المتصورة.”
على الرغم من تطور أنماط الكلام دائمًا ، إلا أن هذا التحول يحدث بسرعة غير مسبوقة. يتم تدريب نماذج الذكاء الاصطناعى مثل ChatGpt و Bard و Claud على مليارات الكلمات من خلال تجريف الويب وتستخدمها ملايين الأشخاص كل يوم تقريبًا. إذا كانت الخوارزميات تقليم خياراتنا المرادف بهدوء ، فقد تكون أيضًا تضييق كيفية تأطير الأفكار.
تميل أنظمة الذكاء الاصطناعى إلى تضخيم أنماط اللغة المهيمنة ، مما يزيد من تبنيها في ثقافة أوسع. دون استمرار مدخلات الإنسان ، يمكن أن يركضوا ، وإعادة تشغيل الماضي بدلاً من التكيف مع الحاضر. قد تكون النتيجة مشهدًا إبداعيًا يشعر بأنه غير متزامن مع الواقع – يتم تطوير أطر عمل جديدة بدون عدوانية لتحديد أولويات الأصالة. يقول Trip Adler ، المؤسس والرئيس التنفيذي للبشر: “هذا مستقبل مرعب ، لكن لا يزال لدينا وقت لتغيير هذا وبناء أطر عمل بحيث لا يزال الإبداع الإنساني الأصلي مكافأة”.
وبالمثل ، تجادل Moravia بأن شركات مثل Openai و Anthropic و Google ستستمر في مطاردة المعايير العليا من خلال التدريب على أفضل البيانات المتاحة ، وتحسين المقاييس التي يعرفونها كيفية قياسها. يقترح أن الحماية هي إنشاء معيار جديد – وهو معيرة تقدر بشكل صريح التنوع في اللغة وما بعدها. يجب تحفيز الشركات لتحسين المزيد من المخرجات المتنوعة في الطريقة التي تتحدث بها النماذج. “ستكون هذه طريقة خفية وقوية لتشجيع أنظمة الذكاء الاصطناعى على الحفاظ على التنوع اللغوي بدلاً من تضييقها عن غير قصد.”
التمسك بالنغمة الإنسانية
يحذر Juzek من أن الارتفاع في كلمات معينة لا يثبت أن الذكاء الاصطناعي هو السائق الوحيد. كان الكثيرون يتجهون بالفعل قبل عام 2022 ، وقد يقوم الذكاء الاصطناعي ببساطة بتسريع تحول موجود. يقول: “استغرق الأمر سنوات قبل أن نفهم المزيج الكامل من الفوائد والمخاطر التي جاءت مع وسائل التواصل الاجتماعي ، وأظن أنها ستكون متشابهة مع نماذج الذكاء الاصطناعي”. “أخبرني المحادثات مع الزملاء أن تأثير” تعديل الثلج الصغير “هذا قد يكون متأصلًا في النزول التدرج ، وهو إجراء التحسين في صميم كيفية تعلم النماذج. فهم أن ذلك سيتطلب المزيد من الأبحاث الأساسية بشكل صحيح.”
يتطلع إلى المستقبل ، ويتوقع أن يتسارع تغيير اللغة. قد تتلاشى بعض الكلمات التي يفضلها الذكاء الاصطناعي ، مثلها مثل عامية الأجيال ، ولكن المخاطر الأكبر هو تجانس خفي.
يقول جوزك: “ثقافياً ، هذا مهم بالنسبة للثقة والإبداع”. “عاجلاً أم آجلاً ، ستصل هذا عدم اليقين إلى التفاعلات المنطوقة ، على سبيل المثال ، المكالمات الهاتفية. يمكن القول ، أن المحادثات وجهاً لوجه تظل آمنة للمستقبل المنظور.”








