
هناك حساب يجب أن يعرفه كل مسؤول تنفيذي لمنظمة العفو الدولية عن ظهر قلب ، لكن معظمهم لم يفعلوا أبدًا: يكلف خادم وحدة معالجة الرسومات المحلية التقليدية تقريبًا مثل ستة إلى تسعة أشهر من استئجار السعة السحابية المكافئة.
بالنظر إلى أن الأجهزة تعمل عادةً لمدة ثلاث إلى خمس سنوات ، فإن الرياضيات صارخة ، ومع ذلك ، فإن هذه ليست معرفة شائعة في غرف الإدارة التي تتخذ قرارات بنية تحتية بقيمة مليون رطل.
تنبع القضية من عدم التوافق الأساسي بين كيفية تفكيرنا في تكاليف الذكاء الاصطناعي وكيف تتراكم بالفعل. يبدو النفقات التشغيلية على نموذج الإنفاق الرأسمالي بديهيًا عند الدفع كما تذهب ، وتوسيع نطاقه حسب الحاجة ، وتجنب الالتزامات الكبيرة المقدمة.
لكن أعباء العمل منظمة العفو الدولية تكسر هذه الافتراضات بطرق تجعل الاقتصاد السحابي التقليدي مضللاً.
مدير SaaS والبنية التحتية في الكلام.
ما لا تخبرك به السحابة
على سبيل المثال ، يمكن أن يكلف استئجار مثيل وحدة معالجة الرسومات NVIDIA H100 من مزود السحابة الفائق حوالي 8 دولارات في الساعة ، أو أكثر من 5500 دولار شهريًا. أكثر من 12 شهرًا ، هذا يزيد عن 65000 دولار.
على النقيض من ذلك ، قد يكلف شراء الأجهزة المكافئة بشكل مباشر حوالي 30،000 دولار إلى 35000 دولار ، مع ثلاث إلى خمس سنوات من الحياة القابلة للاستخدام. أضف الطاقة والتبريد والصيانة وما زلت تخرج بعد 6 إلى 9 أشهر فقط من الاستخدام. بالإضافة إلى ذلك ، أنت تملك الأجهزة حتى لا تضطر إلى إعادتها بعد 12 شهرًا.
لكن التسلسل الهرمي للتسعير أكثر تعقيدًا مما يبدو. في حين أن مقدمي الخدمات Neocloud مثل FluidStack يقدمون H100s بسعر 2 دولار/ساعة ، فإن فرط الفصح يتقرب من 8 دولارات في الساعة ، مما يجعل قضية التزايد أقوى.
تزداد صعوبة تجاهل المقارنة بين العالم الحقيقي عند التفكير في عمليات النشر الفعلية: تكلفة 8xH100 من Dell أو Supermicro حوالي 250،000 دولار ، مقابل 825،000 دولار لمدة ثلاث سنوات من قدرة الفائض المكافئ (حتى مع الأسعار المحجوزة). تحمل أنظمة DGX الخاصة بـ NVIDIA بمثابة ترميز معاقبة بنسبة 50-100 ٪ على هذه الأسعار الكبيرة بالفعل.
تمثل الأرقام المفقودة في معظم محادثات ميزانية الذكاء الاصطناعي مدخرات حقيقية ، وليس أرقام نظرية. تزيد المشكلة عند فحص حالات الاستخدام المحددة.
النظر في التدريب يدير. يضمن معظم مزودي السحابة الوصول فقط إلى مجموعات GPU الكبيرة إذا كنت تحتفظ بسعة لمدة عام أو أكثر. إذا كان تدريبك يحتاج إلى أسبوعين فقط ، فأنت لا تزال تدفع مقابل الخمسين الآخرين.
وفي الوقت نفسه ، فإن متطلبات الاستدلال تخلق لغزها الرياضي. يعني التسعير المستند إلى الرمز المميز لنماذج اللغة الكبيرة أن التكاليف تتقلب مع عدم القدرة على التنبؤ بالنماذج نفسها ، مما يجعل التنبؤ بالميزانية يشبه التنبؤ بالطقس أكثر من التخطيط المالي.
المرونة ، ولكن مع طباعة غرامة
يشعر وعد السحابة بمقياس مرن مصنوع خصيصًا من أجل الذكاء الاصطناعي-حتى تدرك أن المقياس مقيد بحدود الحصص ، وتوافر GPU ، وتكلف عدم القدرة على التنبؤ. غالبًا ما يتطلب ما هو مرن من الناحية النظرية الحجز المسبق في الممارسة العملية ، والنقد مقدمًا لجعل التكاليف مقبولة.
وبمجرد نمو استخدامك ، تأتي الخصومات مع التزامات متعددة السنوات تعكس Capex Models Cloud أن تحل محلها.
ليس الأمر أن السحابة ليست قابلة للتطوير. إن إصدار فرق Scale AI (فعالة من حيث التكلفة ، وعالية الإنتاجية ، والانفجار) ليست دائمًا ما يتم تقديمه.
المفارقة تعمل أعمق من التسعير. تتطلب مرونة سوق مقدمي الخدمات السحابية كقائد القيمة الأساسي ، ولكن أعباء العمل منظمة العفو الدولية ، والتي هي أكثر التطبيقات التي تطلب من الناحية الحسابية في عصرنا ، تتطلب الترتيبات الأقل مرونة.
تبدأ الحجوزات طويلة الأجل ، وتخطيط القدرات ، والأحمال الأساسية التي يمكن التنبؤ بها في أن تبدو بشكل مثير للريبة مثل دورات الشراء التقليدية لتكنولوجيا المعلومات التي كان من المفترض أن تزيلها الحوسبة السحابية. تصبح الثورة دائرية.
التكاليف الخفية ، الاحتكاك المرئي
يظهر التعقيد الخفي في التفاصيل. غالبًا ما تحتفظ الفرق التي تستعد للمسامير الاستخدام أكثر من استخدامها ، ودفع ثمن حساب الخمول “فقط في حالة”.
يمكن أن تستهلك ترحيل البيانات بين مقدمي الخدمات مبالغ غير تافهة للوقت الهندسي ، مما يمثل تكلفة الفرصة البديلة التي نادراً ما تظهر على ميزانيات البنية التحتية ولكنها تؤثر بشكل كبير على الفرق الصغيرة المقيدة بالوقت.
تكاليف الفرصة البديلة هذه مع مرور الوقت. عندما تتحول الفرق بين مقدمي الخدمات السحابية-مدفوعة بتغييرات التسعير أو مشكلات الأداء أو احتياجات الامتثال ، فإنها في كثير من الأحيان تواجه أسابيع من إعادة كتابة وإعادة تحسين وإعادة التقييم.
ليست البنية التحتية لتكنولوجيا المعلومات هي التي تتغير فحسب ، بل تتغير كل الكود الذي يديره ، فإن الخبرة الداخلية في هذا المزود تختفي ويجب إعادة كتابة خط أنابيب النشر. بالنسبة للفرق العجاف ، قد يعني هذا تأخر تحديثات المنتج أو نوافذ الذهاب إلى السوق ، والتي نادراً ما يتم أخذها في الاعتبار في فاتورة GPU الرئيسية.
ولعل الأكثر إثارة للدهشة ، فإن العبء التشغيلي لإدارة البنية التحتية المحلية قد تم المبالغة بشكل منهجي. ما لم تكن تعمل على نطاق واسع ، فإن التعقيد يمكن التحكم فيه بالكامل من خلال الخبرة الداخلية أو من خلال مقدمي الخدمات المدارة.
الفرق هو أن هذا التعقيد مرئي ومخطط له ، بدلاً من إخفاءه في الفواتير الشهرية التي تتقلب بشكل غير متوقع.
من الميزانية إلى الاستراتيجية
تعتمد الشركات الذكية بشكل متزايد الأساليب الهجينة التي تلعب مع نقاط قوة نموذج البنية التحتية. يستخدمون الأجهزة المملوكة لأحمال خط الأساس يمكن التنبؤ بها مثل استدلال الحالة المستقرة التي تشكل العمود الفقري لخدمتهم.
تتعامل الموارد السحابية مع المسامير: الاختلافات في وقت اليوم ، أو عوامل حملة العملاء ، أو أعباء العمل التجريبية حيث يمكن للتسعير الموضعي تليين الضربة.
لقد تجاوزت الشركات التي تتبع هذا النهج التفكير المناهض للكلام نحو الهندسة المتعرجة مالياً.
تظل السحابة لا تقدر بثمن بالنسبة للتجريب السريع ، والتوسيع الجغرافي ، وأعباء العمل التي لا يمكن التنبؤ بها حقًا. لكن التعامل معها كخيار افتراضي لجميع البنية التحتية لمنظمة العفو الدولية يتجاهل الواقع الرياضي لكيفية استخدام هذه الأنظمة بالفعل.
الشركات التي تحصل على هذا الحساب بشكل صحيح تفعل أكثر من توفير المال. إنهم يبنون أسسًا أكثر استدامة ويمكن التنبؤ بها للابتكار على المدى الطويل.
هذه المحادثات ليست مجرد تقنية ، إنها استراتيجية. قد تفضل CFOs Cloud لخط Opex النظيف ، في حين أن المهندسين يشعرون بألم فرق Finops التي تطاردهم بشكل يائس لحذف الموارد كمساحات تكلفة في نهاية الشهر وسوء الدعم.
يمكن أن يؤدي هذا الانفصال إلى قرارات البنية التحتية التي تحركها أكثر من المؤتمرات المحاسبية أكثر من الأداء الحقيقي أو تجربة المستخدم. المنظمات التي تحصل على هذا الصحيح هي تلك التي تجلس فيها التمويل والهندسة على نفس الطاولة ، حيث تراجع ليس فقط التكلفة ، ولكن الإنتاجية والموثوقية والمرونة طويلة الأجل. في الذكاء الاصطناعى ، فإن محاذاة الحقائق المالية والتقنية هو فتح حقيقي.
إن فهم هذه الرياضيات الخفية لن يساعدك فقط على الميزانية بشكل أفضل ، بل سيتأكد من قيامك ببناء بنية تحتية تعمل بالطريقة التي تعمل بها الذكاء الاصطناعي فعليًا ، وتحرير مساحة الرأس للتركيز على أكثر ما يهم: بناء منتجات AI أفضل وأسرع وأكثر مرونة.
ندرج أفضل أداة لإدارة تكنولوجيا المعلومات.
تم إنتاج هذه المقالة كجزء من قناة TechRadarpro Expert Insights حيث نعرض أفضل وألمع عقول في صناعة التكنولوجيا اليوم. الآراء المعبر عنها هنا هي آراء المؤلف وليست بالضرورة آراء TechRadarpro أو Future PLC. إذا كنت مهتمًا بالمساهمة ، اكتشف المزيد هنا: https://www.techradar.com/news/submit-your-story-techradar-pro








