Claude Sonnet 4.6 يكسر معادلة السعر والأداء في الذكاء الاصطناعي

Claude Sonnet 4.6 يكسر معادلة السعر والأداء في الذكاء الاصطناعي

تسير صناعة الذكاء الاصطناعي بوتيرة متسارعة قد تبدو مرهقة أحيانًا، إلا أن خطوة Anthropic الأخيرة يصعب تجاهلها. فبعد مرور 12 يومًا فقط على إطلاق نموذجها القوي Claude Opus 4.6، عادت الشركة لتكشف عن Claude Sonnet 4.6. ويهدف هذا النموذج الجديد من الفئة المتوسطة إلى تحقيق إنجاز لافت: تقديم مستوى ذكاء “بمستوى Opus” ولكن بجزء بسيط من التكلفة.

لطالما كان هناك في عالم الذكاء الاصطناعي مقايضة واضحة: إما الحصول على نموذج قادر على الاستدلال المعقّد وكتابة الشيفرات البرمجية بدقة عالية مقابل تكلفة مرتفعة، أو اختيار نموذج أقل تكلفة مع قدرات محدودة.
لكن Claude Sonnet 4.6 صُمّم لكسر هذه المعادلة. فقد حافظت Anthropic على سعر 3 دولارات لكل مليون رمز إدخال، وهو نفس سعر الإصدار السابق، رغم القفزة الكبيرة في القدرات. وبالمقارنة، أصبحت تكلفة تشغيل وكيل ذكاء اصطناعي عالي الأداء أقل بنحو خمس مرات مما كانت عليه قبل أسابيع قليلة فقط. وبالنسبة للمؤسسات التي تشغّل ملايين المهام الآلية يوميًا، يمثل ذلك فرقًا جوهريًا في التكاليف.

إحدى أبرز القفزات في هذا الإصدار تتمثل في ميزة “استخدام الكمبيوتر”، أي قدرة الذكاء الاصطناعي على رؤية الشاشة، وتحريك المؤشر، والكتابة داخل التطبيقات كما يفعل المستخدم البشري. وعندما عرضت Anthropic هذه الميزة لأول مرة في أواخر 2024، كانت لا تزال تجريبية وبأداء متذبذب.

أما في Sonnet 4.6، فقد وصلت هذه القدرة إلى مستوى شبه بشري، بحسب الشركة. ففي اختبارات معيارية تقيس قدرة الذكاء الاصطناعي على التنقل داخل تطبيقات الويب وسطح المكتب، حقق النموذج نسبة 72.5%، مقارنة بـ 61.4% في الإصدار السابق. ويعني ذلك أنه بات قريبًا جدًا من أداء نموذج Opus 4.6 الأعلى تكلفة. وتُعد هذه القفزة عاملًا حاسمًا في أتمتة المهام “التقليدية”، مثل التعامل مع قواعد بيانات قديمة أو أنظمة تأمين لا توفر واجهات برمجية حديثة.

بالنسبة للمطورين، أصبحت نماذج Claude خيارًا مفضلًا بالفعل، ويعزز Sonnet 4.6 هذه المكانة. ففي اختبارات واقعية، فضّل المطورون مخرجاته بنسبة 70% مقارنة بالإصدارات السابقة. كما بات النموذج أقل عرضة لما يُعرف بـ “الكسل”، وأكثر التزامًا بتنفيذ التعليمات المعقّدة ومتعددة الخطوات بدرجة أعلى من الثبات.

ولا يقتصر الأمر على كتابة الشيفرات فقط، إذ أظهر النموذج قدرة متقدمة على التفكير طويل الأمد. ففي محاكاة تنافسية للأعمال تُعرف باسم Vending-Bench، أدار الذكاء الاصطناعي نشاطًا تجاريًا على مدار عام كامل. واعتمد استراتيجية استثمار مكثف خلال الأشهر العشرة الأولى لبناء القدرة التشغيلية، قبل التحول إلى تعظيم الأرباح في المرحلة الأخيرة. وفي نهاية المحاكاة، حقق رصيدًا يفوق ضعف ما حققته النماذج السابقة، ما يثبت قدرته على التخطيط لأشهر وليس لدقائق فقط.

في الوقت الذي تُظهر فيه شركات منافسة مثل Google وOpenAI جداول إطلاق غير متوقعة وتأجيلات متكررة، تلتزم Anthropic بدورة تحديث منتظمة كل أربعة أشهر. وتمنح هذه الاستمرارية مديري التقنية والمطورين قدرة أفضل على التخطيط، مع الثقة بأن نموذجًا أكثر كفاءة سيكون متاحًا في الأفق القريب. ويمكن اعتبار هذا النهج ميزة تنافسية واضحة في سوق المؤسسات.

وأعلنت الشركة أن Claude Sonnet 4.6 أصبح الآن النموذج الافتراضي لجميع المستخدمين، بما في ذلك مستخدمي الفئة المجانية.



Facebook Twitter Copy Link WhatsApp