مدل هوش مصنوعی Claude Opus 4.5 رونمایی شد: رقیب جدید جمینای ۳ و GPT-5.1 با تمرکز بر کدنویسی و کارهای پیچیده

حوزه هوش مصنوعی به پیشرفت و توسعه سریع خود ادامه می‌دهد و امروز، نوبت به شرکت آنتروپیک (Anthropic) رسیده تا با عرضه Claude Opus 4.5 ، جدیدترین مدل زبان بزرگ خود، خبرساز شود. این سومین به‌روزرسانی قابل‌توجه این شرکت در دو ماه گذشته است و قابلیت‌های این مدل را برای انجام وظایف بسیار پیچیده، به‌خصوص برای توسعه‌دهندگان و کارمندان دانش‌بنیان، ارتقا می‌دهد.

خلاصه و نکات کلیدی

🔹 شرکت آنتروپیک از مدل زبان بزرگ جدید خود، Claude Opus 4.5، رونمایی کرد.

🔹 این مدل در وظایف پیچیده‌ای مانند کدنویسی عاملی (agentic coding) و کنترل کامپیوتر برتری دارد.

🔹 در بنچمارک‌های مهندسی نرم‌افزار، Opus 4.5 امتیازات بالاتری نسبت‌به رقبایی چون جمینای ۳ پرو و GPT-5.1 کسب کرده است.

🔹 قابلیت‌های جدیدی مانند Claude for Excel و Claude Code برای افزایش بهره‌وری Notepad انلاین در محیط کار معرفی شده‌اند.

🔹 هزینه استفاده از این مدل جدید نسبت‌به نسل قبلی خود، تقریباً دو سوم کاهش یافته است.

مدل هوش مصنوعی Claude Opus 4.5 چه قابلیت‌های جدیدی دارد؟

آنتروپیک همواره با افتخار از قدرت مدل Claude در کمک به متخصصان، به‌ویژه توسعه‌دهندگان، صحبت کرده است. این به‌روزرسانی جدید، این قابلیت‌ها را برای انجام وظایف بسیار پیچیده تقویت می‌کند. این مدل نقاط قوت خاصی را در کدنویسی عاملی (agentic coding) و کنترل کامپیوتر نشان می‌دهد و می‌تواند به‌طور مؤثر از چندین ابزار برای تکمیل گردش‌های کاری چندمرحله‌ای استفاده کند.

Opus 4.5 برای کارایی در این وظایف مهندسی شده است؛ آنتروپیک خاطرنشان می‌کند که ایجنت‌های ساخته‌شده برپایه این مدل می‌توانند پس از تنها چهار بار تلاش برای اصلاح وظیفه، به بالاترین سطح عملکرد خود برسند . این یک کاهش قابل‌توجه درمقایسه با سایر مدل‌های زبان بزرگ است که ممکن است به ده بار تلاش نیاز داشته باشند.

مدل هوش مصنوعی Claude Opus 4.5

عملکردی فراتر از رقبا و حتی انسان

برای نشان دادن قابلیت‌های خود، آنتروپیک به عملکرد این مدل در ارزیابی‌های استاندارد و داخلی اشاره کرده است. در مجموعه تست SWE-bench Verified ، که توانایی‌های مهندسی نرم‌افزار در دنیای واقعی را ارزیابی می‌کند، Claude Opus 4.5 امتیازاتی فراتر از مدل‌های رقیب، از جمله جمینای ۳ پرو گوگل و GPT-5.1 OpenAI ، کسب کرده است.

این شرکت همچنین این مدل را در یک آزمون مهندسی عملکرد داخلی و پیچیده آزمایش کرد. Opus 4.5 در این آزمون با محدودیت زمانی دو ساعته، امتیازی بالاتر از هر کاندیدای انسانی که قبلاً آزمایش شده بود، به‌دست آورد. این نتایج نشان‌دهنده توانایی مدل در اعمال قضاوت فنی تحت فشار است. البته این شرکت خاطرنشان می‌کند که این آزمون مهارت‌های شهودی یا اجتماعی را اندازه‌گیری نمی‌کند.

کاربردهای عملی و کاهش هزینه

فراتر از معیارهای عملکردی، Opus 4.5 ویژگی‌هایی را برای افزایش بهره‌وری در محیط کار معرفی می‌کند. قابلیت‌های استدلالی این مدل مستقیماً در برنامه‌های کلیدی محل کار ادغام شده‌اند:

Claude for Excel: این ابزار که وظایف مربوط به صفحات گسترده، جداول محوری و تولید نمودار را مدیریت می‌کند، اکنون به‌طور گسترده برای کاربران Max، Team و Enterprise در دسترس است.

Claude Code: دستیار برنامه‌نویسی اختصاصی، اکنون از طریق اپلیکیشن دسکتاپ آنتروپیک قابل‌دسترسی است.

درنهایت، استفاده از این مدل جدید ارزان‌تر از همیشه است. آنتروپیک هزینه توکن‌های ورودی Opus 4.5 را درمقایسه با نسل قبلی خود، Opus 4.1، تقریباً دو سوم کاهش داده است. این تغییر به حفظ موقعیت رقابتی در این بازار کلیدی کمک می‌کند.

نحوه دسترسی

مدل Opus 4.5 اکنون در تمام سرویس‌ها و پلتفرم‌های توسعه آنتروپیک، از جمله اپلیکیشن‌ها، APIها و حتی پلتفرم‌های ابری بزرگ، در دسترس است تا همه بتوانند به قابلیت‌های جدیدترین مدل هوش مصنوعی آن‌ها دسترسی داشته باشند.

به‌نظر شما آیا تمرکز تخصصی آنتروپیک بر روی وظایف حرفه‌ای می‌تواند Claude را به ابزار محبوب‌تری نسبت‌به رقبای همه‌فن‌حریف خود تبدیل کند؟

بفرست برای دوستات

لینک کوتاه: