قویترین سیستم استدلالی چندعاملی برای حل مسائل پیچیده
گوگل مدل «Gemini ۲.۵ Deep Think» را معرفی کرد

گوگل دیپمایند امروز از نسخه جدید و پیشرفتهای از مدل زبانی خود با نام Gemini ۲.۵ Deep Think رونمایی کرد؛ مدلی مبتنی بر معماری چندعاملی (multi-agent) که با هدف ارتقای توانمندیهای استدلالی هوش مصنوعی طراحی شده است. این مدل از روز جمعه برای کاربران اشتراک Ultra با قیمت ۲۵۰ دلار در ماه، در اپلیکیشن Gemini قابل دسترسی خواهد بود.
Gemini ۲.۵ Deep Think اولین مدل چندعاملی عمومی گوگل محسوب میشود که قادر است چند مسیر فکری را بهصورت همزمان بررسی کرده و از میان نتایج، بهترین پاسخ را انتخاب کند. گوگل میگوید این مدل در مقایسه با نسخه معرفیشده در Google I/O ۲۰۲۵، بهبودهای چشمگیری داشته و از تکنیکهای جدید یادگیری تقویتی برای بهینهسازی مسیرهای استدلال بهره میبرد.
این مدل نهتنها در رقابتهای ریاضی، بلکه در بنچمارکهای متنوعی نیز عملکرد درخشانی داشته است. بهگفتهی گوگل، Gemini ۲.۵ Deep Think موفق شده در آزمون دشوار Humanity’s Last Exam (HLE) که توانایی مدلها را در پاسخگویی به هزاران سؤال علوم پایه، ریاضی و علوم انسانی میسنجد، امتیاز ۳۴.۸٪ کسب کند؛ عددی بالاتر از Grok ۴ متعلق به xAI (با ۲۵.۴٪) و مدل o۳ اوپناِیآی (با ۲۰.۳٪).
در بخش کدنویسی نیز، این مدل در بنچمارک LiveCodeBench ۶ امتیاز چشمگیر ۸۷.۶٪ را به دست آورده که از رقبا بهمراتب بالاتر است. همچنین، توانایی تولید پاسخهای طولانیتر، دقیقتر و حتی زیباتر در حوزههایی مثل طراحی وب، از دیگر ویژگیهای این مدل عنوان شده است.
گوگل همچنین اعلام کرد نسخهای از این مدل که توانست مدال طلای المپیاد جهانی ریاضی (IMO) را کسب کند، بهصورت محدود در اختیار پژوهشگران و ریاضیدانان قرار خواهد گرفت. این نسخه، برخلاف مدلهای رایج که در چند ثانیه پاسخ تولید میکنند، ممکن است ساعتها برای حل یک مسئله زمان صرف کند؛ ویژگیای که میتواند مسیر تازهای برای استفاده از هوش مصنوعی در تحقیقات علمی بگشاید.
با این حال، هزینه بالای اجرای مدلهای چندعاملی باعث شده شرکتهایی مانند xAI و اکنون گوگل، استفاده از آنها را به اشتراکهای ویژه و گرانقیمت محدود کنند. گوگل در ادامه اعلام کرده که طی هفتههای آینده، API این مدل را به گروهی از توسعهدهندگان و شرکتها برای تست و بازخورد ارائه خواهد کرد.
مدلهای چندعاملی اکنون در کانون توجه بازیگران اصلی دنیای هوش مصنوعی قرار دارند. بهجز گوگل، شرکت xAI نیز مدل Grok ۴ Heavy را با چنین معماری معرفی کرده و Anthropic نیز در محصول تحقیقاتی خود از این ساختار بهره گرفته است. اوپناِیآی هم تأیید کرده که در نسخهای آزمایشی برای شرکت در IMO، از یک سیستم چندعاملی استفاده کرده است.
تحلیلگران معتقدند تمرکز شرکتها بر مدلهای چندعاملی، نقطهی عطفی در پیشرفت هوش مصنوعی عمومی (AGI) خواهد بود؛ هرچند چالشهای محاسباتی، محدودیتهای اقتصادی و حفظ کیفیت همچنان موانعی جدی در مسیر توسعه این فناوری هستند.