زمان : 11 Azar 1404 - 21:40
شناسه : 216674
بازدید : 448
DeepSeek V۳.۲، رقیب چینی قدرتمند GPT-۵ رونمایی شد DeepSeek V۳.۲، رقیب چینی قدرتمند GPT-۵ رونمایی شد یزدفردا؛ شرکت چینی DeepSeek که پیش‌تر با مدل‌های ارزان و کارآمد خود وال‌استریت را ترسانده بود، حالا با دست پر بازگشته است. این شرکت از دو مدل جدید به نام‌های V3.2 و V3.2-Speciale رونمایی کرد که طبق ادعای این شرکت، در بنچمارک‌های استدلال و ریاضیات، مقابل غول‌های آمریکایی مانند GPT-5 و Gemini 3.0 Pro ایستاده است.

به گزارش یزدفردا؛ طبق بنچمارک‌های منتشرشده از دیپ‌سیک، نسخه ویژه مدل جدید عملکردی خیره‌کننده دارد. DeepSeek اعلام کرده است که مدل V3.2-Speciale (که نسخه قدرتمندتر و با محاسبات سنگین‌تر است) توانسته مدل GPT-5 High از شرکت OpenAI را پشت سر بگذارد و عملکردی هم‌تراز با Gemini 3.0 Pro گوگل ارائه دهد.

اوج قدرت این مدل در حل مسائل پیچیده ریاضی و برنامه‌نویسی دیده می‌شود؛ جایی که توانسته در المپیاد جهانی ریاضی ۲۰۲۵ (IMO) و المپیاد جهانی انفورماتیک (IOI) مدال طلا کسب کند.

معرفی مدل جدید DeepSeek V3.2

DeepSeek دو نسخه متفاوت را برای نیازهای مختلف عرضه کرده است: نسخه استاندارد (V3.2) برای کارایی بالا و سرعت بهینه که هم‌اکنون از طریق اپلیکیشن و وب‌سایت DeepSeek در دسترس عموم است. این نسخه با مدل‌هایی مثل GPT-5 (نسخه پایه) رقابت می‌کند.

نسخه ویژه (V3.2-Speciale) محدودیت‌های طول پاسخ‌دهی را کنار گذاشته و با ۶۸۵ میلیارد پارامتر برای حل سخت‌ترین مسائل طراحی شده است. دسترسی به این نسخه فعلاً فقط از طریق API امکان‌پذیر است و نیاز به سرورهای قدرتمند دارد.

مهندسان دیپ‌سیک با سه نوآوری توانسته‌اند به این سطح از هوش دست یابند:

توجه پراکنده (DSA): این معماری جدید، پیچیدگی محاسباتی را در متن‌های طولانی به شدت کاهش می‌دهد، بدون اینکه دقت مدل افت کند. این یعنی پردازش سریع‌تر با سخت‌افزار کمتر.
یادگیری تقویتی مقیاس‌پذیر: محققان دیپ‌سیک بودجه محاسباتی مرحله پس‌آموزش را افزایش داده‌اند تا مدل بتواند با آزمون و خطا، توانایی استدلال خود را تقویت کند.
تولید داده مصنوعی: ایجاد بیش از ۸۵ هزار پرامپت پیچیده و ۱۸۰۰ محیط شبیه‌سازی شده برای آموزش ایجنت‌ها جهت انجام کارهای عملی در دنیای واقعی.
دلیل ترس سرمایه‌گذاران غربی از مدل‌های دیپ‌سیک کارایی آنها نسبت به هزینه است. دیپ‌سیک ثابت کرده است که برای رسیدن به هوش مصنوعی سطح بالا، نیازی به میلیاردها دلار سرمایه نیست. این شرکت با عرضه مدل‌های متن‌باز و ارزان روایت شرکت‌هایی مثل OpenAI و گوگل را که می‌گویند «هوش مصنوعی گران است» زیر سؤال برده است.