اخبار تهدیدی جدی برای ChatGPT و گوگل / آپدیت جدید «دیپ سیک» منتشر شد

آلفای خاکستری

مدیر تالار اخبار + مدیر آزمایشی تالار موسیقی
پرسنل مدیریت
مدیر رسـمی تالار
مدیر آزمایـشی تالار
رمان‌خـور
گـرگینـه
نوشته‌ها
نوشته‌ها
1,766
پسندها
پسندها
1,913
امتیازها
امتیازها
273
تینا مزدکی - مدل تازه‌ی شرکت دیپ سیک چین با نام DeepSeek-R1-0528 توانسته در آزمون AIME 2025، که یکی از سنجه‌های دقیق برای ارزیابی توانایی‌های استدلالی مدل‌های زبانی است، به دقت چشمگیر ۸۷.۵ درصد برسد؛ عددی که در مقایسه با نسخه‌ی قبلی (با دقت ۷۰ درصد)، جهشی بزرگ به حساب می‌آید. در بنچ‌مارک تخصصی LiveCodeBench نیز که عملکرد مدل در زمینه‌ی برنامه‌نویسی را می‌سنجد، دقت DeepSeek-R1-0528 از ۶۳.۵ به ۷۳.۳ درصد افزایش یافته است. حتی در آزمون مشهور و دشوار «آخرین آزمون بشریت» (Humanity’s Last Exam)، امتیاز مدل از ۸.۵ به ۱۷.۷ درصد رسیده؛ یعنی بیش از دو برابر بهبود نسبت به نسخه‌ی قبلی.

این آمارها نشان می‌دهند که DeepSeek-R1-0528 در برخی حوزه‌ها به سطحی رسیده که می‌تواند با مدل‌های مطرحی مانند GPT-4o از OpenAI یا Gemini از Google رقابت کند و حتی در بعضی معیارها، عملکردی بهتر از آن‌ها داشته باشد.
متن باز و در دسترس!
در شرایطی که OpenAI و Google بیشتر مدل‌های قدرتمند خود را تنها از طریق APIهای پولی در اختیار کاربران قرار می‌دهند، دیپ سیک راه متفاوتی را در پیش گرفته است. مدل R1-0528 به‌صورت متن‌باز و تحت مجوز MIT منتشر شده؛ تصمیمی که به توسعه‌دهندگان اجازه می‌دهد آن را به‌دلخواه تغییر دهند، شخصی‌سازی کنند و در محصولات خود به‌کار ببرند.

از دیگر ویژگی‌های مهم این نسخه، پشتیبانی از خروجی‌های JSON و فراخوانی توابع (Function Calling) است. این قابلیت‌ها مسیر توسعه‌ی اپلیکیشن‌ها و ابزارهایی که به‌صورت مستقیم با مدل کار می‌کنند را بسیار ساده‌تر می‌کند. رویکرد باز و در دسترس دیپ سیک، این مدل را به گزینه‌ای ایده‌آل برای استارتاپ‌ها، پژوهشگران و شرکت‌هایی تبدیل کرده که به‌دنبال جایگزینی آزاد برای پلتفرم‌های بسته‌ی غربی هستند.

آموزش هوشمندانه، نه پرهزینه
یکی از نکاتی که در گزارش دیپ سیک جلب توجه می‌کند، تأکید این شرکت بر بهره‌وری در فرآیند آموزش مدل است. به‌گفته‌ی دیپ سیک، نسخه‌ی اولیه‌ی R1-0528 تنها در ۵۵ روز و با بهره‌گیری از حدود ۲۰۰۰ واحد پردازش گرافیکی (GPU) آموزش دیده و کل هزینه‌ی این فرایند حدود ۵.۵۸ میلیون دلار بوده است. عددی که در مقایسه با هزینه‌های سنگین آموزش مدل‌های مشابه در ایالات متحده، بسیار اقتصادی‌تر است. در دوره‌ای که انتقادها نسبت به هزینه‌های مالی و زیست‌محیطی آموزش مدل‌های زبانی شدت گرفته، چنین کارایی‌ای می‌تواند برگ برنده‌ای برای دیپ سیک باشد
آینده هوش مصنوعی چه خواهد شد
انتشار DeepSeek-R1-0528 می‌تواند نشانه‌ای از تغییر موازنه‌ قدرت در عرصه‌ جهانی هوش مصنوعی باشد. با عملکرد قابل توجه در استدلال و برنامه‌نویسی، مجوزهای آزاد و روند توسعه‌ی سریع، دیپ سیک در حال تثبیت جایگاه خود به‌عنوان یک رقیب جدی برای بازیگران اصلی این حوزه است.

در جهانی که آینده‌ هوش مصنوعی بیش‌ازپیش به‌سوی رقابت چندقطبی پیش می‌رود، مدل‌هایی مانند R1-0528 می‌توانند نه‌فقط مسیر پیشرفت فناوری را تعیین کنند، بلکه این پرسش کلیدی را هم مطرح کنند که چه کسانی اجازه دارند این فناوری را بسازند، کنترل کنند و از آن بهره‌مند شوند.

منبع: tomsguide
 
عقب
بالا پایین