سیاست و بازاریابی

آخرين مطالب

انویدیا منتشر کرد: نسخه‌ای از مدل لاما 3.1 که کوچک‌تر و قوی‌تر از DeepSeek R1 است نکات خواندني

انویدیا منتشر کرد: نسخه‌ای از مدل لاما 3.1 که کوچک‌تر و قوی‌تر از DeepSeek R1 است
  بزرگنمايي:

سیاست و بازاریابی - دیجیاتو / این مدل جدید باوجود اندازه کوچک‌تر عملکردی بهتر از DeepSeek R1 دارد.
متا همچنان درگیر پاسخ به پرسش‌ها و انتقادات درباره خانواده مدل‌های جدید Llama 4 است اما شرکت انویدیا با معرفی مدل زبان بزرگ (LLM) متن‌باز و قدرتمند، توجه‌ها را به خود جلب کرده است. این مدل که Llama-3.1 Nemotron Ultra نام دارد، بر پایه نسخه قبلی مدل‌های Llama-3.1-405B-Instruct متا توسعه یافته و به گفته انویدیا، عملکردی نزدیک به برترین مدل‌های موجود دارد.
مدل Llama-3.1-Nemotron-Ultra-253B-v1 با 253 میلیارد پارامتر برای وظایفی مانند استدلال پیشرفته، پیروی از دستورات و ایفای نقش دستیار هوش مصنوعی طراحی شده است.
این مدل نخستین‌ بار مارس در کنفرانس سالانه GTC انویدیا معرفی شده بود و اکنون کامل و متن‌باز در پلتفرم Hugging Face در دسترس قرار گرفته است. کد مدل، وزن‌ها و داده‌های پس از آموزش آن نیز عمومی منتشر شده‌اند.

سیاست و بازاریابی


بازار


مدل جدید انویدیا با استفاده از فرایند جستجوی معماری عصبی (NAS) توسعه یافته که در آن نوآوری‌هایی مانند حذف لایه‌های توجه، شبکه‌های Fused feedforward و فشرده‌سازی متغیر در ساختار مدل اعمال شده‌اند. این معماری به گونه‌ای طراحی شده که مدل با کاهش مصرف حافظه و منابع محاسباتی، همچنان کیفیت خروجی بالایی ارائه دهد و بتوان آن را فقط با 8 کارت گرافیک H100 اجرا کرد.
علاوه‌بر H100، این مدل با معماری‌های پیشرفته‌تر انویدیا مانند B100 و Hopper نیز سازگار بوده و در حالت‌های دقت BF16 و FP8 عملکرد مطلوبی دارد.
انویدیا برای ارتقای توانایی‌های مدل از فرایند پس‌آموزش چندمرحله‌ای بهره برده که شامل آموزش نظارت‌شده در حوزه‌هایی مانند ریاضی، تولید کد، چت و استفاده از ابزارها بوده است. همچنین برای بهبود عملکرد در دنبال‌کردن دستورات و توانایی استدلال، از الگوریتم GRPO (بهینه‌سازی نسبی سیاست گروهی) استفاده شده است.
عملکرد مدل جدید انویدیا در برابر رقبا


مدل جدید انویدیا در آزمون‌های معتبر مختلف عملکرد خیره‌کننده‌ای داسته است. برای مثال، در آزمون MATH500، عملکرد مدل از 80.40 درصد در حالت عادی به 97 درصد در حالت استدلال افزایش یافته است. همچنین در آزمون AIME25، امتیاز آن از 16.67 درصد به 72.50 درصد و در LiveCodeBench از 29.03 درصد به 66.31 درصد رسیده است.
این مدل در پاسخ به پرسش‌های عمومی (GPQA) در حالت استدلال فعال به امتیاز 76.01 درصد دست یافته که از DeepSeek R1 (با امتیاز 71.5 درصد) پیشی گرفته است. همچنین در آزمون IFEval برای پیروی از دستورات، امتیاز 89.45 درصد در برابر 83.3 درصد رقیب ثبت شده و در LiveCodeBench نیز اندکی بهتر عمل کرده است.
البته باید توجه کرد که مدل DeepSeek R1 در برخی آزمون‌های ریاضی سنگین همچنان بهتر عمل می‌کند، ازجمله در AIME25 با امتیاز 79.8 درصد برابر 72.50 درصد مدل انویدیا.
این مدل از زبان‌های متعددی ازجمله انگلیسی، آلمانی، فرانسوی، ایتالیایی، پرتغالی، هندی، اسپانیایی و تایلندی پشتیبانی می‌کند و برای کاربردهایی مانند چت‌بات، ساخت عامل‌های هوش مصنوعی، تولید کد و تولید با روش بازیابی-افزوده (RAG) قابل‌استفاده است.

لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/773371/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

جمینای 2.5 فلش معرفی شد؛ اولین هوش مصنوعی هیبریدی گوگل

انسان‌ها 41 هزار سال پیش از ضد آفتاب استفاده می‌کردند!

تغییر طراحی منو تنظیمات اندروید؛ رنگی‌تر و جذاب‌تر از قبل

نشانه‌های حیات در فراسوی منظومه / کشفی تازه از سیاره K2-18b

درخشش بیمه دی در خدمات‌رسانی به ایثارگران؛ رتبه اول توانگری و پرداخت به‌روز مطالبات درمانی

آیا هوش مصنوعی نژادپرست است؟

مایکروسافت گیفت‌کارت رایگان به گیمرهای ایکس‌باکس هدیه می‌دهد

یادگیری چگونه در مغز شکل می‌گیرد؟

OpenAI از «پردازش فلکس» رونمایی کرد؛ کاهش 50 درصدی هزینه استفاده از o3 و o4-mini

تاریخ پیش‌فروش جدید نینتندو سوییج 2 اعلام شد؛ قیمت همان 449٫99 دلار

اندروید 16 بتا 4 رسماً منتشر شد

ادعای رویترز: ترامپ با کمک اسپیس‌ایکس سامانه دفاع هوایی «گنبد طلایی» را راه‌اندازی می‌کند

دستاورد محققان چینی:‌ توسعه چشم مجهز به هوش مصنوعی که به نابینایان در راه رفتن کمک می‌کند

سحابی rim با فاصله‌ی 4 هزار سال نوری از زمین

اروپا ظاهرا جریمه سنگین اپل را به‌تعویق انداخته است

لپ‌تاپ ایسوس TUF Gaming A14 2025 با نمایشگر 165 هرتزی و RTX 5060 معرفی شد

سفر به هر کدام از سیارات منظومه شمسی چقدر طول می‌کشد؟

مشخصات دوربین CMF Phone 2 Pro رسماً تأیید شد: بهترین سیستم دوربین در رده قیمتی

هوش مصنوعی پرستاری را آسان می‌کند

ویژگی ریستارت خودکار اندروید هنوز فعال نشده است

اولین کتابخوان الکترونیکی تاشو جهان با نمایشگر 8 اینچی معرفی شد

اولترای تمام‌صفحه؛ پرچمدار متفاوت نوبیا به‌زودی از راه می‌رسد

گوگل به سوء‌استفاده از انحصار در تبلیغات آنلاین محکوم شد

پرده‌برداری از نقش ژن‌های ارثی در ابتلا به سرطان و درمان آن

اینستاگرام از قابلیت Blend رونمایی کرد؛ ساخت فید شخصی‌سازی‌شده برای ریلزها

نقشه مخفی ویروس زیکا برای عبور از جفت جنین لو رفت!

وزیر ارتباطات: قرارداد با اپراتور اینترنت ماهواره‌ای یاه‌کلیک در دستور کار است

زهره، خواهر خشن زمین

جعبه گشایی ویوو X200 Ultra رهبر آینده دوربین موبایل را در هر سه رنگ آن نشان می‌دهد

وقتی گوگرد هم تسلیم شد؛ سولفورزدای ایرانی جایگزین نوع آمریکایی شد

حجم نسخه PS5 بازی Forza Horizon 5 چقدر است؟

این محصولات سامسونگ احتمالاً رابط کاربری One UI 8 را دریافت می‌کنند

بازدید مدیرکل بنیاد مازندران از گلزار شهدای قائمشهر

مراسم گرامیداشت روز ارتش در گرگان برگزار شد

ارتش جمهوری اسلامی ایران؛ نماد اقتدار، عزت و فداکاری

با احداث این آزمایشگاه پنل‌های خورشیدی قوی‌تر می‌شوند

دیپ‌مایند رویکرد جدیدی برای جلوگیری از نفوذ هکرها به مدل‌های هوش مصنوعی معرفی کرد

عبور مرموز ماهواره استارلینک با رد رنگی در تصویر «گوگل‌مپس»!

گوشی اقتصادی جدید ایتل طراحی دوست‌داشتنی و مشخصات قابل قبول دارد

آخرین وضعیت سند راهبردی فضای مجازی/ بانک سپه هک نشده

پیدا شدن موجودات زنده در سنگ‌های 2 میلیارد ساله

غول‌های فناوری از متا به‌خاطر تنظیم نامناسب اسناد دادگاه و افشای اطلاعات حساس انتقاد کردند

سامسونگ شایعه‌ تأخیر در ساخت کارخانه‌ تراشه‌سازی تگزاس را رد کرد

یک دستگاه نوری جدید برای شبیه‌سازی سیاه‌چاله و سفیدچاله

تولید آیفون 16e در برزیل برای فرار از تعرفه‌های آمریکا آغاز شده است

پیش‌بینی دیابت با کمک وضعیت دندان‌ها!

مشخصات آنر X60 GT لو رفت؛ باتری پرظرفیت و تراشه نسبتاً قدیمی اسنپدراگون

کشف دورترین و قدیمی‌ترین همزاد کهکشان راه شیری توسط «جیمز وب»

گوگل ظاهراً روی نسخه جدید متریال دیزاین اندروید کار می‌کند

سامسونگ احتمالاً هوش مصنوعی Perplexity را به دستگاه‌های خود می‌آورد