فایل سیستم پرقدرت 3FS توسط DeepSeek منتشر شد؛ سرعت خوانش 6.6 ترابایت در ثانیه!
نکات خواندني
بزرگنمايي:
سیاست و بازاریابی - شهر سخت افزار / شرکت چینی جنجالی DeepSeek AI فایل سیستم اختصاصی Fire-Flyer (3FS) را منبع باز کرد که میتواند گام بلندی در تحول زیرساختهای پردازش هوش مصنوعی باشد. این فایل سیستم موازی از کش استفاده نمیکند و در عوض بر روی عملکرد بالا در دسترسی تصادفی متمرکز است که توانسته سرعت خوانش 7.3 ترابایتی را به نمایش بگذارد. جزئیات جالب را در ادامه خبر بخوانید.
انتشار متنباز این فایل سیستم، فرصتی برای پژوهشگران و شرکتهای فناوری فراهم میکند تا عملکرد آن را آزمایش کرده و در پروژههای AI-HPC خود به کار گیرند. فایل سیستم 3FS اکنون روی گیتهاب دیپسیک در دسترس است، اما باید دید آیا میتواند در برابر رقابت موجود در بازار و موانع ناشی از نگرشهای ضد فناوریهای چینی، به موفقیت گسترده دست پیدا کند یا خیر.
تمرکز بر سرعت خواندن تصادفی؛ یک تغییر پارادایم در AI-HPC
3FS یک فایل سیستم مبتنی بر لینوکس است که برای پاسخگویی به نیازهای خاص مدلهای زبانی بزرگ (LLM) طراحی شده است. برخلاف اغلب فایل سیستمها که از کش خواندن (Read Cache) برای بهبود عملکرد استفاده میکنند، 3FS تقریباً بهطور کامل این قابلیت را نادیده میگیرد و بهجای آن، سرعت خواندن تصادفی را در اولویت مطلق قرار میدهد.
این تصمیم فنی، ریشه در نحوه پردازش دادههای آموزشی توسط مدلهای هوش مصنوعی دارد. در فرایند آموزش، پردازندهها دائماً به دادههای تصادفی نیاز دارند، اما هر قطعه داده معمولاً فقط یکبار خوانده میشود. در چنین شرایطی، استفاده از کش خواندن نهتنها کمکی نمیکند، بلکه حتی ممکن است بر روی یادگیری مدل تاثیر منفی بگذارد. تکرار الگوهای خواندن، میتواند منجر به همبستگی نادرست بین دادههای مختلف در فرآیند آموزش شود، مسئلهای که 3FS با حذف کش خواندن از آن جلوگیری میکند.
در آزمایشهای انجامشده روی یکی از کلاسترهای پردازشی دیپسیک به نام Fire-Flyer 2، این فایل سیستم توانست سرعت خوانش 6.6 ترابایت در ثانیه را به نمایش بگذارد، درحالیکه 1.4 ترابایت در ثانیه دیگر نیز از طریق اجرای همزمان وظایف آموزشی پردازشی به آن اضافه شد.
در مقایسه، Ceph که یکی از فایل سیستمهای موازی شناختهشده محسوب میشود، در اوایل 2024 توانست تنها به 1.1 ترابایت بر ثانیه دست پیدا کند، آنهم با پیکربندی سختافزاری مشابه (68 نود ذخیرهسازی با SSDهای 16 ترابایتی و شبکه 200Gbps). این تفاوت قابل توجه، 3FS را به گزینهای جذاب برای محققان و شرکتهای فعال در زمینه هوش مصنوعی تبدیل کرده است.
یکی از نکات برجسته در مقاله منتشرشده توسط تیم DeepSeek این است که سیستم Fire-Flyer 2 با استفاده از 3FS توانسته 80 درصد از عملکرد سرورهای DGX-A100 انویدیا را با تنها 50 درصد هزینه و 60 درصد مصرف انرژی ارائه دهد. این موضوع میتواند خبر خوبی برای شرکتهایی باشد که به دنبال گزینههای بهینهتر و ارزانتر برای آموزش مدلهای هوش مصنوعی هستند.
لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/771099/