همه چیز درباره هوش مصنوعی جدید «اوپنایآی»
نکات خواندني
بزرگنمايي:
سیاست و بازاریابی - ایسنا /«اوپنایآی» روز دوشنبه خانواده جدیدی از مدلهای هوش مصنوعی خود را به نام «GPT-4.1» معرفی کرد که تمرکز آن بر کدنویسی است.
«اوپنایآی»(OpenAI) در حال حاضر مدلهای «GPT-4.1»، «GPT-4.1 mini» و «GPT-4.1 nano» را دارد که برتری خود را در کدنویسی و دنبال کردن دستورالعملها نشان دادهاند. مدلهای چندوجهی که از طریق API اوپنایآی در دسترس هستند، میتوانند هر بار تقریبا یک میلیون توکن (750 هزار کلمه) را دریافت کنند. این میزان کلمه، یک متن طولانیتر از رمان «جنگ و صلح» را تشکیل میدهد.
به نقل از تک کرانچ، GPT-4.1 زمانی وارد شده است که رقبای اوپنایآی مانند «گوگل» و «آنتروپیک» تلاشهای خود را برای ساخت مدلهای برنامهنویسی پیچیده افزایش میدهند. «جمینای 2.5 پرو»(Gemini 2.5 Pro) که اخیرا توسط گوگل منتشر شد و یک میلیون توکن را پوشش میدهد، رتبه بالایی را در معیارهای محبوب کدنویسی دارد. «کلود 3.7 سونت»(Claude 3.7 Sonnet) و «V3» ارتقاءیافته شرکت چینی «دیپسیک»(DeepSeek) نیز همین طور هستند.
هدف بسیاری از غولهای فناوری از جمله اوپنایآی، آموزش دادن مدلهای کدنویسی هوش مصنوعی است که میتوانند وظایف پیچیده مهندسی نرمافزار را انجام دهند. «سارا فریار»(Sarah Friar)، مدیر ارشد مالی اوپنایآی ماه گذشته در نشست فناوری لندن گفت که جاهطلبی بزرگ این شرکت، ایجاد یک مهندس نرمافزار عاملی است. این شرکت ادعا میکند که مدلهای آینده آن میتوانند همه برنامهها را به صورت سرتاسری برنامهریزی کنند و بر جنبههایی مانند تضمین کیفیت، آزمایش مشکل و نوشتن مستندات مدیریت داشته باشند.
مدل GPT-4.1 گامی در این مسیر است. یکی از سخنگویان اوپنایآی در یک ایمیل به تک کرانچ، گفت: ما GPT-4.1 را برای استفاده در دنیای واقعی بر اساس بازخورد مستقیم تنظیم کردهایم تا در زمینههایی که توسعهدهندگان بیشتر به آنها اهمیت میدهند مانند برنامهنویسی فرانتاند، کاهش ویرایشهای اضافی، فرمتهای قابل اعتماد، رعایت ساختار پاسخ و سفارش، استفاده ثابت از فناوری و موارد دیگر بهبود پیدا کنیم. این پیشرفتها توسعهدهندگان را قادر میسازند تا عواملی را ارائه دهند که در کارهای مهندسی نرمافزار در دنیای واقعی به طور قابل توجهی بهتر باشند.
اوپنایآی ادعا میکند که مدل کامل GPT-4.1 از مدلهای GPT-4o و GPT-4o mini در معیارهای کدنویسی مانند «SWE-bench» بهتر عمل میکند. گفته میشود که GPT-4.1 mini و nano با کمی دقت، کارآمدتر و سریعتر عمل میکنند و GPT-4.1 nano سریعترین و ارزانترین مدل آن است.
مدل GPT-4.1 برای هر میلیون توکن ورودی، دو دلار و برای هر میلیون توکن خروجی، هشت دلار هزینه دارد. هزینه GPT-4.1 mini برای هر میلیون توکن ورودی 0.40 دلار و برای میلیون توکن خروجی 1.60 دلار است و GPT-4.1 nano برای هر میلیون توکن ورودی 0.10 دلار و برای هر میلیون توکن خروجی 0.40 دلار هزینه دارد.
آزمایش داخلی اوپنایآی نشان میدهد GPT-4.1 که میتواند همزمان توکنهای بیشتری را نسبت به GPT-4o تولید کند (32768 در مقابل 16384)، امتیازی بین 52 تا 54.6 درصد در پایگاه داده «SWE-bench Verified» کسب کرده است. اوپنایآی در یک پست وبلاگ خاطرنشان کرد که برخی از راهحلها برای مشکلات SWE-bench Verified را نمیتوان در زیرساختهای آن اجرا کرد و به همین دلیل، این دامنه امتیازها وجود دارند. این ارقام کمی کمتر از امتیازات گزارششده توسط گوگل و آنتروپیک برای جمینای 2.5 پرو (63.8 درصد) و کلود 3.7 سونت (62.3 درصد) هستند.
اوپنایآی در یک ارزیابی جداگانه، GPT-4.1 را با استفاده از «Video-MME» بررسی کرد که برای ارزیابی توانایی یک مدل در درک محتوای ویدئوها طراحی شده است. اوپنایآی ادعا میکند که GPT-4.1 به دقت 72 درصدی در مقوله ویدئوهای طولانی و بدون زیرنویس رسیده است.
اگرچه GPT-4.1 امتیاز قابل قبولی را در معیارها کسب کرده و دارای یک رکورد جدیدتر در آموزش داده است، اما به خاطر داشته باشید حتی برخی از بهترین مدلهای امروزی در حال دستوپنجه نرم کردن با وظایفی هستند که متخصصان را غافلگیر نمیکنند. به عنوان مثال، بسیاری از پژوهشها نشان دادهاند که مدلهای تولیدکننده کد اغلب در رفع و حتی معرفی آسیبپذیریها و مشکلات امنیتی شکست میخورند.
همچنین، اوپنایآی تصدیق میکند که GPT-4.1 هر چه توکنهای ورودی بیشتری داشته باشد، کمتر قابل اعتماد میشود؛ یعنی احتمال بروز اشتباه افزایش مییابد. در یکی از آزمایشهای خود اوپنایآی موسوم به «OpenAI-MRCR»، دقت مدل از حدود 84 درصد با 8000 توکن به 50 درصد با یک میلیون توکن کاهش یافت. اوپنایآی میگوید که GPT-4.1 نسبت به GPT-4o به معنای واقعی کلمه دقیقتر است و گاهی اوقات به درخواستهای مشخصتر و واضحتر نیاز دارد.
لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/773733/