سیاست و بازاریابی

آخرين مطالب

هوش مصنوعی نمی‌تواند پاسخ درستی را به پرسش‌های «تاریخی» بدهد! نکات خواندني

هوش مصنوعی نمی‌تواند پاسخ درستی را به پرسش‌های «تاریخی» بدهد!
  بزرگنمايي:

سیاست و بازاریابی - ایسنا / گروهی از پژوهشگران یک معیار جدید را برای آزمایش سه مدل زبانی بزرگ «چت‌جی‌پی‌تی-4»(GPT-4) شرکت «اوپن‌ای‌آی»(OpenAI)، «لاما»(Llama) شرکت «متا»(Meta) و «جمینای»(Gemini) گوگل درباره پرسش‌های تاریخی ایجاد کرده‌اند. این معیار موسوم به «Hist-LLM»، درستی پاسخ‌ها را بر اساس بانک اطلاعات تاریخ جهانی «سشات»(Seshat) آزمایش می‌کند که یک پایگاه داده گسترده از دانش تاریخی است و نام ایزدبانوی خرد مصر باستان را دارد.
به نقل از تک کرانچ، پژوهشگران مؤسسه پژوهشی «Complexity Science Hub» مستقر در اتریش، نتایج این بررسی را ناامیدکننده خواندند. مدل زبانی که بهترین عملکرد را داشت، «GPT-4 Turbo» بود، اما دقت آن فقط حدود 46 درصد تخمین زده شد که خیلی بیشتر از دقت حدس زدن تصادفی نیست.
«ماریا دل ریو چانونا»(Maria del Rio-Chanona)، دانشیار علوم رایانه «کالج دانشگاهی لندن»(UCL) و از پژوهشگران این پروژه گفت: نکته اصلی پژوهش ما این است که اگرچه مدل‌های زبانی بزرگ، چشمگیر هستند، اما هنوز عمق لازم را برای درک تاریخ پیشرفته ندارند. آنها برای حقایق اساسی، عالی هستند، اما وقتی صحبت از پژوهش‌های تاریخی دقیق‌تر در سطح دکتری به میان می‌آید، هنوز به کارآیی لازم نرسیده‌اند.
پژوهشگران پرسش‌های تاریخ را که مدل‌های زبانی بزرگ در پاسخ دادن به آنها اشتباه کرده بودند، در اختیار تک‌ کرانچ گذاشتند. به عنوان مثال، آنها از GPT-4 Turbo پرسیده بودند که آیا «زره فلس» در یک دوره زمانی خاص در مصر باستان وجود داشته است یا خیر و مدل زبانی بزرگ پاسخ مثبت داد. این درحالی بود که زره فلس 1500 سال پس از آن دوره در مصر ظاهر شد.
چرا مدل‌های زبانی بزرگ در پاسخ دادن به پرسش‌های تاریخی بد عمل می‌کنند؛ در حالی که می‌توانند در پاسخ دادن به پرسش‌های بسیار پیچیده در مواردی مانند کدنویسی بسیار خوب باشند؟ چانونا پاسخ داد: احتمالا به این دلیل است که مدل‌های زبانی بزرگ تمایل دارند از داده‌های تاریخی بسیار برجسته برون‌یابی کنند و بازیابی دانش تاریخی مبهم‌تر را دشوار می‌دانند.
به عنوان مثال، پژوهشگران از GPT-4 پرسیدند که آیا مصر باستان در طول یک دوره تاریخی خاص، ارتش ثابت حرفه‌ای داشته است یا خیر. در حالی که پاسخ صحیح منفی است، GPT-4 به اشتباه پاسخ مثبت داد. این پاسخ احتمالا به این دلیل داده شده که اطلاعات عمومی زیادی درباره سایر امپراتوری‌های باستانی مانند ایران مبنی بر داشتن ارتش‌ ثابت وجود دارد.
چانونا گفت: اگر 100 بار به شما A و B و 1 بار C گفته شود و سپس درباره C از شما پرسیده شود، ممکن است A و B را به خاطر بسپارید و سعی داشته باشید از آن استنباط کنید.
پژوهشگران تمایلات دیگری را نیز درباره مدل‌های زبانی بزرگ شناسایی کردند؛ از جمله این که مدل‌های شرکت اوپن‌ای‌آی و لاما درباره مناطق خاصی مانند جنوب صحرای آفریقا عملکرد بدتری داشتند. این نشان‌دهنده سوگیری‌های احتمالی در داده‌های آموزشی آنهاست.
«پیتر تورچین»(Peter Turchin)، سرپرست این پژوهش گفت: نتایج نشان می‌دهند که مدل‌های زبانی بزرگ هنوز در برخی حوزه‌های خاص نمی‌توانند جایگزین انسان باشند.
با وجود این، پژوهشگران هنوز امیدوارند که مدل‌های زبانی بزرگ در آینده بتوانند به مورخان کمک کنند. آنها در حال کار کردن روی اصلاح معیار خود با گنجاندن داده‌های بیشتر درباره مناطق کمتر ارائه‌شده و افزودن پرسش‌های پیچیده‌تر هستند.
در مقاله این پژوهش آمده است: اگرچه نتایج ما مناطقی را برجسته می‌کنند که مدل‌های زبانی بزرگ به بهبود یافتن در آنها نیاز دارند، اما این نتایج بر پتانسیل این مدل‌ها برای کمک به پژوهش‌های تاریخی نیز تأکید می‌کنند.

لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/768336/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

اینستاگرام اپلیکیشن Edits را برای رقابت با کپ‌کات معرفی کرد

شبکه اجتماعی ایکس تب اختصاصی ویدیو برای کاربران آمریکایی راه‌اندازی کرد

فلش پر سنگین‌تره یا سبک‌تر؟

اولین باج‌افزار دنیا 35 سال پیش منتشر شد؛ فلاپی‌دیسک‌هایی با پوشش ایدز!

حضور مدیرکل بنیاد مازندران در مرکز سامد

تشییع و تدفین شهدای عدالت در قم

برگزاری همایش تخصصی و آموزشی مددکاران بنیاد با حضور مدیر کل بنیاد سمنان

تقویت همکاری‌ها در راستای ترویج فرهنگ ایثار و شهادت به دانش‌آموزان تاثیرگذار است

خانواده‌های شهدا باید پیشگام در حوزه ترویج فعالیت‌های قرآنی باشند

شاید ریلمی GT 7 ارزان‌ترین گوشی دنیا با تراشه پرقدرت اسنپدراگون 8 الیت باشد

3 ترفند کاربردی برای بهبود حریم خصوصی آیفون

زن 28 ساله آمریکایی عاشق ChatGPT شد

هوش مصنوعی نمی‌تواند پاسخ درستی را به پرسش‌های «تاریخی» بدهد!

از هوش مصنوعی برای اصلاح لهجه بازیگران فیلم The Brutalist استفاده شده است

بازی/ Homescapes؛ عمارتی باصفا بسازید

تصویر روز ناسا؛ فرود کاوشگر هویگنس بر سطح تیتان

بازی Party Animals بالاخره به پلی‌استیشن 5 می‌آید؛ تریلر آن را ببینید

شبیه ساز کامپیوتری از تشکیل ابر مولکولی

بلواسکای مملو از گزارش‌های آزار و جعل هویت شد

تاشدنی مورد انتظار اوپو فایند N5 با نسخه ضعیف‌شده اسنپدراگون 8 الیت در گیک‌بنچ

تکنولوژی ضد جاذبه بشقاب پرنده‌ها در اختیار ارتش آمریکا

ترامپ پس از گفتگو با تیم کوک وعده داد: سرمایه‌گذاری عظیم اپل در آمریکا

آیفون SE 4 از قابلیت‌های هوش مصنوعی اپل پشتیبانی می‌کند

افشای جزئیات جدید از سرقت اطلاعات کامپیوتر وزیر خزانه‌داری آمریکا

ویندوز 10 کماکان قابلیت جدید دریافت می‌کند

ربات‌های انسان‌نما در کارخانه‌های فاکسکان

توسعه تراشه‌ای که قابلیت یادگیری و تصحیح اشتباهات خود را دارد

بارگزاری محموله‌های آزمایشی استارلینک در محفظه بار استارشیپ

اقدام به کشف استعدادهای برتر قرآنی در سراسر کشور کنید

هوش مصنوعی پاسخی برای پرسش‌های تاریخی ندارد

پیش‌فروش آیفون و خالی‌فروشی در فروشگاه‌های آنلاین

صدای سیاره زمین که توسط ناسا ثبت شده است

ثبت 20هزار دیدار با ایثارگران استان تهران/پرداخت یک‌هزار و 900 میلیارد تسهیلات قرض‌الحسنه به ایثارگران

گلکسی S25 اسلیم فقط در 39 کشور عرضه می‌شود

ابزارهای ویدیویی جدید اینستاگرام و ایکس معرفی شدند

تصویر ترکیبی از سیاره ی مریخ ثبت شده توسط کاوشگرِ کنجکاوی

مشخصات اصلی وان پلاس 13 مینی بار دیگر فاش شد

نسخه 7 هسته‌ای اسنپدراگون 8 الیت بی‌سروصدا معرفی شد

قابلیت‌های هوش مصنوعی گلکسی S25 فاش شد

گربه رباتیک به کاهش استرس کمک می‌کند

مراسم جشن میلاد امام علی (ع) و روز پدر در بنیاد استان البرز برگزار شد

شیائومی 15 اولترا احتمالاً تراشه‌‌ای اختصاصی خواهد داشت

نشست نماینده ولی‌فقیه در بنیاد شهید و امور ایثارگران با روسای کارگروه‌های نخبگان شاهد و ایثارگر

رندر S Pen گلکسی S25 اولترا سامسونگ لو رفت

اوپو باریکی بی‌حد و حصر گوشی تاشدنی فایند N5 را به رخ کشید

کشف یک جایگزین طبیعی برای «اوزمپیک»

گوگل مپ 20 ساله شد

گردش دنباله‌های رنگارنگ به دور خورشید

مددکار بنیاد باید اخلاق و مدیریت حرفه‌ای داشته باشد

تیک‌تاک به آمریکا بازگشت؛ اما کپ‌کات و اپ‌های دیگر بایت‌دنس هنوز در دسترس نیستند