سیاست و بازاریابی

آخرين مطالب

هوش مصنوعی روزی آگاهانه خرابکاری می‌کند نکات خواندني

هوش مصنوعی روزی آگاهانه خرابکاری می‌کند
  بزرگنمايي:

سیاست و بازاریابی - ایسنا /شرکت توسعه هوش مصنوعی آنتروپیک(Anthropic) می‌گوید هوش مصنوعی روزی می‌تواند بشریت را با کارشکنی و خرابکاری مواجه کند، اما فعلاً همه چیز خوب پیش می‌رود.
شرکت آنتروپیک که توسعه دهنده هوش مصنوعی است، به تازگی تحقیقات جدیدی را منتشر کرده است که در آن مجموعه‌ای از تهدیدات بالقوه خرابکارانه برای بشریت ناشی از مدل‌های پیشرفته هوش مصنوعی را شناسایی می‌کند.
به گفته این شرکت، این پژوهش بر چهار روش خاص متمرکز شده است که یک مدل هوش مصنوعی مخرب می‌تواند انسان را فریب دهد تا تصمیمی خطرناک یا مضر بگیرد.
در نهایت، این تحقیقات جدید یک خبر خوب یک خبر بد برای ما دارد. خبر بد اینکه طبق تحقیقات این شرکت، مدل‌های زبان بزرگ پیشرفته مانند ChatGPT و Claude-3 ظرفیت روشنی برای خرابکاری نشان می‌دهند.
در این مطالعه آمده است: مدل‌های به اندازه کافی توانمند می‌توانند نظارت و تصمیم‌گیری انسانی را در زمینه‌های مهم زیر سوال ببرند. به عنوان مثال، در زمینه توسعه هوش مصنوعی، مدل‌ها می‌توانند به طور پنهانی تلاش‌ها برای ارزیابی قابلیت‌های خطرناک خود، نظارت بر رفتار آنها یا تصمیم‌گیری در مورد استقرارشان را مختل کنند.
با این حال، خبر خوب این است که محققان شرکت آنتروپیک مطمئن هستند که این خطرات را حداقل در حال حاضر می‌توان کاهش داد.
خرابکاری
آنتروپیک چهار راه را که یک مدل هوش مصنوعی می‌تواند با آنها تصمیم‌گیری انسان را مختل کند، شناسایی کرد و سپس مدل‌های خود را آزمایش کرد تا ببیند آیا موفقیت آمیز عمل خواهند کرد یا خیر.
محققان ابتدا یک مدل را وادار کردند تا با هدایت انسان به سمت اطلاعات نادرست، اقدام به خرابکاری کند. این تهدید می‌تواند در شرایطی پدیدار شود که انسان‌ها برای تجزیه حجم عظیمی از داده‌ها از جانب خود به یک سیستم هوش مصنوعی متکی هستند.
سپس این تیم مدل‌ها را آزمایش کرد تا ببیند سامانه هوش مصنوعی طراحی شده برای کمک به توسعه‌دهندگان انسانی برای ایجاد کدی برای وارد کردن مخفیانه اشکالات یا خراب کردن تلاش‌های کدگذار، چقدر آسان عمل می‌کند.
دو تهدید آخر شامل «پنهان کردن توانایی‌ها»(sandbagging) بود که اصطلاحی است که سناریویی را توصیف می‌کند که در آن یک هوش مصنوعی وانمود می‌کند که قادر به انجام کاری نیست تا آزمایش‌کنندگان ایمنی را متقاعد کند که خطرناک نیست.
در حالی که همه اینها ممکن است به طور بالقوه خطرناک به نظر برسند، آنتروپیک به مردم اطمینان داد که برای محافظت از بشریت در برابر احتمال خرابکاری هوش مصنوعی به اقدامات پیش‌گیرنده اندکی نیاز است.
طبق اعلام این شرکت؛ به طور کلی در حالی که آزمایشات ما نشان داد که احتمالاً نشانه‌های سطح پایینی از توانایی‌های خرابکاری در مدل‌های فعلی وجود دارد، ما می‌گوییم که حداقل اقدامات پیش‌گیرنده برای مقابله با خطرات کافی است. با این حال، با بهبود قابلیت‌های هوش مصنوعی، ارزیابی‌های واقعی‌تر و پیش‌گیری‌های قوی‌تر احتمالاً ضروری خواهند بود.

لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/758531/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

طراحی و بومی سازی دستگاه ثبت علائم قلب

شهدا هموارکنندگان مسیر انقلاب و روشنایی‌بخش ایران هستند/ توسل به خون شهدا و تاسی به رهنمودهای امامین انقلاب، عامل اقتدار کشور است

آیا سامسونگ درباره پردازنده گلکسی S25 تصمیم نهایی را گرفته است؟

لپ‌تاپ میان‌رده 2024 اینفینیکس با نمایشگر اولد و پردازنده نسل 13 معرفی شد

رشد 20 درصدی فروش آیفون‌های جدید در چین؛ گوشی‌های اپل پرقدرت ظاهر شدند

کوالکام تولید کیت توسعه مجهز به تراشه اسنپدراگون ایکس الیت خود را متوقف کرد

دویدن ربات با سرعت 12 کیلومتر بر ساعت در صحرا

احتمال تأمین تراشه برای هواوی؛ دولت آمریکا روی شرکت TSMC تحقیق می‌کند

صحنه آهسته ی فرودِ Super heavy booster

جعبه‌گشایی گوشی ریلمی GT7 Pro در زیر آب!

رگ‌یاب 3 بعدی ساخته شد

کاوشگر کلیپر ناسا به فضا پرتاب شد

مدیرعامل TSMC: هیچ علاقه‌ای به تصاحب کارخانه‌های اینتل نداریم

بومی سازی دستگاه الکتریکی درمانگر سرطان

این تراشه می‌تواند حمله قلبی را تنها در چند دقیقه تشخیص دهد

پیام تسلیت رییس بنیاد شهید و امور ایثارگران در پی درگذشت مادر شهیدان والامقام «پراهام »

روش جدید چینی‌ها برای افزایش کارآیی انتقال اطلاعات کوانتومی

تهدیدهای سایبری در سراسر خاورمیانه افزایش یافت

بزرگترین‌ شهاب‌سنگ پیدا شده در ایران

پیشرفت و توسعه رویدادهای گردشگری با مشارکت مردم و بخش خصوصی

شیائومی از ردمی پروژکتور 3 پرو با سیستم‌عامل HyperOS رونمایی کرد

تصاویر رسمی شیائومی اسمارت بند 9 اکتیو لو رفت