هوش مصنوعی جدید دیپ‌مایند بدون نیاز به آموزش به بازی‌ها مسلط می‌شود

جدیدترین هوش مصنوعی«دیپ مایند» با نام «MuZero» می‌تواند قدرتمندتر از برنامه‌های قبلی و بدون نیاز به آموزش دیدن و با روش‌هایی نزدیک به روش تصمیم گیری انسان‌ها در بازی‌هایی مانند شطرنج، گیم و گو به راحتی قهرمان شود.

MuZero جدیدترین هوش مصنوعی است که توسط دیپ مایند توسعه یافته و می‌تواند بدون اینکه اطلاعاتی از قوانین بازی بداند، در بازی‌های مختلف مهارت خوبی از خود نشان دهد. اولین نسخه این برنامه در سال ۲۰۱۹ برای بازی‌های مختلف گیم و شطرنج و … مورد بررسی قرار گرفت.

«آلفاگو» نخستین هوش مصنوعی بود که توسط دیپ مایند برای بازی «گو» توسعه یافت. آلفاگو با الگوریتم جستجوی درختی موسوم به مونت کارلو حرکات را براساس اطلاعات قبلی خود یاد می‌گیرد.

سپس دیپ مایند، «آلفاگو زیرو» را توسعه داد که توانست در کمتر از یک روز به قهرمان شطرنج تبدیل شود. آلفاگو زیرو بعد از هر اشتباه در بازی بعدی، حرکات اصلاحی در پیش می‌گیرد و به شکلی خود را آموزش می‌دهد. این رفتار هوش مصنوعی آلفا گو از مغز انسان الگوبرداری شده و توانایی پردازش خوبی دارد.

اکنون جدیدترین هوش مصنوعی دیپ‌مایند با نام MuZero، می‌تواند به سرعت و با روش خود آموزی و بدون نیاز به آموزش، تسلط خوبی به قواعد بازی‌های شطرنج، شوگی و گیم پیدا کرده و توانایی‌های خوبی از خود به نمایش بگذارد.

ایجاد الگوریتمی که بتواند خود را با شرایط مختلف انطباق دهد، چالشی است که محققان هوش مصنوعی در تلاش هستند آن را حل کنند. در بازی‌هایی مانند شطرنج، نحوه بازی حریف می‌تواند در تعیین استراتژی بازی موثر باشد. هوش مصنوعی جدید دیپ‌مایند سعی می‌کند با استفاده از روشی به نام lookahead، سعی می‌کند چندین حرکت را در بازی از قبل برنامه ریزی کرده و حالت‌های احتمالی که ممکن است در آینده پیش بیاید را پیش‌بینی کند.

در موقعیت‌های واقعی بازی، قوانین ساده‌ای وجود دارند که قابل آموزش دادن نیستند و در حین بازی ممکن است طرفین از چنین رویکردهایی استفاده کنند. محققان در تلاش هستند هوش مصنوعی رفتار و عملکردی نزدیک به بازی واقعی و حتی قدرتمندتر از آن از خود نشان دهد. اما پیاده سازی چنین رویکردهایی گاهی آنقدر پیچیده می‌شود که تقریبا کار را به مرز غیرممکن شدن می‌رساند.

هوش مصنوعی MuZero به جای مدل‌سازی کل محیط، تنها مولفه‌های مهم را نیز در تصمیم گیری‌های خود مورد توجه قرار می‌دهد. این روش هوش مصنوعی جدید دیپ مایند شباهت زیادی به روش تصمیم گیری انسان دارد. به علاوه، بررسی‌ها نشان می‌دهد MuZero هر چقدر زمان بیشتری برای تحلیل و بررسی صرف کند، بهتر می‌تواند تصمیم گیری کند.

admin_ahamze

دیدگاه کاربران ...

    لطفا قبل از ارسال سئوال یا دیدگاه سئوالات متداول را بخونید.
    جهت رفع سوالات و مشکلات خود از سیستم پشتیبانی سایت استفاده نمایید .
    دیدگاه ارسال شده توسط شما ، پس از تایید توسط مدیران سایت منتشر خواهد شد.
    دیدگاهی که به غیر از زبان فارسی یا غیر مرتبط با مطلب باشد منتشر نخواهد شد.

    دیدگاه خود را بیان کنید

جدیدترین محصولات