هوش‌ مصنوعی شرکت دیپ مایند در حال یادگیری پارکور

هوش‌ مصنوعی شرکت دیپ مایند در حال یادگیری پارکورReviewed by رضا بیگدلی on Jul 18Rating: 5.0هوش‌ مصنوعی شرکت دیپ مایند در حال یادگیری پارکورهوش‌ مصنوعی شرکت دیپ مایند در حال یادگیری پارکور

همگام ماندن با آخرین تحقیقات انجام‌شده در زمینه‌ی هوش مصنوعی، می‌تواند تجربه‌ی غیر‌عادی و عجیبی باشد. از طرفی با آخرین آزمایش‌های انجام‌شده در این حوزه و مقاله‌هایی روبه‌رو هستیم که هرکدام می‌توانند بالقوه یکی از بزرگ‌ترین انقلاب‌های صنعتی همه‌ی اعصار باشند و از طرف دیگر، مواردی مشاهده می‌کنیم که ممکن است گاهی اوقات عجیب و غریب و گاهی خنده‌دار باشند.شرکت دیپ‌مایند که زیرمجموعه هوش مصنوعی گوگل است، در مقاله‌ای با عنوان «پدیدار شدن رفتار‌های حرکتی در محیط‌های غنی» از تحقیقاتی در زمینه‌ی چگونگی استفاده از یاد‌گیری تقویتی (RL) در آموزش یک کامپیوتر برای مسیر‌یابی در محیط‌های پیچیده و نا‌آشنا صحبت می‌کند. این یکی از زمینه‌های اساسی مطرح در هوش مصنوعی است که در حال حاضر در محیط‌های مجازی محک زده می‌شود؛ ولی در آینده‌ای نه‌چندان دور منجر به ساخت ربات‌هایی خواهد شد که مسیر خود را از طریق راه‌پله تا منزل شخصی صاحبشان پیدا خواهند کرد.

تمام حرکت‌هایی که این ربات مجازی انجام می‌دهد، به‌صورت خودکار فراگرفته است. پرش، جهش و حرکت کردن از زیر موانع، تمام این‌ها حرکاتی هستند که این کامپیوتر به‌تنهایی به‌عنوان بهترین روش برای جابجایی از یک نقطه به نقطه‌ی دیگر آموخته است. تمام کاری که برنامه‌نویسان دیپ‌مایند انجام داده‌اند، وصل کردن تعدادی سنسور مجازی به این ربات بوده است. (که بتواند برای مثال تشخیص بدهد در وضعیت ایستاده قرار دارد یا نه). سپس این ربات برای حرکت به جلو تشویق می‌شود. بقیه‌ی کار‌ها توسط هوش مصنوعی انجام می‌شود که با آزمون و خطا، بهترین راه را برای حرکت پیدا می‌کند.نوآوری که در این برنامه انجام‌ شده، این است که محققان توسط این آزمایش می‌توانند بررسی کنند که شرایط سخت چگونه می‌تواند به رفتار پیچیده و حرکات مشخص ربات‌ها منجر شود. به‌طور معمول، یادگیری از طریق تقویت و اصلاح رفتار‌های پیشین ممکن است منجر به حرکات غیر معمولی بشود که با تغییر جزئی شرایط، منجر به خطا و شکست شوند. مثل کودکی که نحوه‌ی استفاده از پله‌ی معمولی خانه را می‌داند؛ ولی در دفعات اول استفاده از پله‌برقی شکست می‌خورد. این آزمایش ثابت کرد که تحت این شرایط، یادگیری تقویت می‌تواند برای حرکات پیچیده استفاده شود.