گوگل ربات های پینگ پنگ باز می سازد
به گزارش وبلاگ ساعت گلورایا، گوگل در تازه ترین اقدامات خود در حال آموزش بازی پینگ پنگ به ربات ها برای تعامل بیشتر است.
گوگل ریسرچ به تازگی از دو پروژه تازه خود با یک ربات تنیس روی میز رونمایی کرد. تیم رباتیک در گوگل به یک بازوی رباتی آموزش داد که بیش از 300 شوت رالی با افراد دیگر بازی کند و سرویس ها را با دقت انسان های آماتور بازگرداند.ا
گرچه این ممکن است با توجه به اینکه بعضی افراد در تنیس روی میز چقدر بد هستند، چندان چشمگیر به نظر نرسد، می توان از همین تکنیک ها برای آموزش ربات ها برای انجام سایر وظایف پویا و با شتاب بالا استفاده کرد که به تعامل نزدیک انسان و ربات احتیاج دارند.
تنیس روی میز یک کار جالب برای یادگیری ربات ها به علت دو ویژگی مکمل است: این کار به حرکات سریع و دقیق در یک بازی ساختاریافته احتیاج دارد که در یک محیط ثابت و قابل پیش بینی رخ می دهد. الگوریتم یادگیری که ربات برای تصمیم گیری به آن تکیه می نماید، باید سخت کار کند تا به نتیجه برسد، بازی تنیس روی میز فعالیتی دو طرفه است: ربات می تواند با یک ربات دیگر (یا شبیه سازی) بازی کند یا با یک انسان واقعی برای آموزش. همه این ها آن را به مجموعه ای عالی برای آنالیز تعامل انسان و ربات و تکنیک های یادگیری تقویتی تبدیل می نماید.
مهندسان گوگل دو پروژه مجزا را با استفاده از یک ربات طراحی کردند. Iterative-Sim2Real که اواخر سال جاری در CoRL ارائه خواهد شد و GoalsEye که هفته آینده در IROS ارائه خواهد شد. Iterative-Sim2Real برنامه ای است که به ربات آموزش می دهد تا در مسابقات 300 تیری با انسان ها بازی کند، در حالی که GoalsEye به آن اجازه می دهد تا سرویس ها را به نقطه هدف خاصی روی میز با دقتی شبیه به انسان آماتور بازگرداند.
Iterative-Sim2Real کوششی برای غلبه بر مشکل مرغ و تخم مرغ آموزش ماشین ها برای تقلید از رفتار های انسانی است. تیم تحقیقاتی شرح می دهد اگر برای آغاز یک خط مشی خوب برای ربات (مجموعه ای از قوانین برای ربات) نداشته باشید، نمی توانید داده های با کیفیت بالا در خصوص نحوه تعامل مردم با آن جمع آوری کنید. اما بدون یک مدل رفتار انسانی برای آغاز، نمی توانید در وهله اول سیاست ربات را ارائه کنید. یک راهکار جایگزین آموزش انحصاری ربات ها در دنیای واقعی است.
با این حال، این فرآیند اغلب آهسته، هزینه بر است و چالش های مرتبط با ایمنی را به همراه دارد که با مشارکت مردم تشدید می گردد؛ به عبارت دیگر، زمان زیادی طول می کشد و مردم می توانند به وسیله بازو های رباتی که خفاش های تنیس روی میز را به اطراف می چرخانند، آسیب ببینند.
Iterative-Sim2Real با استفاده از یک مدل بسیار ساده از رفتار انسان به عنوان نقطه آغاز و سپس آموزش ربات هم با شبیه سازی و هم با یک انسان در دنیای واقعی، این مشکل را برطرف کند. پس از هر تکرار، هم مدل رفتار انسان و هم خط مشی ربات اصلاح می شوند. با استفاده از پنج سوژه انسانی، ربات آموزش دیده با Iterative-Sim2Real از یک رویکرد جایگزین به نام sim-to-real plus-tuning بهتر عمل کرد. این رالی به اندازه قابل توجهی کمتر بود که با کمتر از پنج شلیک به خاتمه رسید که میانگین طول رالی آن 9 درصد بیشتر بود.
از سوی دیگر، GoalsEye تصمیم گرفت تا با مجموعه ای از مسائل تمرینی مقابله نموده و به ربات آموزش دهد که توپ را به یک مکان دلخواه مانند گوشه سمت چپ پشتی یا دقیقا بالای تور در سمت راست برگرداند. یادگیری تقلید جایی که یک ربات یک استراتژی بازی برگرفته از داده های عملکرد انسان را توسعه می دهد؛ در تنظیمات با سرعت بالا به سختی انجام می گردد.
متغیر های زیادی وجود دارد که بر نحوه برخورد انسان با توپ پینگ پنگ تاثیر می گذارد که ردیابی همه چیز لازم برای یادگیری یک ربات را عملا غیرممکن می نماید. یادگیری تقویتی معمولا برای این موقعیت ها خوب است، اما می تواند آهسته و ناکارآمد باشد، به ویژه در آغاز، به عبارت دیگر، برای ایجاد یک استراتژی بازی نسبتا محدود به تکرار های زیادی احتیاج است.
GoalsEye کوشش می نماید با استفاده از مجموعه داده های کوچک، با ساختار ضعیف و غیرهدفمند اولیه که به ربات امکان می دهد اصول اولیه آنچه را که هنگام برخورد با توپ پینگ پنگ اتفاق می افتد، بیاموزد و سپس به او اجازه تمرین خود را بدهد، بر هر دو مجموعه مسائل غلبه کند. به آن بیاموزد که توپ را دقیقا به نقاط خاصی بزند. ربات پس از آموزش در 2480 نمایش اولیه، تنها در 9 درصد مواقع توانست توپ را به فاصله 30 سانتی متری برگرداند، اما پس از خودتمرینی برای 13500 شات، در 43 درصد مواقع دقیق بود.
در حالی که آموزش بازی به ربات ها ممکن است بی اهمیت به نظر برسد، تیم تحقیقاتی معتقد است حل این نوع مسائل تمرینی با تنیس روی میز کاربرد های بالقوه ای در دنیای واقعی دارد. Iterative-Sim2Real به ربات ها اجازه می دهد از تعامل با انسان ها بیاموزند، در حالی که GoalsEye نشان می دهد که چگونه ربات ها می توانند از داده های بدون ساختار یاد بگیرند و در یک محیط دقیق و پویا تمرین نمایند. بدترین سناریو این است که اگر اهداف بزرگ گوگل محقق نگردد، حداقل می توانند یک مربی ربات تنیس روی میز بسازند.
بیشتر بخوانید
منبع: popsci
وبلاگ ساعت گلورایا فضای مجازی دریچه فناوری
منبع: باشگاه خبرنگاران جوان