Солдати могли навчити майбутніх роботів перевершувати людей

Надалі солдат і ігровий контролер можуть стати всім необхідним, щоб навчити роботів перевершувати людей.

У лабораторії розвитку армійських збройних можливостей армії США та Техаському університеті в Остіні дослідники розробили алгоритм, який дозволяє автономному наземному апарату вдосконалювати існуючі навігаційні системи, спостерігаючи за рухом людини. Команда випробувала свій підхід — називається адаптивним планувальним параметром навчання з демонстрації, або APPLD — на одному з експериментальних автономних наземних апаратів армії.

"Використовуючи такі підходи, як APPLD, теперішні солдати в існуючих навчальних закладах зможуть внести свій внесок у вдосконалення автономних систем, просто керуючи своїми транспортними засобами як нормально", — сказав армійський дослідник доктор Гаррет Уорнелл. "Такі методи будуть важливим внеском у плани армії розробити та оснастити бойові машини нового покоління, які обладнані для самостійного плавання у позашляхових умовах дислокації".

Дослідники сплавили машинне навчання за допомогою демонстраційних алгоритмів та більш класичних автономних навігаційних систем. Замість того, щоб взагалі замінювати класичну систему, APPLD навчається, як налаштувати існуючу систему так, щоб поводитися як людська демонстрація. Ця парадигма дозволяє розгорнутій системі зберігати всі переваги класичних навігаційних систем — такі, як оптимальність, пояснюваність та безпеку — і при цьому дозволяє гнучкості та адаптуванню системи до нових середовищ, сказав Уорнелл.

"Однією демонстрацією водіння людини за допомогою повсякденного бездротового контролера Xbox дозволило APPLD навчитися налаштовувати існуючу автономну систему навігації автомобіля по-різному в залежності від конкретного місцевого середовища", — сказав Уорнелл. "Наприклад, перебуваючи в тісному коридорі, водій людини сповільнився і обережно їхав. Після дотримання цієї поведінки автономна система навчилася також знижувати свою максимальну швидкість і збільшувати свій обчислювальний бюджет у подібних умовах. Це врешті-решт дозволило транспортному засобу успішно автономно переходити по інших тісних коридорах, де раніше не виходило ".

Це дослідження є частиною ініціативи "Відкритий кампус" армії, завдяки якій армійські вчені в Техасі співпрацюють з академічними партнерами UT Austin.

"APPLD — це ще один приклад зростаючого потоку результатів досліджень, який сприяв унікальній домовленості про співпрацю між УТ Остін та Армійською дослідницькою лабораторією", — сказав доктор Пітер Стоун, професор та голова консорціуму робототехніки в УТ Остін. "Вкладаючи доктора Уорнелла в штат Остін Остін на повний робочий день, ми можемо швидко визначити і вирішити проблеми досліджень, які є як передовими науковими досягненнями, так і безпосередньо стосуються армії".

Експерименти команди показали, що після тренувань система APPLD змогла швидше орієнтуватися в тестових середовищах і з меншими відмовами, ніж у класичній системі. Крім того, навчена система APPLD часто орієнтувалася в навколишньому середовищі швидше, ніж людина, яка її навчала. Рецензований журнал, Листи робототехніки та автоматизації IEEE, опублікував роботу команди: APPLD: Параметр адаптивного планувальника, що навчається на основі демонстрації.

"З точки зору машинного навчання, APPLD контрастує з так званими системами навчання в кінці, які намагаються вивчити всю навігаційну систему з нуля", — сказав Стоун. "Ці підходи, як правило, вимагають багато даних і можуть призвести до поведінки, яка не є ні безпечною, ні надійною. APPLD використовує ті детально розроблені системи управління, фокусуючи свої зусилля машинного навчання на процесі настройки параметрів, який є часто робиться на основі інтуїції однієї людини ».

APPLD являє собою нову парадигму, в якій люди, які не мають знань експертного рівня з робототехніки, можуть допомогти навчити та вдосконалити автономну навігацію в різних середовищах. Замість невеликих команд інженерів, які намагаються вручну налаштувати навігаційні системи в невеликій кількості тестових середовищ, практично необмежена кількість користувачів зможе надати системі необхідні дані, щоб налаштувати себе на необмежену кількість середовищ.

"Діючі автономні навігаційні системи, як правило, повинні бути перероблені вручну для кожного нового середовища розгортання", — сказав дослідник армії доктор Джонатан Фінк. "Цей процес надзвичайно складний — його повинен робити хтось із великим навчанням робототехніки, і він вимагає багато спроб і помилок, поки не зможуть знайти потрібні налаштування системи. На відміну від цього, APPLD налаштовує систему автоматично, спостерігаючи за людським приводом. система — щось, що може зробити кожен, якщо має досвід роботи з контролером відеоігор. Під час розгортання APPLD також дозволяє системі перенастроюватися в режимі реального часу, коли зміниться середовище ".

Основна увага армії на модернізації бойових машин наступного покоління включає в себе розробку як необов'язково бойових машин, так і робототехнічних машин, які можуть самостійно переходити в позашляхових умовах розгортання. Хоча солдати можуть орієнтуватися в цих середовищах, керуючи поточними бойовими машинами, оточення залишаються надто складними для сучасних автономних навігаційних систем. APPLD та подібні підходи забезпечують новий потенційний шлях армії для вдосконалення існуючих можливостей автономної навігації.

"Крім безпосереднього відношення до армії, APPLD також створює можливість подолати розрив між традиційними інженерними підходами та новими технологіями машинного навчання, створити надійні, адаптивні та універсальні мобільні роботи в реальному світі", — сказав д-р. Xuesu Xiao, докторальний дослідник UT Austin та провідний автор статті.

Для продовження цього дослідження команда протестує систему APPLD у різних умовах зовнішнього середовища, залучає водіїв для солдатів та експериментує з широким розмаїттям існуючих підходів до автономної навігації. Крім того, дослідники будуть досліджувати, чи може включення додаткової інформації датчиків, таких як зображення камер, може спричинити вивчення більш складних форм поведінки, таких як налаштування навігаційної системи на роботу в різних умовах, наприклад, на різних місцевостях або з іншими присутніми об'єктами.

Facebook Comments