Дослідники тренують автономні безпілотники, використовуючи кросмодальні імітовані дані

Щоб летіти автономно, безпілотники повинні розуміти, що вони сприймають у навколишньому середовищі, і приймати рішення на основі цієї інформації. Новий метод, розроблений дослідниками університету Карнегі Меллона, дозволяє дронам самостійно навчатися сприйняттю та дії. Двоступеневий підхід долає «розрив між імітацією та реальністю» та створює спосіб безпечного розгортання безпілотників, навчених повністю за імітованими даними, в навігаційну програму в реальному світі.

"Як правило, у реальному світі трупи, які навчаються навіть на найкращих фотореалістичних модельованих даних, вийдуть з ладу, оскільки освітлення, кольори та текстури все ще занадто різні для перекладу", — сказав Роджеріо Бонатті, докторант Інституту робототехніки Школи комп'ютерних наук. "Наш модуль сприйняття навчається з двома способами для підвищення стійкості до змінних умов навколишнього середовища."

Перша модальність, яка допомагає тренувати сприйняття безпілотника — це зображення. Дослідники використовували фотореалістичний симулятор, щоб створити середовище, яке включало безпілотник, футбольне поле та червоні квадратні ворота, підняті з-під землі та розміщені випадковим чином для створення доріжки. Потім вони побудували великий набір модельованих зображень із тисяч випадково створених конфігурацій безпілотників та воріт.

Друга необхідна для сприйняття модальність — це знання положення та орієнтації воріт у просторі, що дослідники досягли за допомогою набору даних модельованих зображень.

Навчання моделі за допомогою декількох модальностей підкріплює надійне представлення досвіду безпілотника, це означає, що вона може зрозуміти суть поля та ворота таким чином, що переходить від моделювання до реальності. Стиснення зображень із меншою кількістю пікселів сприяє цьому процесу. Навчання з низькомірного зображення дозволяє моделі бачити через візуальний шум у реальному світі та визначати ворота.

Із засвоєнням сприйняття дослідники розгортають безпілотник в рамках моделювання, щоб він міг навчитися його політики управління, або як фізично рухатися. У цьому випадку він дізнається, яку швидкість застосувати під час навігації по ходу та зустрічає кожну браму. Оскільки це симульоване середовище, програма може обчислити оптимальну траєкторію безпілотників перед розгортанням. Цей метод забезпечує перевагу перед навчанням, яке керується вручну, за допомогою експертного оператора, оскільки навчання в реальному світі може бути небезпечним, трудомістким і дорогим.

Безпілотник вчиться орієнтуватися на курсі, проходячи навчальні кроки, продиктовані дослідниками. Бонатті заявив, що він кидає виклик певним сприйняттям і напрямкам, які дрон потребуватиме в реальному світі. "Я змушую дрон повертати вліво і вправо в різних формах доріжок, які стають важче, оскільки я додаю більше шуму. Робот не вчиться відтворювати проходження будь-якої конкретної доріжки. Швидше, стратегічно керуючи імітованим безпілотником, це вивчивши всі елементи та типи рухів, щоб автономізуватись, — сказав Бонатті.

Бонатті хоче підштовхнути сучасні технології, щоб наблизитись до здатності людини тлумачити екологічні підказки.

"Більша частина роботи над автономними перегонами безпілотників до цього часу була зосереджена на розробці системи, доповненої додатковими датчиками та програмним забезпеченням з єдиною метою швидкості. Натомість ми мали на меті створити обчислювальну тканину, натхненну функцією людського мозку, щоб відображення візуальної інформації на правильні керуючі дії, що проходять через приховане уявлення, — сказав Бонатті.

Але безпілотні перегони — це лише одна можливість для такого типу навчання. Метод поділу сприйняття та контролю може бути застосований до багатьох різних завдань щодо штучного інтелекту, таких як водіння чи приготування їжі. Хоча ця модель спирається на зображення та положення для навчання сприйняттю, інші способи, такі як звуки та форми, можуть використовуватися для зусиль, як ідентифікація автомобілів, дикої природи чи предметів.

Facebook Comments