Використання оцінки руху камери для досягнення багатоцільового відстеження

Оцінка руху рухомої камери є всюдисущою проблемою у сфері комп’ютерного зору. Завдяки популярності таких технологій, як автошколи та автономні безпілотники, потрібні швидкі та ефективні алгоритми, що дозволяють обробляти відео на борту, щоб повернути своєчасну та точну інформацію за низьких обчислювальних витрат. Ця оцінка руху камери, або «оцінка позицій», також є важливою складовою цільового відстеження на борту транспортних засобів або платформ.

Дослідники університету Брігем Янг опублікували свої результати в IEEE / CAA Журнал Automatica Sinica, спільна публікація Інституту інженерів електротехніки та електроніки та Китайської академії наук. Вони знайшли спосіб значно скоротити час обчислень і складність оцінки пози за допомогою спритного «висівання» алгоритму, який вже використовується в галузі комп'ютерного зору.

Алгоритми оцінки пози використовують кадри відеоканалу з рухомої камери, щоб генерувати гіпотези щодо того, як камера рухалася протягом кожного наступного кадру. До цих пір алгоритми, які використовувались для оцінки пози, вимагали створити до п'яти-десяти гіпотез про те, як рухалася камера з урахуванням даних у відео-стрічці. Ці гіпотези були оцінені тим, наскільки вони добре відповідають даним, причому найкраща оцінка гіпотези була обрана як найкраща оцінка позиції. На жаль, генерація декількох гіпотез обчислювально дорога і призводить до уповільнення часу повернення для надійної оцінки позицій.

Дослідники знайшли спосіб заробити або давати підказки вже використаному алгоритму в комп'ютерному зорі, подаючи його інформацію між кожним кадром, тим самим значно зменшуючи потребу в створенні багатьох гіпотез. "При кожній ітерації ми використовуємо поточну найкращу гіпотезу для виведення алгоритму". Скорочення необхідних гіпотез безпосередньо призводить до скорочення часу та складності обчислень; "ми показуємо, що такий підхід суттєво зменшує кількість гіпотез, які необхідно сформувати та зарахувати для оцінки пози, тим самим дозволяючи виконувати алгоритм у реальному часі".

Потім команда порівняла свій метод висіву з іншими найсучаснішими алгоритмами оцінки пози, щоб класифікувати, як зменшення кількості гіпотез вплинуло на точність обчислення. "Після 100 ітерацій помилка методів висіву, що використовують попередню інформацію, порівнянна з п'ятиточковою розв'язкою поліномів OpenCV, незважаючи на те, що генерується лише одна гіпотеза за ітерацію, а не в середньому близько чотирьох гіпотез." Крім того, коли два алгоритми були вивчені вчасно, алгоритм команд значно перевершив інші сучасні методи. У більшості випадків новий алгоритм був у десять разів швидшим.

Потім група модифікувала свій алгоритм, щоб увімкнути відстеження цілі, і протестувала його на багатороторному БПЛА. Алгоритм успішно відстежував кілька цілей при роздільній здатності 640 x 480. Результати відповідали їх попередньому аналізу. "Повний алгоритм займає 29 мілісекунд на кадр, а це означає, що він здатний працювати в режимі реального часу зі швидкістю 34 кадрів в секунду (FPS)." Що стосується подальшого, команда планує додатки до реконструкції 3-D сцени та більш складні методи відстеження.

Facebook Comments