Дослідники вивчають, чому нейронні мережі ефективні у своїх прогнозах

Штучний інтелект, машинне навчання та нейронні мережі — це терміни, які все частіше використовуються у повсякденному житті. Розпізнавання обличчя, виявлення об’єктів, класифікація та сегментація людей — загальні завдання алгоритмів машинного навчання, які зараз широко використовуються. В основі всіх цих процесів лежить машинне навчання, а це означає, що комп'ютери можуть фіксувати основні властивості або ключові характеристики процесів, в яких взаємозв'язки між об'єктами дуже складні. Процес навчання включає хороші і погані приклади, не маючи попередніх знань про об'єкти чи основні закони фізики.

Однак, оскільки це процес сліпої оптимізації, машинне навчання схоже на чорний ящик: комп’ютери приймають рішення, які вони вважають дійсними, але незрозуміло, чому приймається одне, а не інше рішення, тому внутрішній механізм методу досі незрозумілий. Як результат, прогнозування машинного навчання для критичних ситуацій є ризикованим і аж ніяк не надійним, оскільки результати можуть бути оманливими.

У цьому дослідженні дослідницька група, до складу якої входять Володимир Баулін з Департаменту хімічної інженерії URV, Марк Вернер (Інститут полімерних досліджень Лейбніца в Дрездені) та YachongGuo (Нанкінський університет, Китай) перевірила прогнози нейронної мережі для перевірити, чи збігаються вони з реальними результатами. З цією метою вони обрали чітко визначений практичний приклад: нейронна мережа повинна була сконструювати молекулу полімеру, яка пройде ліпідну мембрану за якомога коротший час. Ліпідна мембрана є природним бар’єром, який захищає клітини від пошкодження та зовнішніх компонентів. Для моніторингу передбачення нейронної мережі дослідники розробили новий чисельний метод, який використовує вичерпну систему перерахування, яка визначає всі можливості полімерної композиції шляхом прямого програмування високопродуктивних графічних карт в паралельних розрахунках.

"Традиційний процесор комп'ютера може містити максимум 12-24 ядра для обчислень, але графічні карти призначені для паралельних обчислень пікселів зображення та відео, і вони мають тисячі ядер обчислень, оптимізованих для паралельних обчислень", — пояснює Володимир Баулін . Ця величезна обчислювальна потужність генерує тисячі мільйонів комбінацій полімерів всього за кілька секунд або хвилин. Таким чином може бути сформована карта, яка містить усі можливі комбінації, а отже, як нейронна мережа вибирає правильний результат, можна контролювати.

"Що дивно, так настільки проста, мінімальна мережа, як нейронна мережа, може знайти склад молекули", — вказує Баулін. "Це, мабуть, пов'язано з тим, що фізичні системи підкоряються законам природи, які є внутрішньо симетричними та самоподібними. Це різко зменшує кількість можливих комбінацій параметрів, які потім фіксуються нейронними мережами".

Отже, порівняння результатів нейронної мережі з фактичним результатом не тільки дає можливість перевірити передбачення, але також показує, як прогнози розвиваються, якщо завдання змінено. І, в свою чергу, це показує, як нейронні мережі приймають рішення і як вони «думають».

Facebook Comments