Новий підхід до управління базами даних на твердотільних накопичувачах

Постійно зростаюча завантаженість центрів обробки даних вимагає нових способів зберігання та доступу до даних. Дослідники з Інституту науки і техніки Daegu Gyeongbuk, Корея, розробили новий підхід до управління базами даних на твердотільних накопичувачах, забезпечивши помітні поліпшення продуктивності затримок читання / запису та розвантаження завдань на обчислення бази даних з процесорів для підвищення ефективності та зниження енергоспоживання.

Оскільки веб-сервіси, хмарні сховища та сервіси великих даних продовжують розширюватися, гігантські апаратні інфраструктури, на які вони покладаються — відомі як центри обробки даних — потребують вдосконалення, щоб відповідати поточному попиту. Одним з перспективних рішень для підвищення продуктивності та зменшення енергетичного навантаження, пов’язаного з читанням і записом великих обсягів даних, є надання пристроям зберігання даних деяким обчислювальним можливостям та вивантаженню частини процесів зчитування / запису даних з процесорів.

У недавньому дослідженні, представленому на щорічній технічній конференції USENIX до 2020 року, дослідники Інституту науки і техніки Daegu Gyeongbuk (DGIST), Корея, описують новий спосіб впровадження накопичувача ключових значень на твердотільних накопичувачах (SSD), який пропонує багато переваги перед більш широко використовуваним методом.

Запас ключа-значення (також відомий як база даних «ключ-значення») — це спосіб зберігання, управління та отримання даних у вигляді пар «ключ-значення». Найпоширеніший спосіб його здійснення — це використання хеш-функції, алгоритму, який може швидко співставити заданий ключ із пов'язаними з ним збереженими даними для швидкого доступу до читання / запису.

Однією з головних проблем реалізації хеш-накопичувача ключових значень є те, що випадковий характер хеш-функції періодично призводить до великих затримок (затримки) в операціях читання / запису. Щоб вирішити цю проблему, дослідники з DGIST реалізували іншу парадигму, що називається "зрубленим деревом злиття (LSM)". Цей підхід спирається на впорядкування даних ієрархічно, тому встановлюючи верхню межу максимальної затримки.

У своїй реалізації під назвою "PinK" вони вирішили найбільш серйозні обмеження на основі LSM сховищ ключів і цінностей для SSD. Завдяки оптимізованому використанню пам’яті, гарантованій максимальній затримці та апаратних прискорювачах для вивантаження певних завдань сортування з центрального процесора, PinK являє собою нове та ефективне зберігання даних для SSD в центрах обробки даних. Професор Сунжін Лі, який очолив дослідження, зазначає: "Магазин ключів-цінностей — це широко використовувана фундаментальна інфраструктура для різних програм, включаючи веб-сервіси, програми штучного інтелекту та хмарні системи. Ми вважаємо, що PinK може значно покращити сприйняті користувачем ефективність таких послуг ".

Поки експериментальні результати підтверджують підвищення продуктивності, запропонований цією новою реалізацією, і підкреслюють потенціал дозволити пристроям зберігання даних обчислювати деякі операції самостійно. "Ми вважаємо, що наше дослідження дає хороший вказівки щодо того, як повинні бути спроектовані та побудовані обчислювальні пристрої зберігання даних та які технічні проблеми нам слід вирішити для ефективних обчислень у сховищах", — підсумовує професор Лі.

Facebook Comments