19.11.2019

Тренди зберігання даних в 2019 році

Дані ллються рікою

Даних з кожним роком стає все більше, де ми збираємося зберігати всі ці дані? Щодня інженери і програмісти працюють над тим, щоб ємність накопичувачів ставала все більше, а об'єднання їх в системи зберігання все ефективніше і простіше. З урахуванням прогнозів по стрімкому прискоренню обсягів генерації даних такими машинами, як, автономні транспортні засоби та інтелектуальні фабрики, а також з огляду на величезні масиви даних, створені людьми, включаючи резервні копії, чи вдасться виробити достатню кількість сховищ для потреб, які виникнуть протягом наступного десятиліття ? Або доведеться думати про підхід і приймати рішення щодо того, що можна зберігати, а чим можна пожертвувати?

Рейнер Кесе, старший менеджер з розвитку бізнесу систем зберігання даних, Toshiba Electronics Europe

Читайте також: Основні тенденції та прогнози на 2020 рік в світі ЦОД

Баланс HDD і SSD в світі зростаючої кількості даних

Спостерігається така тенденція, коли обсяги даних не тільки продовжують рости, але і ростуть швидше ніж очікувалося раніше. Прогнозувалося що частка даних, які зберігаються на флеш і твердотільних накопичувачах буде стрімко збільшуватися, в свою чергу кількість даних, що зберігаються на магнітних стрічках і жорстких дисках зменшитися. Сьогодні стає очевидним той факт, що всі технології даних продовжують активно розвиватися, і цьому є одна причина, ємностей для зберігання даних потрібно все більше з кожним роком. Можна заявити, що протягом 2019 року до 90% ємності для типових програм, що використовують хмарні обчислення, буде забезпечуватися жорсткими дисками, і можливо трохи накопичувачами на магнітній стрічці. І тільки 10% сховищ будуть забезпечені SSD.

З огляду на вартість корпоративних твердотільних накопичувачів, яка на ту ж одиницю ємності може бути до десяти разів дорожче, ніж жорсткі диски, інвестиції зрівняються: близько 50% коштів витрачається на жорсткі диски, і стільки ж - на твердотільні накопичувачі. Конфігурації такого типу зберігання охоплюють весь спектр додатків. Частина з них будуть використовувати виключно флеш-пам'ять, частина - гібридні моделі, де на флеш-пам'яті зберігається кеш або «гарячі» дані, а на жорстких дисках - «холодні» і «теплі» дані, інші - сервери на основі виключно жорстких дисків .

Ємність гелієвих HDD виросте до ~ 20 ТБ

Три основних виробника жорстких дисків вже представили моделі, наповнені гелієм, з ємністю 16 ТБ. Очікується, що в найближчі роки ємність буде збільшуватися приблизно на 2 ТБ в роки, це означає що вже на початку наступного десятиліття диски з об'ємом 20 ТБ повинні з'явитися у продажу.

Ці диски, ймовірно, втратять у вартості при зростанні ємності, але помітних поліпшень за іншими технічними параметрами очікувати не варто. Єдиним винятком стане енергоспоживання, яке скоротиться в результаті використання гелію. У той час як заповнені повітрям 3,5-дюймові жорсткі диски, що працюють на швидкості 7200 об / хв, споживають, незалежно від ємності, щодо постійну потужність 11 Вт під навантаженням, споживана потужність заповнених гелієм жорстких дисків становить приблизно 6-7 Вт. Це стало результатом більш низького тертя завдяки легкості гелію. Таким чином, поширення жорстких дисків з гелієм допоможе вирішити проблему зростання енергоспоживання центрів обробки даних.

Кожен ват енергії, зекономлений такими накопичувачами, призводить до зменшення кількості енергії, необхідної для роботи центру обробки даних, а також до скорочення розсіюється тепла, що робить охолодження більш економічним. Ще один ефект від зниження температури: гелієві приводи мають більш високою надійністю в порівнянні з наповненими повітрям приводами при безперервній роботі. Це призводить до набагато меншій кількості відмов і збільшення терміну служби. Планується також подальше підвищення щільності зберігання, завдяки таким технологіям, як мікрохвильова магнітний запис (MAMR), яка буде інтегрована в пишуть головки жорсткого диска.

архітектура сховищ

Ми можемо розраховувати на продовження зростання сектора стоєчних сховищ з верхнім завантаженням через вимоги до збільшення ємності. Хоча 60 відсіків в форматі 4U сьогодні стали стандартом, з'явилися корпуси, що підтримують від 78 до 110 відсіків для 3,5-дюймових жорстких дисків. Замість апаратного RAID, таку кількість дисків налаштовується за допомогою програмних рішень. Сучасні програмно-які визначаються системи зберігання будуть продовжувати переважати, поряд з масштабованими проектами, такими як кластери Ceph, де кілька серверів зберігання об'єднуються в більш великі блоки. Тут захист даних більше не забезпечується за рахунок надлишку жорстких дисків на сервері. Замість цього надлишок реалізується через вузли серверів зберігання, доступні в серверній мережі.

Вибухове зростання кількості даних

Вже сьогодні люди генерують величезну кількість даних. Якщо врахувати, що ці дані потім копіюються в центрах обробки і в хмарі, це тільки збільшує обсяг пам'яті, необхідний для їх зберігання. На сьогоднішній день кількість згенерованих машинами даних порівняно невелика. Однак з 2019 року ця зміниться, оскільки такі рішення і технології, як автономні автомобілі, інтелектуальні фабрики, інтернет речей (IoT) і домашня автоматизація, будуть генерувати додаткові потоки даних, які доведеться зберігати. Очікуваний їх обсяг настільки великий, що нинішня філософія зберігання даних вимагає серйозного перегляду. Сувора реальність полягає в тому, що нам необхідно проаналізувати дані перед їх збереженням, щоб визначити, які з них дійсно важливі і не можуть бути видалені.

Штучний інтелект, глибоке навчання і блокчейн

Нові обчислювальні програми, такі як штучний інтелект, глибоке навчання і блокчейн, значно підвищили вимоги до продуктивності систем обробки даних. Ми можемо очікувати, що ці технології будуть генерувати набагато більше даних і їм будуть потрібні рішення по їх зберіганню. В даний час неясно, який саме вплив вони нададуть на вимоги до сховищ, оскільки недостатньо відомо про самих додатках і про те, як вони будуть реалізовані. Однак, у міру наближення 2019 року і нового десятиліття ситуація буде прояснюватися. Вже сьогодні зрозуміло, що ці технології ще більше збільшать обсяг збережених даних.