02.04.2020

Купівля сервера: від замовлення до відправки

Як відбувається замовлення сервера обраної клієнтом конфігурації? Чи надійні сервери, зібрані за індивідуальним замовленням? Ці та інші питання ми сьогодні детально обговоримо в новій статті.

Перший етап: замовлення сервера

Присутні десятки готових для замовлення серверів з самими різними конфігураціями, проте, деяким клієнтам потрібні сервери, спеціально зібрані під конкретні завдання їх робочого середовища. Найчастіше таке необхідно для створення сервера з дуже високою продуктивністю або з великою кількістю дискових накопичувачів.

Для того щоб задовольнити існуючу потребу, був створений конфигуратор серверів і конфигуратор ПК. Ця функція дозволяє за лічені хвилини самостійно створити потрібну комплектацію сервера. Однак мало хто замислюється, як саме збираються ці сервери.

Після того як клієнт визначився з потрібною конфігурацією, зробив замовлення і оплатив його, система автоматично створює тікет в панелі управління. Такий тікет надходить до відділу збірки, і фахівці приступають до перевірки замовлення і, власне, самої збірці сервера.

Другий етап: процес складання

Перевірка замовлення

На сторінці конфігуратора вказані сумісні варіанти комплектуючих, але бувають випадки, коли клієнти можуть підібрати не найоптимальніший варіант поєднання апаратних компонентів. Найбільш часті помилки включають: непарна кількість планок оперативної пам'яті в багатопроцесорних системах або, наприклад, вибір RAID-контролера, який не зможе видати максимальну продуктивність в обраній конфігурації. Саме з цієї причини, наші інженери спочатку перевіряють замовлення, якщо виявляються потенційні проблеми обов'язково відбувається оповіщення клієнта.

У разі, якщо клієнт згоден, що конфігурація не оптимальна, можна без проблем анулювати замовлення і створити новий. Грошові кошти при анулюванні повертаються на баланс панелі управління в повному обсязі. Після того, як замовлення перевірений, ми приступаємо до підготовки комплектуючих та збирання сервера.

комплектуючі

Кожен сервер складається з наступних комплектуючих:

Тепер розповімо про всі етапи, які проходить кожен сервер довільної конфігурації.

підготовка корпусу

Ми зазвичай використовуємо сервери HPE і Dell, які слід попередньо підготувати. Після того як материнську плату поставили на місце, закручуються кріпильні болти. При цьому слід пам'ятати, що текстоліт досить крихкий, і не докладати зайвих зусиль. Для економії часу інженери використовують акумуляторні викрутки.

Тепер до материнської плати підключаються кабелі живлення, а також вентилятори системи охолодження. Тут важливо те, що часом довжина кабелів більше, ніж необхідно, тому їх акуратно стягують за допомогою тонких нейлонових стяжок. При відсутності можливості закріпити стяжки до корпусу, виробник постачає зручні кріпильні майданчики на двосторонньому скотчі. Кінці акуратно відкушують бокорезами.

Потім виконується підключення лицьовій панелі і бекплейна за допомогою відповідних кабелів. Тепер можна приступати до установки процесорів і інших елементів.

установка процесорів

Ця операція, мабуть, найтонша і вимагає уважності. Ще 10 років тому процесори мали зручні «ніжки», а сокети представляли собою пластикову матрицю з отворами. Завдяки цьому досить було всього лише акуратно вставити процесор в сокет і закрити засувку. Починаючи з сокета LGA 775 процесори позбулися «ніжок», залишилися тільки рівні контактні площадки. Сокети, навпаки, тепер мають контакти, однак вони настільки маленькі і тендітні, що будь-яка операція з установкою процесора повинна бути максимально точною.

Після того, як процесори встановлені на свої місця приходить черга установки радіаторів охолодження. Як правило, використовуються пасивні радіатори, однак перед цим наноситься термопаста - шар теплопроводящей матеріалу, що розділяє процесор і радіатор. Найчастіше для цього використовують кремнійорганічне пасту, таку як КПТ-8.

Тут слід пам'ятати, що основне завдання термопасти - закрити мікроскопічні дефекти як на поверхні процесора, так і на поверхні радіатора, забезпечуючи максимально велику площу зіткнення. Тому її наносять дуже тонким і рівним шаром. Для цього використовують або спеціальну лопаточку, або по-старому непотрібну пластикову картку. Надлишки забираються за допомогою ватних паличок.

Установка оперативної пам'яті

Кожен виробник материнських плат самостійно визначає вірний порядок установки модулів оперативної пам'яті, в залежності від її типу і швидкості. Для Supermicro цей порядок установки прописаний в інструкціях до кожної моделі материнської плати. Проте є кілька досить універсальних правил, які працюють в більшості випадків:

Перед установкою інженери перевіряють, щоб у слотах не було ніяких сторонніх часток пилу або паперу. При необхідності використовується стиснене повітря для очищення.

установка накопичувачів

Тут все просто. Дискові накопичувачі закріплюються в штатних санчатах, після чого вставляються в сервер. Якщо були замовлені дискові контролери або додаткові мережеві карти, то вони встановлюються в відповідні PCI-E слоти і закріплюються гвинтами. Після того, як все встановлено на свої місця, інженер відділу збірки ще раз перевіряє відповідність всіх комплектуючих замовлення і відправляє сервер на стенд для прошивки і тестування.

Укладання кабелів

Торкнемося такої теми, як укладання кабелів всередині сервера. Тут теж є свої нюанси, головним з яких є обмеженість простору. Більшість серверів спроектовані таким чином, щоб займати мінімум місця в стійці. Висота одного монтажного юніта становить 43,7 мм. Через це місця для кабелів після установки материнської плати і іншої периферії залишається досить мало.

Завжди слід враховувати, що крізь сервер повітря повинне проходити безперешкодно для ефективного охолодження компонентів. Будь-які перешкоди на його шляху будуть погіршувати відведення тепла, а отже, збільшувати витрати електроенергії через збільшену навантаження на систему охолодження. Це особливо важливо для серверів з декількома GPU, температура яких під навантаженням доходить до 80 градусів.

Повітряний потік розділяється порівну між усіма GPU

Тому всі кабелі укладаються таким чином, щоб не перекривати шлях проходження повітря. Надлишки за допомогою стяжок закріплюються до штатних проушинам, а в разі їх відсутності до пластикових майданчикам з двостороннім скотчем.

прошивка комплектуючих

Для початку відповімо на досить часто задається питання - навіщо ж це потрібно? Відповідь проста - ця процедура необхідна для того, щоб всі компоненти сервера працювали без помилок, а також, щоб підвищити рівень безпеки.

Більшість компонентів сервера побудовані з розрахунком на те, щоб їх можна було перепрограмувати. Після виходу з конвеєра в процесі тестування і експлуатації в більшості випадків виявляються помилки і уразливості програмного забезпечення. Якби можливості перепрограмування компонентів не було передбачено, то для ліквідації цих програмних проблем довелося б відкликати всю продукцію. Набагато дешевше було створити можливість заміни прошивки.

перепрошивка IPMI

Модуль віддаленого управління (IPMI / iLO / iDrac) - один з найважливіших елементів сервера. Він представляє з себе незалежний мікрокомп'ютер, який працює завжди, коли на материнській платі присутній робоча напруга.

Навіть коли в сервері немає комплектуючих, цей мікрокомп'ютер працює, виконуючи завдання інтерпретації та коригування даних з датчиків сервера. Модуль тісно пов'язаний з усіма підсистемами управління живленням і дозволяє виконувати практично будь-які операції віддалено. Тому питання безпеки при доступі до такого пристрою стоїть дуже гостро. Своєчасне оновлення прошивки дозволяє вберегти модуль від злому.

Установка прошивки зазвичай проводиться безпосередньо з веб-інтерфейсу, проте в деяких випадках її можна провести по мережі, відправивши на модуль прошивку з відповідним програмним забезпеченням.

перепрошивка BIOS

Базова система введення-виведення крім уже згаданої причини безпеки потребує оновлення ще для одного важливого моменту. У прошивці BIOS є мікрокоди процесорів, підтримуваних материнською платою, а також мікрокоди мережевих інтерфейсів і чіпсетів. Коли виходить нова версія процесора, виробники материнських плат випускають нові версії прошивок, які містять необхідний мікрокод. Без цього новий процесор просто не зможе запуститися. Разом з прошивкою BIOS часто оновлюються і пов'язані модулі, наприклад, Intel® ME (Management Engine).

Крім цього, випуск нових прошивок запобігає конфліктам, що виникають при взаємодії різних комплектуючих (як вбудованих в материнську плату, так і сторонніх пристроїв).

Щоб не бути голослівними, наведемо приклад. Візьмемо материнські плати, які підтримують процесори Intel® Xeon® E5-XXXXv3. Якщо поставити туди процесор наступної версії E5-XXXXv4 плата стартує, проте видаватиме дивні помилки збою оперативної пам'яті «Failing DIMM» в різних слотах. І проблема тут зовсім не в пам'яті, а в тому, що контролер пам'яті знаходиться в процесорі. Отже, неправильне впізнання процесора материнською платою веде до того, що виникають подібні проблеми. Перепрошивка за допомогою підтримуваного процесора повністю вирішує цю ситуацію.

У деяких випадках виробники обладнання штучно припиняють підтримку новими моделями материнських плат старішого обладнання. Дисковий контролер просто не ініціалізується, викликаючи повне зависання сервера. І на даний момент ця проблема не має рішення.

Перепрошивка дискових контролерів

Помилки в програмному забезпеченні таких важливих пристроїв, як дискові контролери можуть не просто завдати неприємностей, а й стати джерелом дуже великих проблем. У більшості випадків процес дуже простий, перепрошивка відбувається за допомогою рідної утиліти, вбудованої безпосередньо в сам контролер.

Слід пам'ятати, що стара прошивка дискового контролера може не тільки виправляти помилки, але і кардинально змінювати спосіб зберігання метаданих. Щоб уникнути неприємних ситуацій і зберегти дані в цілості, перед виконанням перепрошивки слід обов'язково прочитати список внесених змін в функціонал. Ця інформація завжди присутня на сайті виробника устаткування і найчастіше дублюється в архіві з самої прошивкою.

Перепрошивка мережевих карт

Не менш серйозні проблеми, вкрай складні в діагностиці, можуть доставити мережеві карти з помилками на рівні програмно-апаратних засобів. Крім усунення помилок, програмне забезпечення мережевих карт безпосередньо може впливати на продуктивність. Так що це ще один обов'язковий пункт для інженерів, що виконують збірку серверів.

важливо

Хотілося б окремо відзначити, що всі операції з перепрошивки компонентів потенційно небезпечні для обладнання, тому їх допустимо робити тільки кваліфікованим фахівцям. Якщо ви вже є нашим клієнтом і виявили необхідність перепрошити будь-який компонент сервера, то ні в якому разі не намагайтеся це робити самостійно. Просто напишіть нам в тикеті, який компонент слід перепрошити, і це буде виконано з усіма запобіжними заходами.

тестування

Покінчивши з оновленням програмного забезпечення, інженер збірки приступає до тестування навантаження зібраного сервера. Таке тестування дозволяє виявити більшість проблем ще до того, як сервер буде зданий клієнту.

Тест оперативної пам'яті

Для того, щоб перевірити працездатність всіх встановлених в сервер модулів оперативної пам'яті, запускається дуже популярний інструмент під назвою memtester. Безпосередньо перед виконанням тестування, інженер збірки перевіряє, щоб всі встановлені в сервер модулі пам'яті коректно відображалися в BIOS.

При запуску тестування відбувається процес читання і запису даних в оперативну пам'ять, використовуючи різну послідовність даних і порядок заповнення осередків. Швидкість виконання всіх тестів безпосередньо залежить від обсягу. Наші мінімальні вимоги - це один повний цикл перевірки.

Якщо в процесі тестування виявлено помилки, то ми шукаємо зіпсований модуль оперативної пам'яті і виключаємо його з конфігурації, замінюючи на аналогічний. Потім процес тестування повторюється цілком. Тільки коли всі ітерації тестів будуть пройдені без помилок, сервер відправляється на стрес-тестування.

Тест процесора і дисків

Навантажувальний тест імітує максимальне навантаження на сервер протягом мінімум 6 годин для сервера з магнітними накопичувачами. У випадку з твердотільними накопичувачами такий тривалий тестування може різко збільшити знос накопичувача, тому для них проводиться аналогічне тестування з меншим часом виконання.

Тестування навантаження для процесорів Intel проводиться за допомогою оригінальної утиліти Intel IPDT (Processor Diagnostic Tool). Цей процес викликає підвищення температури процесора до максимально допустимої експлуатаційної температури, і система охолодження повинна ефективно відводити все це тепло. Інженери складальної постійно стежать за тим, щоб сервер пройшов це випробування, і температура всіх компонентів не перевищувала заявлених експлуатаційних меж.

Після завершення тестування перевіряються параметри SMART всіх встановлених дисків. Якщо хоча б один параметр, заявлений виробником як привід для заміни накопичувача, має нульове значення, диск замінюється на інший і також тестується для виключення вірогідності виникнення проблем в «бойовому режимі».

висновок

Кожен сервер довільної конфігурації, що здається нами в оренду, безліч разів перевіряється і тестується, тому їх можна сміливо використовувати для будь-яких проектів відразу, не витрачаючи час на повторні тестування і перевірки. На кожному замовленому сервері буде найактуальніша версії включені кожного компонента, що дає хороший захист від існуючих вразливостей і помилок.