Качественное бесперебойное питание инфокоммуникацийОбеспечение качества электроснабжения и его надежность достигаются различными схемными решениями и применением специального оборудования. Широкое распространение получило наиболее универсальное средство обеспечения качества и надежности электроснабжения инфокоммуникаций — источники бесперебойного питания (ИБП — Uninterruptible Power Supplу, UPS). На их основе строятся системы бесперебойного электроснабжения (питания) инфокоммуникационных систем. В последние годы на повестку дня выдвинулись отказоустойчивые системы. Под отказоустойчивостью системы бесперебойного электроснабжения на базе ИБП понимают сохранение способности осуществлять бесперебойное снабжение потребителей током в случаях проведения плановых (регламентных, сервисных) и ремонтных (восстановительных) работ. Функции отказоустойчивости напрямую зависят от эксплуатационной готовности системы. Длительная эксплуатационная готовность оценивается как вероятность того, что система при определенных условиях будет в полном объеме выполнять свои задачи. На практике решающим фактором является длительность перерыва в подаче электроэнергии к потребителям. В этой связи при электроснабжении инфокоммуникационных систем эксплуатационная готовность системы электроснабжения должна быть не ниже эксплуатационной готовности технических средств инфокоммуникаций. По отношению к инфокоммуникационным системам эксплуатационную готовность электроснабжения будем характеризовать коэффициентом доступности электроснабжения. Доступность системы зависит от ее надежности. А что является количественной характеристикой надежности? Наиболее часто прибегают к таким показателям, как среднее время между сбоями или среднее время наработки на отказ (Mean Time Between Failure, MTBF). Однако к ним надо подходить с осторожностью. Дело в том, что производитель той или иной техники указывает величину MTBF равной, скажем, 30 тыс. ч, т. е. примерно 10 лет. При этом само устройство производится в течение всего трех лет. Да и срок его реальной эксплуатации ввиду морального устаревания вряд ли превысит, допустим, пять лет. Как же было определено приводимое значение MTBF? Речь идет о хорошо известном в статистике «усреднении по ансамблю»: если для 1000 работающих устройств за год произошло в общей сложности 100 сбоев, то на этом основании среднее время между сбоями вычисляется как 1000 х 1 год/100 = 10 лет. Очевидно, что определяемая таким образом величина MTBF является статистическим параметром и справедлива для большого количества работающих устройств, а отнюдь не для отдельного устройства. Иными словами, устройство, значение MTBF которого составляет 10 лет, может запросто выйти из строя на следующий день после ввода в эксплуатацию. Просто кому-то не повезет. Однако на этом неприятности могут не закончиться. Ремонт может занять пять минут, а может и пять рабочих дней, и хорошо, если в результате информационная система не будет простаивать. Таким образом, кроме параметра MTBF очень важное значение имеет другая величина — среднее время восстановления устройства (Mean Time To Repair, MTTR). В статьях и обзорах, посвященных надежности ИС, все чаще встречается понятие коэффициента доступности. Он определяется весьма просто — как относительное значение общей продолжительности нормальной работы системы за год. Обычно компании измеряют коэффициент доступности для приложений, так как от этого напрямую зависит продуктивность пользователей. В условиях современного предприятия важнейшие приложения или их составляющие физически распределены по всей организации, а иногда даже за ее пределами, включая компьютеры потребителей и поставщиков. Поэтому администраторы ИТ должны принять необходимые меры, чтобы обеспечить высокое значение доступности приложений по предприятию в целом. Исходя из того, что время нормальной работы в среднем равно MTBF, а время простоя возникает после аварии или отказа и, соответственно, равно MTTR, коэффициент доступности (Availability) можно определить следующим образом: Availability = MTBF/(MTBF + MTTR) Очевидно, что MTBF должно быть как можно больше, а MTTR — как можно меньше. Как же достичь этого для аппаратного обеспечения? Какой ИБП надежнее? Надежность любой сложной системы (в том числе ИС) ограничена надежностью самого слабого узла. На сегодняшний день в таких общих для любой ИС процессах, как обработка и хранение данных, давно применяются технологии кластеризации и «зеркализации», дисковых массивов хранения данных RAID и т. п. Поэтому тем, кто инвестирует немалые средства в подобные технологии для всемерного повышения надежности работы ИС, имеет смысл задуматься: а какое же звено осталось самым слабым? Чаще всего таковым оказывается ИБП традиционной моноблочной конструкции, а ведь именно он, как правило, защищает серверные комнаты и прочие критичные приложения. За последние годы к этому выводу пришло большое количество исследовательских и консалтинговых институтов, а также ассоциаций пользователей компьютерных технологий. Даже при увеличении затрат на разработку изделия, всемерной изощренности схемных решений, 100-процентном входном контроле компонентов, многократном тестировании изделия в процессе производства отдельные компоненты имеют некий потолок надежности. Так, типичные современные системы защиты питания, где делается ставка лишь на высокую надежность отдельных узлов, имеют максимальное значение MTBF в пределах от 50 тыс. до 500 тыс. ч. В то же время применение резервирования самих ИБП позволяет добиться существенного увеличения MTBF при тех же затратах на себестоимость изделия. На рисунке изображен качественный характер изменения надежности изделия в зависимости от его себестоимости, при этом кривая 1 соответствует устройству без резервирования, кривая 2 — устройству с применением резервирования. Общепризнанным подходом для радикального снижения MTTR стало сегодня в конструировании следование принципу «горячей» замены неисправных или требующих обслуживания узлов. При создании наиболее ответственных и критичных узлов и устройств, работающих в составе ИС, применяется следующий метод. Узел (устройство и т. п.) разбивается на N параллельно соединенных модулей с добавлением одного (N+1), двух (N+2) и т. д. модулей для повышения уровня резервирования (или, что одно и то же, избыточности), дополнительно разработчиками обеспечивается возможность замены этих модулей (увеличения или уменьшения их числа) на ходу, в «горячем» режиме. Таким образом, достигается: высокая отказоустойчивость за счет наличия N+1, N+2 и т. д. модулей. При отказе любого из модулей остальные просто перераспределяют между собой его нагрузку; нулевое MTTR - для замены вышедшего из строя модуля не требуется отключать устройство в целом. Остающиеся в работе модули обеспечивают полноценное функционирование; гораздо более высокая экономическая эффективность по сравнению с удвоением (утроением и т. п.) устройства в целом; масштабируемость устройства, причем изменения конфигурации возможны без выключения устройства, в "горячем" режиме. Соотношения между доступностью, избыточностью и возможностями «горячей» замены легко пояснить с помощью диаграммы (см. Рисунок), где системы защиты электроснабжения располагаются на плоскости в зависимости от того, насколько они удовлетворяют двум составляющим доступности — избыточности и возможности «горячей» замены. С ростом числа узлов с поддержкой режима «горячей» замены соответствующая системе точка на плоскости перемещается вверх, а с ростом числа избыточных узлов — слева направо. В зависимости от требуемой величины доступности и планируемых затрат, администраторы ИС могут найти оптимальное решение. На основании диаграммы современные системы защиты электропитания можно классифицировать по уровню доступности следующим образом. 1. Традиционный (моноблочный) ИБП (Standalone UPS) не обладает ни избыточностью, ни возможностями "горячей" замены. Как видно из таблицы, устройство обеспечивает достаточную доступность электропитания благодаря надежности ИБП как такового. Подобные системы наиболее эффективны в диапазоне малых мощностей (до 5кВА), в этом случае несколько моноблочных ИБП могут защитить отдельные критические звенья системы. Чтобы получить централизованное решение для систем большей мощности (более 5 кВА), пользователи должны выбрать систему с более высоким уровнем доступности. 2. Отказоустойчивый ИБП (Fault Tolerant UPS) иногда описывают как систему с "разумной избыточностью", поскольку такие системы содержат избыточные компоненты. Однако не все главные узлы можно заменять в режиме "горячей" замены. Системы этого типа имеют более высокий коэффициент доступности, продолжая защищать нагрузку даже в случае отказа одного из избыточных компонентов. Но поскольку неисправность недублируемых компонентов часто означает необходимость замены всего ИБП, в числе их серьезных недостатков - дорогостоящий и требующий времени ремонт. Это неизбежно приводит к простою систем и большим неудобствам для администраторов ИС. Отказоустойчивые системы ИБП могут иметь часть узлов, допускающих "горячую" замену, например батареи или блоки силовой электроники. В основном же большое число критически важных узлов, в частности блоки процессорной электроники, невозможно заменить в "горячем" режиме. И чем больше таких незаменяемых компонентов, тем ниже коэффициент доступности электропитания. 3. Модульный ИБП (Modular UPS). Как и отказоустойчивый ИБП, он обеспечивает высокий уровень доступности. Эти системы имеют многочисленные компоненты с режимом "горячей" замены и обычно используются в многосерверных средах и телекоммуникационном оборудовании. Многие модульные ИБП предусматривают также избыточность батарей. Однако важнейшее преимущество таких систем по сравнению с отказоустойчивыми ИБП состоит в том, что отказ любого из основных компонентов может быть ликвидирован в "горячем" режиме, что исключает плановые простои на вызов сервисной поддержки. 4. Высшую степень защиты электроснабжения обеспечивают системы матричной архитектуры - так называемые "энергетические массивы" (Power Array). В Power Array все блоки - силовой электроники, батарей и процессорные - являются и избыточными, и заменяемыми в "горячем" режиме. Системы такого типа характеризуются очень высокими значениями доступности и реализуют защиту высшего уровня для ИС. Power Array обычно на 10-20% дороже моноблочных ИБП сходной мощности и в среднем на 5-10% дороже отказоустойчивых или модульных ИБП. Диаграмма может быть уточнена далее, поскольку в каждой системе защиты электропитания имеется три важнейших блока: батареи, силовая электроника и процессорная электроника. Чем больше компонентов обладают свойствами «горячей» замены и избыточности, тем выше доступность системы. Реальные ИБП часто относятся к «гибридным» системам, у которых часть узлов обладает свойством «горячей» замены, а другая часть — свойством избыточности. Подытоживая сказанное в статье, отметим: во-первых, электроснабжение инфокоммуникаций зависит от качества электроэнергии и надежности электроснабжения; во-вторых, согласно сложившейся технической практике, основным средством обеспечения надежности и качества электроснабжения являются источники бесперебойного питания; в-третьих, наилучшие показатели надежности электроснабжения можно получить, используя резервируемые системы с архитектурой «энергетический массив». |