Опыт работы с системами управления и мониторинга используемых вычислительных ресурсов корпоративных высокопроизводительных вычислительных кластеров - А. А. Катаев
Автор: | А. А. Катаев |
Издательство: | Синергия |
Серия: | Прикладная информатика. Научные статьи |
Жанр произведения: | Техническая литература |
Год издания: | 2021 |
isbn: |
В представленной статье рассматриваются современные системы мониторинга серверов. Обозреваемая предметная область касается контроля и управления высокопроизводительными вычислительными комплексами (ВВК). Данные системы применяются в различных отраслях науки и промышленности для проведения моделирования систем и их поведения в различных условиях. Скорость проведения моделирования зависит от применяемых технических решений в составе вычислительного комплекса. К ним относят тип внутренней сети, количество и разновидности вычислительных узлов. Для вычислительных узлов рассматривают такие параметры, как архитектура и модель процессора, количество оперативной памяти. Особенности, связанные с реализацией конкретных математических моделей, влияющие на скорость расчетов, в данной статье не рассматриваются. В работе проведен анализ существующих рыночных решений и основных применяемых концепций для систем управления и мониторинга подобных комплексов. Рассматриваемые системы оцениваются с экономической и технической точек зрения. Для доступных систем проводится натурное исследование способностей по управлению кластером и мониторингу состояния. Фиксируемый системой мониторинга набор параметров берется исходя из общей архитектуры ВВК и подхода к администрированию серверных систем. Практическая часть описывает опыт проектирования и реализации перспективной системы управления. В создаваемой системе основное внимание сосредоточено на создании системы управления. Обоснование необходимости отдельного программного продукта приведено по тексту статьи. Вопросы реализации в конкретном программном коде и системной среде опущены как зависимые от конкретного исполнения системы. Задача создания собственной системы мониторинга принята ничтожной при условии наличия существующих решений.