Распечатать
Закрыть

Система мониторинга программно-технических комплексов (ПТК)

 
 
Главная страница » .. » Система мониторинга программно-технических комплексов (ПТК)

Телеком-ревизор

Входящая в сложный инфраструктурный ИТ-комплекс правительства Москвы телекоммуникационная сеть должна отвечать повышенным требованиям надежности. Для этого необходима эффективная система управления, позволяющая быстро обнаруживать сбои оборудования и в некоторых случаях предотвращать их.

В рамках ГЦП «Электронная Москва» правительство Москвы ставит своей задачей интеграцию информационных систем городских служб, организаций и органов государственной власти, взаимодействующих через широкополосную городскую мультисервисную транспортную сеть (ГМТС). С увеличением масштабности задач, решаемых с использованием ИКТ, очевидно, что телекоммуникационная сеть правительства Москвы обязана отвечать повышенным требованиям: обеспечивать управляемость, основываться на прозрачной архитектуре сегментов сети, гарантировать доступность приложений и обеспечивать требуемое качество услуг. Сегодня от надежного и бесперебойного функционирования сети во многом зависит результативность работы городских структур.

Решение проблем онлайн

Инфраструктура общегородской мультисервисной телекоммуникационной сети правительства Москвы представляет собой территориально распределенную сетевую структуру и включает современное оборудование ведущих мировых производителей, высокоскоростные каналы передачи данных, серверные комплексы, обеспечивающие системы: ИБП, системы контроля окружающей среды и т.д. В сети одновременно существует несколько типов трафика, причем требования к параметрам качества для каждого из них существенно варьируются. Для обеспечения требуемого уровня качества и предотвращения перегрузок в сети требуются специализированные средства. Непростыми проблемами, стоящими перед управлением информатизации Москвы, были децентрализация информационных систем и сложная топология сети. Стало понятно, что сеть должна содержать средства автоматического устранения возникающих проблем, которые бы решали, чем можно пожертвовать в разных случаях – полосой пропускания, временем доставки или целостностью информации для отдельных потоков.

Решением стала интеллектуальная система управления компаний «Энвижн Груп» и Kraftway. Примененная технология позволяет осуществлять мониторинг сети и ее отдельных узлов, регулировать нагрузку на ИТ-инфраструктуру, а также отслеживать ее работоспособность. Система позволяет правильно распределять трафик в сети, отслеживать доступность сетевых устройств, производить анализ загрузки каналов. За время проекта, начатого летом 2006 года, были проведены работы по внедрению системы мониторинга, охватывающей пять крупных площадок, в числе которых здания правительства Москвы на ул. Тверской и Новом Арбате, здание Московской городской думы.

Система мониторинга сетевой инфраструктуры правительства Москвы является частью большой и сложной системы управления информационными системами и ресурсами. В разработке последней принимают участие компания Kraftway как генеральный подрядчик, а также департамент консалтинга Microsoft и отечественный производитель системы класса Service Desk компания Naumen. Создаваемое решение состоит из полнофункциональной системы контроля и управления сетевыми сбоями и системы управления качеством сервиса. Все элементы решения созданы на базе ПО ведущих мировых производителей и образуют единый комплекс управления различными параметрами работы сетевой инфраструктуры.

Система мониторинга общегородской мультисервисной телекоммуникационной сети, которую по результатам этапа обследования и выбора платформы было решено построить на базе продуктов EMC Smarts и InfoVista, состоит из нескольких тесно интегрированных между собой подсистем управления сообщениями (событиями) об аварийных ситуациях и изменениях состояния систем и подсистем мониторинга производительности сети и серверов.

Мониторинг доступности

В качестве центрального элемента системы контроля и управления сетевыми сбоями используется ПО класса OSS, разработанное компанией EMC Smarts. Реализованные в нем технологии позволяют контролировать и анализировать работу сетевой инфраструктуры в режиме реального времени, обнаруживать сбои в работе и минимизировать негативные последствия этих сбоев. Помимо обнаружения технологических неисправностей, решение может находить неполадки в работе сетевого ПО, а также коррелировать возникающие неисправности с бизнес-моделью метасистемы «Электронная Москва», обеспечивая полный контроль над инфраструктурой во взаимосвязи с бизнес-логикой.

Внедрение решения по управлению событиями обеспечивает ряд преимуществ. Примером может стать возможность автоматического обнаружения и поиска первопричин неисправностей в инфраструктуре. Полностью автоматизированная система минимизирует влияние человеческого фактора, но при этом управляющий персонал располагает всеми необходимыми данными, например, картой доступности бизнес-процессов и историческими отчетами о происшедших событиях. А при возникновении критических ситуаций в сети система производит оповещение, отправляя сообщение по электронной почте или SMS на мобильный телефон диспетчера.

Кроме того, установленное в сети решение отслеживает состояние сетевого ПО (ftp, http, почта и т.д.) и находит первопричины его отказа или замедления работы, а также осуществляет мониторинг доступности распределенного ПО (например, Oracle).

Мониторинг производительности

При создании системы управления качеством сервиса и мониторинга производительности используется ПО компании InfoVista, позволяющее в режиме реального времени собирать данные от различных типов оборудования, систем и приложений, проводить мониторинг ключевых показателей производительности и контроль выполнения соглашений об уровне обслуживания (SLA).

Система компании InfoVista обеспечивает поддержку широкого спектра оборудования и ПО, позволяя дорабатывать систему в соответствии с конкретными требованиями и легко интегрировать ее с другими компонентами. Внедрение данного решения дает возможность проактивно обнаруживать проблемы, связанные с производительностью сетевого (маршрутизаторы, коммутаторы и т.д.) и серверного оборудования до момента, когда они начнут оказывать пагубное влияние на критически важные информационные сервисы. При мониторинге производительности серверного оборудования обеспечивается динамическая привязка серверов и кластеров к приложениям, сервисам, подразделениям, географическому расположению, группам клиентов и т.д. При этом поддерживаются вычислительные платформы ведущих производителей оборудования.

Специалисты, обслуживающие общегородскую мультисервисную телекоммуникационную сеть правительства Москвы, получили возможность оптимизировать состав оборудования сети за счет предоставления средств анализа загруженности и использования маршрутизаторов, коммутаторов, интерфейсов и портов. Функционирование средств автоматического обнаружения ресурсов обеспечивает точность отчетов на фоне меняющегося состава ИТ-среды. В свою очередь отчеты можно динамически ассоциировать с сервисами, бизнес-группами, географическим расположением.

На благо города

Внедрение системы мониторинга осуществлялось в соответствии с четко определенными приоритетами, при которых ключевым фактором являются услуги и требования к ним, а не технологии, причем проекту предшествовал квалифицированно выполненный аудит бизнес-процессов.

В целом система сегодня позволяет ИТЦ финансово-хозяйственного управления мэрии Москвы эффективно управлять сетевой инфраструктурой. В ходе проекта был создан единый центр управления, специалисты которого могут теперь аккумулировать данные по производительности различного оборудования, сохранять историческую информацию и анализировать тенденции, координировать свою деятельность по развитию сетевой инфраструктуры, осуществлять контроль уровня сервиса.

Эффективность использования внедренной системы мониторинга городских информационных ресурсов, проходящей этап опытной эксплуатации, пока оценить сложно. Однако, по оценкам аналитической компании IDC, при внедрении подобных решений эффективность работы информационной инфраструктуры повышается на 26 %, общие потери из-за недоступности информационных ресурсов снижаются на 31 %, а время недоступности приложений уменьшается на 33 %.

Управление таким мегаполисом, как Москва, требует четкого и слаженного взаимодействия всех органов законодательной и исполнительной власти. Это взаимодействие опирается на сложный инфраструктурный ИТ-комплекс правительства Москвы. Новая система управления этим комплексом поможет повысить его надежность, а значит, работа муниципальных структур по управлению городом станет более эффективной.

В. Новиков, К. Жигунов, А. Гольцов