
Поскольку цифровизация проникает практически во все сферы бизнеса, аварийные ситуации в сфере ИТ становятся все более катастрофичными для тех, кого они затрагивают. Неисправное или скомпрометированное оборудование может парализовать повседневную работу, и его необходимо устранить как можно быстрее. Чтобы избежать значительных потерь времени, денег и данных, каждой компании необходим план действий по возвращению оборудования в рабочее состояние. План аварийного восстановления ИТ предлагает план действий в критических ситуациях, определяя различные подходы к решению проблем и соответствующим образом делегируя ответственность.
Процессы управления в чрезвычайных ситуациях
На техническом жаргоне общее управление чрезвычайными ситуациями характеризуется как управление непрерывностью бизнеса; процессы, необходимые для работы предприятия, должны поддерживаться даже в нештатных ситуациях. Эти процессы можно разделить на три различные группы:
- Планирование чрезвычайных ситуаций: планирование чрезвычайных ситуаций включает в себя все превентивные меры, направленные на предотвращение возникновения кризисной ситуации, например, путем повышения надежности или разработки более надежной системы.
- Реагирование на чрезвычайную ситуацию: речь идет об оптимизации максимально быстрой реакции на кризисную ситуацию. Она включает в себя реактивацию всех системных процессов, которые необходимы для ежедневных бизнес-операций. Планирование на случай непредвиденных обстоятельств и инструменты кризисного управления составляют дополнительные аспекты этой группы.
- Тесты и учения: хорошее планирование действий в чрезвычайных ситуациях должно также включать регулярные практические тесты и учения. Целью этого является постоянное совершенствование процесса управления чрезвычайными ситуациями и выявление потенциальных слабых мест.
ИТ-инфраструктура: неотъемлемая часть любого бизнеса
Деловой мир уже давно находится в состоянии все большей цифровизации. Многие фундаментальные аспекты экономики, а также большое количество различных бизнес-моделей были переданы на аутсорсинг и/или экспортированы в интернет-предприятия: от услуг по управлению заявками (e-recruitment) до логистических центров (e-logistic) — список отраслей, функционирующих в той или иной онлайн-форме, столь же велик, сколь и разнообразен. Вот почему для предприятий так важно иметь возможность полагаться на свою ИТ-инфраструктуру. Отказ всего лишь одного компонента ИТ-инфраструктуры показывает, насколько важно иметь надежную систему, поскольку это может вывести из строя всю систему и привести к значительным финансовым потерям. Подготовка к таким наихудшим сценариям с помощью тщательного плана аварийного восстановления ИТ-инфраструктуры может помочь снизить серьезность таких случаев.
Как происходят ИТ-катастрофы?
Частичный или полный отказ ИТ-системы может быть результатом различных ситуаций: от физических обстоятельств, таких как отключение электричества или повреждение водой, до внешнего вмешательства киберпреступников — существует множество возможных причин ИТ-проблем. Вот список некоторых наиболее распространенных причин:
- Перебои в подаче электроэнергии
- повреждение водой
- Аппаратные и программные ошибки
- Ошибки пользователей
- Кибератаки

ИТ-документация: необходимая основа
Документирование всех ИТ-ресурсов составляет основу каждого этапа плана аварийного восстановления ИТ. Именно поэтому важно, чтобы вся документация была выполнена как можно аккуратнее и тщательнее и всегда поддерживалась в актуальном состоянии. Технические и контактные данные, списки пользователей, четкое распределение ответственности за выполнение важных задач — все это играет важную роль в управлении аварийным восстановлением ИТ.
План аварийного восстановления ИТ содержит, например, информацию о:
- аппаратном обеспечении и периферийных устройствах, например, принтерах
- программных приложениях
- IP-адреса
- VPN и доступ к серверам
- Электронная почта/обмен данными
Для того чтобы в экстренной ситуации связаться с нужным человеком, необходимо включить в документацию всю важную контактную информацию. Эта информация включает в себя:
- Списки пользователей
- Контактное лицо и ответственное лицо для каждого отдельного отдела
- Контактное лицо для внешних провайдеров
- Информация о контракте с интернет-провайдером или хостинг-провайдером
План аварийного восстановления ИТ
Планы аварийного восстановления ИТ являются продуктом плавной интеграции персонала по аварийному восстановлению в общую повседневную деятельность компании. По своей сути план восстановления ИТ является частью общей схемы безопасности компании и, как правило, следует существующим в ней руководящим принципам. Вот контрольный список плана восстановления ИТ, в который обязательно должны быть включены некоторые пункты:
- Определение («Что такое катастрофа?»).
- Списки персонала с контактными данными (см. выше)
- Сигналы тревоги и системы связи
- Схема действий в чрезвычайной ситуации
- Меры по ликвидации последствий и документирование чрезвычайной ситуации
- Аварийные запасы
- Восстановление системы
Аварийные ситуации и восстановление
Помимо вышеупомянутых документов, стратегии восстановления отдельных компонентов являются одной из самых важных частей надежного плана аварийного восстановления. И именно эта часть плана часто требует наибольших усилий.
Известно, что менеджеры по ИТ-безопасности сталкиваются с множеством различных ситуаций. Оптимальная подготовка к таким сценариям должна включать план аварийного восстановления ИТ с соответствующими решениями и, прежде всего, подходящий план восстановления. Точный анализ рисков помогает выявить уязвимые области и определить части ИТ-сети, которые, хотя и представляют потенциальную угрозу, если их оставить без охраны, важны для повседневных бизнес-операций.
Перед составлением плана восстановления обязательно выполните следующие шаги:
- Анализ всех ИТ-процессов и процедур
- Анализ аппаратного обеспечения
- Аудит всех программных приложений
- Обследование всех соответствующих передаваемых и системных данных
После выполнения этих шагов вы можете приступить к созданию пошагового руководства для различных потенциальных аварийных ситуаций и записать их в свой план аварийного восстановления ИТ. Создание такого плана восстановления может оказаться сложным упражнением на терпение и усердие, поскольку он требует, чтобы каждый шаг согласовывался со всеми отделами компании. Шаблоны планов аварийного восстановления ИТ, несмотря на их полезность, не следует рассматривать как серебряную пулю для тех, кто испытывает нехватку времени. Это связано с тем, что регулярное обновление и надлежащее обучение коллег представляет собой еще одну важную задачу в создании адекватных мер безопасности. По этой причине, возможно, стоит подумать о найме внешнего подрядчика.
Повышение отказоустойчивости
Создание плана аварийного восстановления ИТ — необходимая и важная задача для любой компании. В некоторых случаях тщательно продуманный план может стать разницей между раздражающим периодом простоя и многотысячными убытками, как показывает следующий инструмент от Storagepipe. Этот инструмент позволяет пользователям создавать различные сценарии потенциальных катастроф на основе различных параметров компании, таких как годовой доход, количество пострадавших сотрудников, их почасовая заработная плата и т.д. Не нужно много времени, чтобы понять, какой финансовый ущерб могут нанести эти ситуации. Регулярное проведение учений поможет выявить потенциальные слабые места в вашей ИТ-системе, что позволит оперативно устранить их до того, как они смогут нанести реальный ущерб.