Непрерывность бизнеса после пандемии: что пересмотреть в архитектуре
Какие выводы об ИТ-архитектуре и операционной устойчивости стоит сделать по итогам первой волны - до того, как вернётся обычная рутина.
Карантинные ограничения в разных странах начинают смягчаться, и для части компаний встаёт вопрос возврата к офисному режиму. Это хороший момент, чтобы остановиться и зафиксировать, что показал последний квартал, пока наблюдения ещё свежи.
Не для того, чтобы написать красивый отчёт. А для того, чтобы принять несколько решений, которые повысят устойчивость к следующему кризису - каким бы он ни был.
Что выяснилось о зависимостях
Каждая компания, которая прошла через резкий переход на удалёнку, теперь точно знает несколько вещей о своей ИТ-инфраструктуре, которых раньше не знала или не хотела признавать.
Где были критичные зависимости от физического присутствия - принтеры, серверы в стойке, оборудование, которое нужно трогать руками. Где зависимость от конкретного человека в конкретном месте была скрытой, а не явной.
Какие процессы были задокументированы, а какие жили только в устной передаче. Это стало болью при первых же уходах людей на больничный или изоляцию.
Насколько компания зависит от конкретных поставщиков, у которых тоже возникли проблемы.
Что надо зафиксировать сейчас
У каждой компании свой список. Но несколько категорий повторяются почти везде:
Удалённая управляемость инфраструктуры. Что из критичной инфраструктуры требует физического доступа и не имеет удалённого управления? Это не значит, что нужно всё немедленно переводить в облако. Это значит, что нужно понимать, где эта зависимость есть, и принять сознательное решение.
Единые точки отказа в процессах. Где в операционных процессах есть задачи, которые умеет делать только один человек? Это риск, который существовал до пандемии, но пандемия его обнажила.
Документация процессов. Какие процессы до сих пор не задокументированы? После недавнего опыта у команды есть свежая мотивация это исправить - пока мотивация не угасла.
Доступность систем без VPN. Какие системы нужны сотрудникам в удалённом режиме, но доступны только через перегруженный VPN? Есть ли смысл вынести их туда, где они доступны напрямую?
Что не надо делать под впечатлением от кризиса
Кризис - плохое время для архитектурных решений, принятых под давлением. "Давайте сразу всё переедем в облако" или "давайте купим резервный дата-центр" - это решения, которые требуют спокойного анализа, а не реакции на острый стресс.
Импульс к изменениям сейчас высокий - это хорошо. Но изменения надо направить в конкретные улучшения, не в большие необдуманные проекты.
Три вопроса для руководителя
Прежде чем вернуться к обычному ритму:
- Что из того, что не работало или работало плохо в марте-апреле, мы хотим исправить до следующего сезона - независимо от того, будет ли следующая волна пандемии?
- Какие зависимости мы обнаружили, о которых не знали - и которые хотим снизить?
- Что мы поняли о своей операционной устойчивости, что стоит зафиксировать письменно, пока не забылось?
Бизнес-непрерывность - это не документ для регулятора. Это способность работать в условиях, которые не были запланированы. Последние несколько месяцев дали для этого больше практического материала, чем большинство теоретических упражнений.