Безопасность ЦОДа, или Чем черт не шутит

Безопасность ЦОДа, или Чем черт не шутит

Вы можете увидеть это лишь раз. Но этого будет достаточно.
«Пятница, 13-е».

Шон Каннингем, 1980

Если услышите, как из вашей серверной доносятся матерные вопли, — знайте, быть беде, на дворе — пятница, 13. В этот день в каждого жителя дружного айтишного болота вселяется бес, способный разрушить мирное существование вашей ИТ-инфраструктуры.

А жителей в наших краях много: здесь и злобные сисадмины, которые так и норовят допустить ошибку, и ночные техники-водяные, по фану выдергивающие кабели из северных стоек. Где-то рядом носятся второстепенные страждущие персонажи, мечтающие положить ваш бизнес: маркетологи-бестии и демонические существа из отдела продаж запускают массовую рассылку рекламных сообщений. А заказчики ждут сбоев, чтобы от души потроллить вашу компанию в социальных сетях.

Какой только нечисти по пятницам тут не водится! Воет вьюга, плавится оборудование и, кажется, даже программное обеспечение в этот день живет само по себе — хочет, выдаёт лаг, хочет — выдаёт два.

Бесчинство процветает — инфраструктура выходит из строя, и каждый тешится жаждой мести — найти крайнего. Кто будет нести ответственность за случившуюся вакханалию, если информационная инфраструктура именно вашей компании не переживёт пятницу, 13?

Ой, я в такие сказки не верю

Очень зря. Ведь, если процессы в вашей компании автоматизированы, то у вас каждый день, что пятница, 13. Ляжет инфраструктура — и все, досвидули, сам дурак. А концов не найти.

Ой, ладно, не надо меня пугать, я делаю бэкапы

Одного бэкапирования уже недостаточно — если инфраструктура даст сбой, вам негде будет развернуть резервные копии данных. На поиск новой площадки уйдет около недели. За это время бизнес может обанкротиться. К сожалению, от этого не застрахован никто — разве что у вас есть DR-план. Не верите? Достаточно вспомнить несколько последних прецедентов.

Опыт Мегафона: Кай умер и больше не вернётся

«Господи, боже мой, за что такая напасть на нас, грешных! И так много всякой дряни на свете… » (с) это Гоголь говорит

В январе 2017 года из-за слишком низких температур в Москве (- 35 градусов) система охлаждения дата-центра Мегафона в Дмитрове вышла из строя. С последствиями аварии боролись около двух дней — все это время часть сервисов оператора была недоступна: клиенты не могли воспользоваться «Мегафоном ТВ», «Мультифоном», картами «Мегафон.Банка» и зайти в личный кабинет. По одной из версий, в системе охлаждения замерз хладагент. Как следствие, были повреждены трубы. Произошла утечка этиленгликоля (теплоноситель, растворы которого применяются в системах охлаждения ЦОДов). ЧП произошло в новогодние праздники, поэтому сотрудникам компании понадобилось время, чтобы справиться с последствиями аварии. Тогда как наличие резервной площадки позволило бы оперативно восстановить работу систем.

GitLab: «Он бачь, яка кака намалёвана!»

«...на стене сбоку, как войдешь в дата-центр, намалевал Вакула черта в аду — сисадмина, такого гадкого, что все плевали, когда проходили мимо; а бабы, как только расплакивались у них на руках дитя подносили его картине и говорили: «Он бачь, яка кака намалёвана!» — и дитя, удерживая слезинки, косилось на картину и жалось к груди своей матери» (с) Повесть о том, как Гоголь поступил в техвуз

Ярким примером человеческой ошибки может служить ситуация, возникшая в начале февраля 2017 года в компании GitLab. Системный администратор случайно удалил базу данных с информацией по проектам пользователей. При попытке развернуть бэкапы была обнаружена проблема в синхронизации реплицируемых данных. На восстановление работоспособности сервиса потребовалось около суток. Опять же, это время можно было бы сократить с помощью услуги Disaster Recovery, переключив продуктив на резервную площадку и развернув из облачного хранилища копии, в один клик.

Пора вызывать экзорциста

Мы бы лукавили, если бы сказали, что можем предупреждать аварии в дата-центрах. Для этого иногда необходим дар провидца. Его у нас нет. Зато есть сервис восстановления данных после сбоев, который призван минимизировать негативные последствия от чрезвычайных ситуаций. Приобретая услугу резервной площадки, вы получаете:

  1. Профессиональную русскоязычную техническую поддержку 24×7.
  2. Лучшее в своём классе RPO/RTO, не требующее подготовки со стороны диска или копирования данных.
  3. Мгновенное восстановление с любой точки восстановления несколькими щелчками мыши.
  4. Двухэтапную дедупликацию и WAN оптимизацию, что уменьшает использование сети и хранилища до 70%.
  5. Хранение ваших данных в надежных и физически защищенных дата-центрах уровня Tier 3.
  6. Отсутствие необходимости платить за дополнительные лицензии VMware.
  7. Регулярное автоматизированное тестирование Disaster Recovery сценариев.
  8. Отчеты о тестах и актуальное понимание, чего ожидать в случае сбоя ИТ.
  9. Возможность бесшовной миграции вашей инфраструктуры на бесплатный OpenStack.

Рецепт зелья от сглаза

  1. Мы создаем план Disaster Recovery.
  2. Cовместно с вами план корректируется с учетом индивидуальных потребностей вашей компании.
  3. На вашу инфраструктуру устанавливается софт, который инициализирует виртуальные машины и топологию сети.
  4. Начинается процесс односторонней синхронизации данных между основной площадкой и нашей облачной платформой.
  5. Данные копируются непрерывно с момента запуска этого процесса, с заранее определенной периодичностью, которую вы можете задать сами (раз в три часа, раз в 10 минут, как угодно).
  6. Данные передаются по защищенному каналу, хранятся в облаке в нескольких копиях, в надежных и физически защищенных дата-центрах уровня Tier 3 по сертификации Uptime Institute.
  7. В рамках функционала Disaster Recovery есть возможность хранить данные за несколько месяцев.
  8. В случае чрезвычайной ситуации в автоматическом или в полуавтоматическом режиме (с участием ваших системных администраторов) запускается DR: данные скачиваются из хранилища, а виртуальные машины разворачиваются в нашем облаке.
  9. При желании вы можете время от времени проверять исправность инфраструктуры и актуальность DR-плана, запуская процедуру DR в нашем облаке, оценивать время запуска критических приложений или всей инфраструктуры в целом. А после тестовых работ запущенную инфраструктуру можно использовать в качестве лаборатории для тестирования новых решений компании или разработки приложений.

Практическая современная магия

Бессмертный Веничка Ерофеев, путешествующий из Москвы в Петушки, наивно верил: чтобы изгнать дьявола, надо больше пить и меньше закусывать. Классика. Но мы ратуем за здоровый образ жизни, а потому настоятельно советуем просто предохраняться.

О работе сервиса вы можете прочитать в нашем материале «От частного к общему: зачем вам Disaster Recovery и как это поможет уйти от лицензионных выплат VMware навсегда». Для более подробной информации свяжитесь с нашим отделом продаж (sales@atlex.ru).

Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Аватар

    Для реализации основных услуг и функций нашего сайта, а также для сбора данных о том, как посетители взаимодействуют с нашими сайтом, продуктами и услугами, мы применяем различные инструменты, включая файлы cookie. Нажимая «Принимаю», вы соглашаетесь с текущими правилами и условиями использования сайта и даете разрешение на использование этих данных. В противном случае, пожалуйста, покиньте сайт.

    Сообщить об опечатке

    Текст, который будет отправлен нашим редакторам: