7 февраля 2013 г.

Роль сервера восстановления

Случился на прошедшей недели неимовернейший казус.На одном из Mail серверов физически умер hdd с системой.Умер в процессе программного выключения сервера для последующего монтажа в стойку.Сервер старый, начилие всего лишь двух sata портов для raid и одного ide.Всё было хорошо, если не работы вечером и я при этом крайний.День поработаешь, побегаешь, а к вечеру совсем никакой.Адекватность действий понижается в разы.Но это так отступление.
Бекапов естетсвенно не было.Хранилища  MS Exchang'а 250Гб были на рейде.Два дня простоя, отсутствия почты у подразделения.Ряд моих глупых и некорректных действий после, а именно снятие резервной копии диска в архив *.tib, а не "перерезание" его в raw на резервный диск.Постоянные не очень компетентные и конструктивные предложения человека оставшегося на монтаж со мной.23.00 на часах.Моральное накручивание На следующий день очень долгое развёртывание с рядом проблем...Перечислять могу долго, описывая дальнейшие события.Но не надо терять присутсвия духа.

Пара схем среднего и высокого разрешения:


1-ая средней детализации отображает инцидент.2-ая той ж отображает мои мысли по поводу собственно заголовка поста.Сервера восстановления???Мда.По сути выделенная высокопроизводительная рабочая станция или даже сервер с набором различных интерфейсов и специализированного софта, удалённым доступом... и занимающая не последнее место в иерархической структуре оборудования компании/предприятия/фирмы(ну или кто там у вас).Я часто задаюсь вопросом почему существуют такие дистрибутивы как BackTrack, Network Security Toolkit и другие.Да они относятся к сетям и безопасности, но их содержание и направление можно охарактеризовать парой слов.Касательно проектов масс репейринга схожей идеологии.Я думаю, что врядли они существуют.А зачем?Ведь если грамотно спроектировано и настроено резервирование, то всё вышеперечилсенное не имеет особого смысла.Да бывают какие-то ситуации, но они решаются тем же самым узкоспециализированным софтом.

Я затронул лиш одну тему о репейре.Если сложить некоторые элементы из двух схем, то на выходе можно получить часть функционала, если не весь системы поддержки и принятия решений по восстановлению чего-либо(СППР).Также например ремонт и обслуживание компьютеров.Существует много различных факторов(несовместимости/отказы/...)Нет скажем продукта, который бы предлагал точку входа для решения проблемы и в процессе деятельности(выбора списков/боксов) предлагал варианты или отсеивал не нужные.
Какие данные надо агреагировать для создания СППР.Просто огромные.Пространство вариантов.Нейросети...

Исход данной истории с рухнувшим почтовиком получился положительным.Люди посидели два дня без почты и на верхах решилось, что они просто купят новый сервер, а старый встанет на бекапы.

Хрен с ним ладно 250 Гб хранилище с 2009 года вроде.Я знаю, где есть 500 и более за 5 лет.И они ни как не чистятся.Причём сохранённая переписка является весьма важной.Объёмы данных растут и ворочать ими становится труднее.

Рентабельность затронутого под вопросом, так же как реализация/востребованность/философия...

На последок, лишь могу посоветовать обратиться к The Practice of System and Network Administration T.Limoncelli Глава 26.Резервное копирование и восстановление.

Комментариев нет:

Отправить комментарий