Идёт загрузка страницы...

htp://aptem.net.ru





NT/2000— взлеты и падения№37(156)/17.09.2001

Алексей ШАРАДКИН sad_home@mail.ru
Водители пристегиваются ремнями безопасности и надеются, что они
никогда им не пригодятся. Но, как говорится в пословице, есть только
два типа водителей: те, кто уже попадал в аварию, и те, кому это еще
предстоит. Также и системные администраторы готовят архивы и диски
аварийного восстановления системы, ибо бывают только два типа сетей:
те, которые уже падали, и те, которым это только предстоит.
Представим страшное — сеть таки «упала», пользователи психуют,
начальник «тихо и спокойно» интересуется, когда это все
заработает... Б-р-р-р. С достоинством и быстро из подобной ситуации
может выйти либо очень опытный администратор, переживший уже не одну
аварию, либо хорошо подготовленный теоретически. Так как первым,
наверное, читать эту статью незачем, попробуем подготовить
теоретически всех остальных. Сразу определю, что описанные процедуры
касаются сетей на основе Windows NT и Windows 2000.
Итак, для того чтобы авария не застала вас врасплох, нужно
пристегнуть те самые ремни безопасности — провести комплекс
предварительных мероприятий. Во-первых, попробуйте составить полный
список всех возможных (и невозможных) отказов. Не стесняйтесь
расспросить знающих людей, ибо чем больше вариантов, тем больше
спокойствия для администратора.
Также не забывайте, что современные системы развиваются столь
стремительно, что можно сильно отстать уже за очень короткое время.
Далее сядьте и запишите все возможные отказы, и действия, которые Вы
должны будете предпринять в этом случае. Некоторые сразу парируют —
а зачем, мол, на память не жалуюсь, и все такое. Но только нужно
учитывать и психологический момент, что в исключительных ситуациях
люди теряются, делают ошибки или забывают о важных вещах. Поэтому
сделайте «твердые» копии разработанных процедур, храните их в разных
местах и следите за их обновлением. Когда сервер откажется
загружаться, просто достаньте этот лист, и действуйте в спокойной
обстановке по заранее разработанному плану. Важно помнить, что
всегда желательно начинать с минимальных воздействий: совсем
необязательно сразу форматировать диск и переустанавливать систему,
если можно обойтись малой кровью.
Исходя из этих соображений, приведу наиболее часто встречающиеся
аварии, и что в этих случаях делать.
Меню LAST KNOWN GOOD
Иногда, проводя апгрейд системы, вы можете собрать такую
конфигурацию, которая не позволит системе загрузиться. В этом случае
наиболее простым способом станет восстановление с помощью меню LAST
KNOWN GOOD при загрузке. При перезагрузке системы вы увидите
сообщение: Press spacebar NOW to invoke Hardware Profile\Last Known
Good menu (нажмите пробел для выхода в меню конфигурации
оборудования/использования последней удачной конфигурации). После
нажатия на пробел вы переходите в меню выбора различных вариантов
загрузки, позволяющих обойти последнее сделанное изменение,
приведшее к аварии. Также этой возможностью можно воспользоваться,
если на сервере имеется несколько профилей оборудования. Для того
чтобы в случае аварии иметь хорошую страховку, сохраните текущий
профиль оборудования. Потом, если случится нечто экстремальное,
просто восстановите этот профиль.
Диск аварийного восстановления
При установки операционной системы вам предлагалось создать диск
аварийного восстановления системы (Emergency Repair Disk — ERD) ,
надеюсь, вы это сделали :-). Но этот диск будет полезен только в том
случае, когда на нем хранится самая свежая информация. Собственно на
диске содержится следующая информация: ветви реестра, файлы
инициализации MS-DOS (AUTOEXEC.NT и CONFIG.NT), база данных
диспетчера безопасности учетных записей (Security Accounts Manager —
SAM). Перед любыми серьезными изменениями (добавление, снятие,
изменение жестких дисков, разделов, файловых систем, установки
большого и серьезного программного обеспечения) нужно сохранить диск
ERD (его можно сделать с помощью программы RDISK.EXE, входящей в
комплект поставки операционной системы), чтобы в случае сбоя было к
чему возвращаться. Обращаю ваше внимание, что диск аварийного
восстановления системы не является загрузочным, и для того чтобы
загрузиться, вам понадобится другой диск:
Диск аварийной загрузки
Если система не загружается, потребуется диск аварийной загрузки
(Emergency Boot Disk) . Загрузочный диск, который вы создадите, не
будет общим, а окажется действительным только для определенной
конфигурации, поэтому его нужно делать отдельно для каждой машины.
Для того чтобы создать диск аварийного восстановления,
отформатируйте (под NT!!!) дискету и запишите на нее следующие
файлы:
NTDR
NTDETECT.COM
BOOT.INI
Восстановление отказавшего сервера
Надеюсь, вы послушались совета и создали все необходимые диски.
Полагаю, у вас есть также архив для восстановления потерянных
файлов. В этом случае даже полный выход сервера из строя не приведет
к необратимым последствиям. Но прежде, чем восстанавливать
потерянные файлы, вам необходимо вернутся к состоянию, когда вы
сможете хотя бы загрузится. После этого:
• переустановите на восстановленной системе операционную систему.
После установки базовой системы можно будет восстановить информацию
о реестре и разделах с диска аварийного восстановления системы;
• перезагрузите сервер с дискеты и выберите вариант загрузки Repair
, если вы собираетесь восстановить отказавший сервер с помощью диска
аварийного восстановления (этим способом вы «реанимируете»
информацию о разделах и большую часть реестра);
• после того, как диск аварийного восстановления сделает все, на что
он способен, можно будет перезагрузить сервер и восстановить с
последнего архива утерянные данные;
• перезагрузите сервер и работайте себе на здоровье!
Вот и все. Как видите, ничего сложного, пара часов — и все готово.
Единственная проблема — если это серьезное
производство/интернет-шлюз/сервер с базой данных предприятия, у вас
может не оказаться времени даже на это. В этом случае единственный
выход — применение различных вариантов RAID .
Что же такое RAID? RAID — это использование нескольких объединенных
в массив жестких дисков для обеспечения большего размера тома,
отказоустойчивости и повышения производительности. RAID можно
реализовать как на программном, так и на аппаратном уровне. В первом
случае нужно учитывать два отрицательных момента: возникновение
дополнительной нагрузки на центральный процессор и отсутствие
возможности выполнить горячую замену. Поэтому стоит еще при
проектировании определить, что является для вас наиболее важным, а
чем можно пожертвовать. Коротко укажу плюсы аппаратной реализации:
горячая замена дисков, встроенное кэширование, повышенная
производительность. Так как в основном при установке аппаратного
контроллера пользуются прилагаемым программным обеспечением,
разберем программную реализацию. Итак, в Windows NT реализованы
следующие уровни RAID — 0 (чередующийся набор), 5 (чередующийся
набор с четностью), 1 (зеркалирование).
Чередующийся набор (RAID 0) представляет собой способ использования
нескольких дисков небольшого размера или частей диска и объединения
их в один большой блок, который система будет рассматривать как один
диск. Это объединение позволяет повысить производительность системы
(за счет того, что запись производится поочередно на несколько
дисков), однако серьезно снижает ее отказоустойчивость в целом, так
как отказ любого диска или контроллера приводит к выходу всей
системы из строя. Если при этом у вас нет текущей резервной копии,
восстановление окажется достаточно дорогостоящей и длительной
операцией, требующей участия высококвалифицированных специалистов.
Для того чтобы решить проблему отказоустойчивости, используется
развитие этого метода — чередующийся набор с четностью.
Чередующийся набор с четностью (RAID 5) , как и простой чередующийся
набор, записывает данные на диски поочередно. Но при этом для
каждого записываемого блока создается дополнительный блок с
информацией о четности, где хранится информация, необходимая для
восстановления системы в случае отказа одного из входящих в массив
дисков. Но, как и везде, тут есть свой минус — необходимость
использования не менее трех одинаковых дисков (или областей жестких
дисков). Основное достоинство данного метода состоит в том, что
систему можно очень легко восстановить при отказе одного из дисков,
либо продолжать некоторое время работу даже при наличии в ней
поврежденного диска. Нужно учитывать, что система работает только
при одном поврежденном диске. Второй отказ приведет к потере данных.
Поэтому, если такая неприятность случилась, необходимо как можно
быстрее заменить поврежденный диск, и с помощью программы Disk
Administrator (входящей в поставку операционной системы) провести
восстановление системы.
Зеркальный набор — последний из вариантов RAID, поддерживаемых
Windows NT и администратором дисков. В принципе применительно к
конкретной операционной системе это может быть либо зеркальное
отображение диска (когда на два диска, подключенных к одному
контроллеру, одновременно записывается идентичная информация), либо
его дублирование (когда каждый диск подключен к отдельному
контроллеру, что исключает его выход из строя при сбое контроллера).
Использование зеркальных дисков является самым отказоустойчивым
вариантом массива из числа поддерживаемых администратором дисков и
системой.
Начальная стоимость использования зеркальных дисков меньше, чем
чередующегося набора с четностью, из-за того что необходимо только
два диска, а не три, как в варианте чередующегося набора с
четностью. Но при длительной эксплуатации их стоимость окажется
выше, так как меньше эффективность использования дискового
пространства. (Для RAID 5 потери составляют 33 %, а для RAID 1 — 50
%.) Если вы можете себе это позволить, старайтесь организовать
дублирование: это, во-первых, снизит вероятность отказа, а
во-вторых, повысит скорость работы дисковой системы, так как доступ
к дискам будет осуществляться через два отдельных контроллера.
В случае повреждения диска, входящего в зеркальный набор, нужно с
помощью программы Disk Administrator разбить набор, а затем заменить
диск и восстановить зеркальный набор.
Подводя итог, можно посоветовать следующие конфигурации дисковой
системы, в порядке снижения стоимости и надежность:
• аппаратный зеркальный набор с дублированием/зеркалированием;
• аппаратный чередующийся набор с четностью;
• программный зеркальный набор с дублированием/зеркалированием;
• программный чередующийся набор с четностью;
• использование высококачественных и дорогостоящих дисков, прошедших
перед установкой в сервер откатку в течение 1-2 месяцев;
• программный чередующийся набор (следует помнить, что этот вариант
не обеспечивает устойчивости к отказам, а только увеличивает
вероятность сбоев)
Оценивайте, выбирайте и стабильной вам работы и легких подъемов!!!

СОДЕРЖАНИЕ