Как защититься от сбоев системы

Когда система дает сбой, это всегда неприятно. Придется, как минимум, перезагружаться, а, возможно, и заняться восстановлением потерянных данных. А если речь идет о медицинских записях или транзакциях в бизнесе, когда необходим непрерывный доступ к данным? Потери не трудно представить. Поэтому проблема защиты информации от сбоев системы является очень важным предметом исследований во многих лабораториях мира.

И вот недавно ученые из Массачусетского технологического института (MIT) предложили способ восстановления данных "на лету", который позволяет системе продолжать вычисления даже после того, как в ней произошел сбой, обычно требующий перезагрузки. По сути, это метод "отката назад и повтора" (log-rollback-and-replay). Главная проблема, которую приходится решать при восстановлении работоспособности системы "на лету", - это определение того, что следует фиксировать при работе.

В предложенной схеме не ищутся ошибки в компьютерном коде, а проводится анализ абстрактных моделей данных, который показывает отношения между объектами данных. Такое абстрактное представление значительно упрощает весь процесс анализа и делает ошибки в структуре данных наглядными. При обнаружении нарушений система может вернуть фрагменты на несколько шагов назад, инициализировать и вставить потерянные фрагменты или удалить испорченные. Таким образом, сбойные состояния опять делаются устойчивыми. Весь процесс проходит в автоматическом режиме. Это особенно важно для тех компьютерных систем, которые должны большую часть времени действовать без прямого вмешательства человека, например, в автомобилях, зданиях, общественных местах.

Но, как признают сами разработчики, в такой автоматизации есть и оборотная сторона, так как ошибки могут привести к полной потере информации или процесс коррекции будет давать некорректные результаты. В тех случаях, когда важнее, чтобы система продолжала работать, и когда ждать вмешательства человека для ее перезагрузки нецелесообразно, такие потери могут быть отчасти оправданными. Тем более, что исследования показывают, что коррекция большинства ошибок требует сравнительно простых мер.

Пока новая методика восстановления данных находится в стадии лабораторного тестирования. Следующим шагом будет испытание ее с реально работающими в разных сферах приложениями. Практическое применение она сможет найти уже через 2-4 года.

 

Технические подробности в докладе: tesla.hpl.hp.com/self-manage03/Finals/demsky.ps.

Сергей САНЬКО

Версия для печатиВерсия для печати

Номер: 

05 за 2004 год

Рубрика: 

Новые технологии
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!