Многопроцессорные системы

Виды, возможности применения и перспективы развития

(Окончание. Начало в №13)

Параллельная Шина

Эта архитектура была наиболее популярна при разработке x86 компьютеров. В архитектуре параллельной шины различные процессоры располагаются рядом друг с другом. Связи и взаимодействие между процессорами являются быстродействующими и эффективными. Обработка потоков данных производится с максимальной скоростью.

Самая ранняя многопроцессорная обработка от ALR в 386 компьютерах была основана на приоритетной архитектуре C-шины, где все процессоры и память находились на одной расширенной 32-разрядной шине.

 

Двух- и четырехпроцессорные серверы от ALR также основаны на параллельной архитектуре. Такая конструкция предлагает простое и эффективное масштабирование. При применении набора микросхем Orion Intel поддерживается обработка данных со скоростью свыше 400 Mb/s.

Поддержка нескольких процессоров встроена в Pentium Pro, что делает многопроцессорные системы сравнительно недорогими. Благодаря спецификации Intel Spec v 1.1 и 1.4, операционные системы и прикладные программы работают на таких серверах, используя все его возможности.

При необходимости использования свыше четырех чипов Pentium Pro преимущества параллельной архитектуры шины становятся не так очевидны. Это происходит от того, что при расположении процессоров на плате конструктор должен учитывать довольно строгие требования к электрическим и тепловым параметрам. Чтобы удовлетворять электрическим параметрам, процессоры должны находиться на небольшом расстоянии. В то же время этот фактор создает некоторые проблемы. Сама по себе задача физической группировки процессоров является сложной. Вдобавок, непосредственное соседство процессоров создает проблемы по утилизации выделяемого тепла.

Pentium Pro имеет некоторые особенности логической архитектуры. Для поддержки многопроцессорной обработки чипы имеют встроенную поддержку двухразрядного идентификатора процессора - APIC (Advanced Programmable Interrupt Controller). Это позволяет задавать четыре возможные двоичные комбинации - 00, 01,10 или 11. При переводе в десятичные числа получаем возможность поддержки процессоров с идентификаторами 0, 1, 2, и 3. По умолчанию CPU с самым высоким номером идентификатора становится процессором начальной загрузки. Такая идентификация облегчает арбитраж шины данных в SMP системе.

Пока подобная конструкция делает разработку и эксплуатацию двух- и четырех процессорных систем экономичной, однако она не дает возможности стандартным путем наращивать количество процессоров более четырех.

Преимущества архитектуры параллельной шины

  • Высокая пропускная способность;
  • Хорошая масштабируемость;
  • Невысокая стоимость;
  • Стандартизированная поддержка программного обеспечения (Intel Spec v 1.1 и 1.4).

Недостатки архитектуры параллельной шины

  • Увеличение выделения тепла;
  • Электрические ограничения;
  • Внутренняя архитектура P6 имеет ограничения на применение более четырех процессоров.


CC-NUMA

CC-NUMA (Cache Coherent Non-Uniform Memory Access) использует несколько "building blocks" или группы процессоров, чтобы расширить многопроцессорную обработку свыше четырех процессоров. В сущности, каждый из этих "building blocks" - независимая SMP машина. Подобно параллельной архитектуре шины, в архитектуре CC-NUMA процессоры находятся близко и в результате повышается эффективность использования их ресурсов. Обратной стороной такой конструкции является стоимость внедрения. Кроме того, эти системы неспособны воспользоваться некоторыми преимуществами прикладных программ и операционных систем. Оба этих фактора делают архитектуру CC-NUMA неподходящей для большинства стандартных применений. В результате системы, использующие эту архитектуру, прежде всего используются для уникальных высококачественных и высокопроизводительных прикладных программ, требующих более восьми процессоров.

Преимущества CC-NUMA

  • Превосходная масштабируемость;
  • Возможность работы с количеством процессоров > 8.

Недостатки CC-NUMA

  • Высокая стоимость;
  • Требует уникального ПО (прикладные программы и OС).


Кластеризация

В кластерной среде несколько серверов соединены вместе для достижения расширенной многопроцессорной обработки. Такое применение серверов позволяет создавать отказоустойчивые системы.

Кластерные архитектуры удовлетворяют самым жестким требованиям к отказоустойчивости, возможностям горячей замены, доступности по формуле 24х365. Они имеют коэффициент готовности практически равный 1 и предоставляют непрерывный доступ к данным и их обработку даже при выходе из строя нескольких узлов.

С точки зрения эффективности, этот подход имеет несколько ограничений. Наиболее значительное ограничение - физическая связь между серверами. При применении технологии Ethernet соединение между серверами ограничено100 Mb/s пропускной способностью. Сегодняшние самые быстрые уникальные разработки не позволяют поднять этот предел выше отметки 400 Mb/s. Это означает значительную потерю эффективности в ближайшем будущем.

Но самое большое препятствие для повышения производительности кластерных систем - недостаточная поддержка программным обеспечением. До настоящего времени отсутствует промышленный стандарт, позволяющий воспользоваться полной мощностью всех процессоров в кластере серверов. Ожидается, что Microsoft Wolfpack, ПО для кластера NT серверов, сможет решить эту проблему. Однако, оно будет доступно только в 1997 или не ранее 1998 года.

Как результат - большинство кластеров являются на сегодня избыточными и использующими свою архитектуру, скорее, для повышения отказоустойчивости, чем для увеличения вычислительной мощности.

Даже при доступности Microsoft Wolfpack для Windows NT кластеризация была бы довольно дорогим вариантом для тех пользователей, которые просто желают расширить мощность сервера. Важно обратить внимание, что SMP системы с параллельными шинами часто используются в кластерных конфигурациях, так что использование этих двух технологий может очень часто дополнять друг друга.

Преимущества кластеризации

  • Высокий коэффициент готовности;
  • Простое использование;
  • Легко доступные аппаратные средства.

Недостатки кластеризации

  • Высокая стоимость (для SMP прикладных программ) ;
  • Ограниченная пропускная способность;
  • Недостаточная SMP поддержка программного обеспечения.

(Окончание следует)

Александр АПАНАСИК,
компания NTI,
тел./факс 262-60-26

Версия для печатиВерсия для печати

Номер: 

14 за 1997 год

Рубрика: 

Hardware
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!