Многопроцессорные системы

Виды, возможности применения и перспективы развития

(Продолжение. Начало в №13, 14)

РАЗРАБОТКА НОВОЙ АРХИТЕКТУРЫ

После рассмотрения различных вариантов стало очевидно, что для увеличения мощности серверов необходима новая архитектура. Результатом работы в этом направлении стал шестипроцессорный сервер ALR Revolution 6x6.


Логические ограничения чипа Pentium Pro

 

Как установлено прежде, базисная реализация чипа Pentium Pro поддерживает только двухразрядный идентификатор. Это специфическое соглашение ограничивает число чипов Pentium Pro в системе. Чтобы это преодолеть, необходимо было выявить неиспользуемые возможности чипа для расширения процесса идентификации.


Ограничения пропускной способности

Кластеризация была бы самым простым способом увеличения количества процессоров. Но применение кластеризации ограничивает пропускную способность системы. Перед ALR стояла задача найти способ использования вычислительной мощности нескольких процессоров без ограничения пропускной способности системы.


Физические ограничения

Система, основанная на Pentium Pro с числом процессоров больше, чем четыре и имеющая параллельную архитектуру, имеет идеальную пропускную способность. Но необходимость соблюдения некоторых требований в стандартной параллельной архитектуре (то есть поддержание силы сигнала и расстояний между процессорами согласно спецификации Intel) влечет за собой существенное увеличение выделяемой теплоты.


Поддержка программного обеспечения

При разработке новой платформы необходимо учитывать, что сервер должен поддерживать имеющиеся в наличии версии наиболее популярных операционных систем и прикладных программ. Чтобы выполнить это требование, необходимо было разработать систему, которая была бы согласована с текущими МР спецификациями.


БОЛЬШЕ ЧЕТЫРЕХ ...


Шинная кластеризация от ALR

При решении вышеописанных задач компания ALR пошла по пути применения лучших элементов архитектуры параллельной шины и концепции кластеров процессоров (в противоположность кластерам компьютеров). Результатом стала разработка архитектуры кластеризации шины.

Теория этой архитектуры также проста, как и продуктивна. Внутри новых систем ALR - две Tri-6 платы с процессорами (рисунок 3). Каждая из этих плат - независимые три процессора, готовые для работы по шине SMP и поддерживающие всю логику и технологию восстановления ActiveCPR (Central Processor Recovery). Эти два "кластера" процессоров затем подключены к 64-разрядный SMP шине с контролем по четности.

Особенности разработки компьютеров на Pentium Pro с больше чем четырьмя процессорами

  • Логические ограничения;
  • Пропускная способность;
  • Особенности конструкции;
  • Температурные параметры;
  • Электрические параметры;
  • Стандартная поддержка программного обеспечения и совместимость.

Подобная конструкция позволяет располагать процессоры в необходимой близости один от другого, как в параллельной шиной архитектуре, и позволяет избежать проблем, связанных с выделением тепла.

Рисунок 1. Типичный арбитраж, использующий идентификатор Pentium Pro.

Чтобы преодолеть логические ограничения Pentium Pro, система ALR использует уникальную дополнительную конфигурацию арбитража шины. Самый лучший способ понять, как эта система работает, состоит в сравнении с типичной четырехпроцессорной SMP архитектурой.

На системе с четырьмя процессорами арбитраж шины происходит по "round robin" алгоритму. То есть каждый процессор имеет равные права на шину, и доступ происходит по порядку (рисунок 1). Например, если всем процессорам необходим доступ к шине, сначала получил бы доступ CPU0, потом CPU1, CPU2, CPU3 и затем обратно на CPU0.

Арбитраж четырех процессоров происходит согласно их идентификаторов. В своей щестипроцессорной архитектуре ALR заимствует это соглашение с некоторыми существенными изменениями. Внутри каждой платы Tri-6 индивидуальные процессоры идентифицированы при помощи двухразрядного кода. Это дает четыре возможных комбинации, хотя необходимы только коды от 0 до 2. Разработанный ALR чип осуществляет арбитраж на каждой Tri-6 плате согласно "round robin" алгоритма, применяемого в четырехпроцессорной архитектуре. Однако в этом случае четвертый процессор заменен процессором-фантомом, который фактически представляет собой другую Tri-6 плату (рисунок 2).

Если всем 6 процессорам необходим доступ к шине, то сначала доступ получает CPU0 на кластере 0 (первая Tri-6 плата), затем CPU1 и CPU2 кластера 0. Дальше право доступа передается кластеру 1 (вторая Tri6 плата), которая для кластера 0 представляет собой четвертый процессор-фантом. CPU0 на кластере 1 получает доступ к шине, а затем это право переходит к CPU1 и CPU2 кластера 1. Затем право доступа передается опять кластеру 0 и процесс начинается снова.

Рисунок 2. Арбитраж ALR Revolution 6X6 с шестью процессорами использует стандартные логические соглашения Pentium Pro с применением процессора-фантома


Процессор-фантом

Динамический арбитраж нескольких процессоров управляется расширенным арбитром шины, использующим выделенный идентификатор кластера (mapper) (рисунок 3). Эта архитектура позволяет осуществлять равноправный и сбалансированный доступ к шине данных для всех шести процессоров при использовании стандартных логических соглашений четырехпроцессорной архитектуры. Процессоры могут взаимодействовать с эффективностью и масштабируемостью стандартной параллельной шины при преодолении многих ограничений этого подхода.

Эта конфигурация кластера шины компании ALR с уникальным динамическим арбитражем нескольких процессоров имеет еще одно важное преимущество - совместимость с МР Spec v1.1 и 1.4. В результате шестипроцессорные сервера от ALR обеспечивают непосредственную совместимость со всеми главными сетевыми операционными системами и прикладными программами.


ALR Revolution 6X6 в сравнении с четырехпроцессорными системами

Предварительные тесты показывают, что система ALR с шестью процессорами с Pentium Pro превосходит по быстродействию аналогично оборудованную систему с четырьмя процессорами на 43%. Однако, благодаря эффективной конструкции и производству, шестипроцессорные системы ALR Revolution 6X6 фактически будут стоить меньше, чем некоторые четырехпроцессорные системы. Шестипроцессорная система ALR требует приблизительно того же начального капиталовложения, что и конкурирующие четырехпроцессорные системы.

Рисунок 3.

ALR Revolution 6X6 в сравнении с четырехпроцессорными системами

  • Приблизительно на 40% большая эффективность;
  • Приблизительно та же самая стоимость;
  • Одинаково низкое начальное капиталовложение с более длинным циклом жизни изделия.


ALR Revolution в сравнении с кластерными системами

Сначала нужно отметить, что шестипроцессорная технология ALR и кластеризация серверов не исключают друг друга. Будущие промышленные стандарты делают вероятным применение ALR Revolution 6X6 в кластерных конфигурациях.

Ключевая проблема - эффективность. Как было сказано прежде, сейчас не имеется промышленного стандарта на программное обеспечение, который позволяет кластерным системам воспользоваться мощностью всех процессоров. По общему признанию технология Wolfpack Microsoft для Windows NT поможет устранить этот недостаток. Однако даже при выпуске Wolfpack эффективность кластера будет все еще будет ограничиваться физическим соединением между двумя системами.

Как Вы знаете, уважаемые читатели, кластерное решение имеет ряд преимуществ, когда речь идет об отказоустойчивости. Полная избыточность, устойчивость к выходам из строя аппаратных средств и сбоям программного обеспечения является привлекательной особенностью для бизнеса, требующего 24х365 готовности без малейших перерывов.

Revolution 6X6 с технологией восстановления ActiveCPR, избыточными источниками питания, аппаратным управлением InforManager предлагает не меньшую отказоустойчивость за более низкую цену.

ALR Revolution 6X6 в сравнении с кластерными архитектурами

  • SMP OS и поддержка прикладных программ доступна сегодня (МР Spec v 1.1 и 1.4);
  • Более высокие показатели пропускной способности;
  • Высокие уровни отказоустойчивости с приблизительно половиной капиталовложения;
  • Поддержка кластеризации.


ЦЕНА/ПРОИЗВОДИТЕЛЬНОСТЬ

Как установлено, шестипроцессорный ALR Revolution 6X6 на 43% эффективней, чем конкурирующие четырехпроцессорные системы при равном или меньшем капиталовложении. Оценено, что система с восемью процессорами будет эффективнее шестипроцессорной на 25%. Однако, по предварительным оценкам, стоимость ее будет на 80% выше.


РЕЗЮМЕ

Надеюсь, дорогие читатели, что Вы почерпнули из настоящей статьи некоторые сведения о состоянии и пути развития серверных технологий. Возможно, они окажутся полезными при решении проблемы производительности Вашей сети или увеличения ее надежности, а, возможно, Вы просто узнали, что же делают эти капиталисты, чтобы заработать побольше денег.

Так или иначе, развитие SMP систем продолжается. Они проходят этап за этапом в своем развитии, а мы вправе выбирать, чем нам воспользоваться из предлагаемых на рынке решений, в основе которых лежат различные платформы, идеи и возможности.

Александр АПАНАСИК,
компания NTI,
тел./факс 262-60-26

Версия для печатиВерсия для печати

Номер: 

15 за 1997 год

Рубрика: 

Hardware
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!