Кластеры - это супер

Некоторые ученые и инженеры очень много вычисляют. И не потому, что любят они это дело. А потому, что очень многие важные проблемы не имеют решений в виде простых и красивых формул, и результаты могут быть получены только путем компьютерных супервычислений. Или суперкомпьютерных вычислений, что, впрочем, теперь не совсем то же самое, поскольку в наши дни все больше и больше "числодробительных" суперпроблем решается не на суперкомпьютерах, имеющихся в богатых университетах и национальных лабораториях, а на кластерах PC - десятках или даже сотнях самых обычных, "из соседнего магазина", персональных компьютеров, связанных между собой быстрым Ethernet'ом.

Есть несколько причин, по которым происходит миграция исследователей, нуждающихся в интенсивных вычислениях, с суперкомпьютеров на кластеры PC. Во-первых, исследователь, прорвавшийся со своей проблемой на суперкомпьютер, получает для обсчета этой проблемы, как правило, не более 16 процессоров суперкомпьютера одновременно. Ну, и что это за суперпроцессоры? Они, в лучшем случае, лишь вдвое мощнее процессоров современных PC. Как тут не размечтаться о кластере из 50-200 "персоналок"? Во-вторых, персональные компьютеры наших дней характеризуются не только высокой производительностью, но и низкой стоимостью, - со стабильной тенденцией роста первой и снижения второй. Не буду распространяться о пользе конкуренции в условиях массового спроса и предложения, а лишь отмечу, что по этой причине теперь кластер PC обходится чуть ли не в 10 раз дешевле суперкомпьютера сопоставимой производительности. Наконец, в-третьих, решение некоторых "числодробительных" проблем требует ненормально много времени. Трудно и практически невозможно добиться получения 50000 процессоро-часов в суперкомпьютерном центре под одну проблему, однако исследовательская группа с хорошим финансированием может создать собственный кластер из 50 PC и таким образом получить в свое распоряжение более 400000 процессоро-часов в год.

Все вышесказанное можно проиллюстрировать цифрами и фактами из доклада д-ра Лонга из Penn State (т.е. из Университета штата Пенсильвания), сделанного на 38-й Конференции и выставке по аэрокосмическим наукам в Рено, шт. Невада. Лонг и его соавтор, д-р Брентнер из NASA, занимаются аэроакустическими расчетами с использованием программы под названием WOPWOP. Они, в частности, рассчитывали шум, производимый винтом вертолета. Это - хорошо распараллеливаемая задача. Объем кода программы невелик. Требуется всего лишь около десятка секунд на хорошей рабочей станции, чтобы рассчитать интенсивность шума от вертолетного винта в одной точке пространства в один момент времени. Чтобы построить диаграмму направленности шума, нужно повторить расчет для тысячи точек пространства, и на это уйдет уже несколько часов. А чтобы узнать, как диаграмма направленности меняется со временем (например, при раскручивании или остановке винта), надо повторить все расчеты для сотен моментов времени, на что рабочая станция потратит пару месяцев. В общем, эта задача - не для рабочей станции. Лонг и Брентнер решали ее на двух суперкомпьютерах, Cray T3E и SGI Origin 2000 (последний, на самом деле, тоже Cray), но чаще всего они пользовались созданным в Penn State кластером PC по имени COCOA. В качестве небольшого теста производительности исследователи обсчитали на всех трех машинах "вертолетный шум" в 400 точках пространства в 1 момент времени, при этом у каждой из машин работало по 48 процессоров. Вот результаты по времени выполнения теста: Cray T3E - 177 сек, COCOA - 127 сек, SGI Origin 2000 - 95 сек; комментарии излишни. Не имея ничего общего с какао, COCOA - это COst-effective COmputing Array, 50-процессорный кластер PC с 13 гигабайтами оперативной памяти и 100 гигабайтами дискового пространства. Создание COCOA обошлось в $100000 в 1998 году (теперь это было бы вдвое дешевле). Весьма впечатляет, что суперкомпьютер сопоставимой производительности стоил бы Пенсильванскому университету $750000.

И еще один пример. Группа д-ра Чью из Иллинойского университета занимается разработкой быстрых алгоритмов решения радиофизических проблем. Более точно, их новые вычислительные алгоритмы существенно ускоряют решение интегральных уравнений, описывающих процессы испускания и рассеяния радиоволн. Чью утверждает, что посредством их быстрых алгоритмов можно за сутки рассчитать такое, на что ушло бы 10 лет при использовании традиционных алгоритмов. Вероятно, в этом "программном" ускорении вычислений в 3650 раз есть доля здоровой саморекламы, однако нас будет интересовать "аппаратная" часть рекорда Чью и его команды: ведь недавно они сумели решить за сутки систему с 9.6 млн. неизвестных. На чем? На 32-процессорном суперкомпьютере SGI Origin 2000. За сутки. А часто ли иллинойским радиофизикам дают этот суперкомпьютер на сутки? Ну, для того, чтобы поставить рекорд, дали. Поэтому для своих повседневных расчетов д-р Чью и его коллеги используют кластер из 16 персональных компьютеров. Кластер, конечно, небольшой, зато стоит всего-то $20000 и лихо решает системы с 600000 неизвестных за полдня. Кроме того, этот кластер не нужно ни с кем делить, потому что сделала его группа Чью своими руками и для собственных нужд.

Странные времена на дворе, однако. Спрос на супервычисления растет, а компанию Cray в очередной раз продают, на фоне чего банды ширпотребных "писюков" бьют супермашины с гордым именем Cray. Бедный Сеймур Крэй. Но он не дожил до всего этого безобразия...

 

Иван ЖИЛИН,
sci@au.ru

Версия для печатиВерсия для печати

Номер: 

12 за 2000 год

Рубрика: 

Новые технологии
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!