Для современного компьютера наиболее актуальной характеристикой можно назвать пропускную способность канала между памятью и процессором. Это связано с тем, что программное обеспечение оперирует все большими объемами данных. Внутреннего кэша процессора для многих алгоритмов оказывается недостаточно, из-за чего обращение к памяти идет постоянно. Если канал между процессором и памятью недостаточно широк, процессор вынужден простаивать в ожидании поступления очередного блока данных.
Этот канал состоит из двух составляющих - системной шины между процессором и чипсетом и шины между чипсетом и памятью. Шина памяти большинства современных систем имеет ширину 64 бита, частоту 133 или 166 МГц и удвоенную пропускную способность при передаче данных. Большего пока не позволяют технологии. А параметры шины процессора зависят от самого процессора.
Сегодня самую быстродействующую шину имеет процессор Pentium-4 - 64 бита, 100 МГц, четырехкратная скорость передачи данных. Путем нехитрых расчетов получаем ее пропускную способность - 3.2 Гб/с. Казалось бы, зачем увеличивать быстродействие этой шины, если самая современная память не может обеспечить более 2.7 Гб/с?
Однако 6 мая корпорация Intel объявила три новых процессора Pentium-4 с частотами 2.26, 2.4 и 2.53 ГГц. Они основаны на все том же ядре Northwood, но от предшественников отличаются частотой шины - 133 МГц вместо 100 МГц. Эффективная тактовая частота получается равной 533 МГц, а пропускная способность - 4.3 Гб/с. Обратите внимание на следующий момент. Увеличилась не только пропускная способность, но и тактовая частота шины. Да, процессор не сможет больше данных передавать по своей шине, так как память быстрее работать не стала. Однако благодаря более высокой частоте быстрее будут передаваться адреса и управляющие сигналы, а значит, уменьшится латентность шины - длительность задержек перед началом обмена данными. Кроме того, когда появятся новые шины памяти, процессор уже будет готов их поддержать (я подразумеваю прежде всего следующий чипсет Intel - Springdale, который, по слухам, будет иметь 128-битную шину памяти).
Новые три процессора минимально отличаются от прежних моделей. Они тоже имеют 512 Кб кэша и выпускаются по той же технологии - 0.13 мкм и медные межсоединения. Отличительная особенность есть - новые кристаллы размещают на 300 мм пластинах, что позволяет снизить издержки в расчете на один процессор. Один процессор совпадает по частоте с предыдущим процессором, поэтому у него в маркировке появилась буква "B" - это Pentium-4 2.4B.
Для поддержки новых процессоров Intel подготовила два новых и модернизировала два старых чипсета. i850E отличается от i850 только официальной поддержкой шины 533 МГц, а вот i845E получил новый "южный" хаб ICH4. Впрочем, и i850E может поддерживать этот хаб, но, по некоторым причинам, этого не сделано. Чипсеты i845G и i845GL имеют встроенную графику, но рассмотрение ее особенностей выходит за рамки этой статьи.
Даст ли прирост производительности увеличение частоты шины? И если даст, то какой? Чтобы получить ответы на эти вопросы, я провел специальное тестирование двух процессоров на новой материнской плате ASUS P4B533 (чипсет i845E). Ее подробное описание появится в газете в ближайшее время, а пока рассмотрим результаты тестирования двух процессоров с одинаковой внутренней тактовой частотой, но разной внешней. Поскольку ни одного нового процессора мне достать не удалось (они пока к нам не завозятся вследствие высокой цены), я пошел другим путем - разогнал процессор Pentium-4 1.6 до 2.2 ГГц (16х138) и сравнил его с настоящим Pentium-4 2.2 (22x100).
В состав тестовой платформы, помимо упомянутой материнской платы, вошли следующие компоненты: память 256 Мб PC2700 Samsung, видеокарта GeForce3 Ti200, винчестер Quantum Fireball Plus AS. Операционная система - Windows 2000 Pro SP2, драйверы INF 4.01.1011, IAA 2.2, Detonator 28.32. Память работала на частоте 133 МГц, так как большего не позволяла материнская плата.
Pentium 4-400 (22x100) |
Pentium 4-533 (16x138) |
Разница | |
CPUMark99 | 138 | 140 | 1% |
Sandra2002 Memory ALU | 1045 | 1075 | 3% |
Sandra2002 Memory FPU | 1045 | 1076 | 3% |
Sandra2002 Memory SSE2 | 2061 | 2119 | 3% |
Sandra2002 Memory SSE2 | 2061 | 2119 | 3% |
Wstream | 1046 | 1082 | 3% |
Cachemem Memory Read | 1822 | 1943.6 | 7% |
Cachemem Memory Write | 611.4 | 626.4 | 2% |
PCMark2002 Memory Index | 4828 | 4950 | 3% |
Linpack Memory Throughput | 171.2 | 175.4 | 2% |
SYSMark2002 Office | 151 | 155 | 3% |
SYSMark2002 Content Creation | 303 | 308 | 2% |
Winstone2001 Business | 59.1 | 59.9 | 1% |
Winstone2001 Content Creation | 76.9 | 77.8 | 1% |
SPECviewperf summary | 166.5 | 168.9 | 1% |
3DMark2001 640x480 | 8711 | 8986 | 3% |
Unreal Tournament 640x480 | 71.3 | 73.3 | 3% |
Quake3 640x480 | 224.4 | 246.3 | 10% |
Serious Sam 640x480 | 88 | 90.2 | 3% |
Comanche4 640x480 | 36.7 | 36.9 | 1% |
Wolfenstein 640x480 | 98.7 | 102 | 3% |
Первым будет тест CPUMark'99, который измеряет не просто скорость работы процессора, но общую производительность связки "процессор+память". Согласно ему, Pentium-4 с шиной 533 МГц оказывается всего на 1% быстрее процессора с той же частотой, но шиной 400 МГц.
Посмотрим, что покажут тесты подсистемы памяти. Я использовал Sandra 2002, Wstream, Cachemem, PCMark2002, Linpack. Первые два теста работают по алгоритму STREAM, причем Sandra может использовать и целочисленную, и плавающую арифметику. Cachemem и PCMark2002 просто измеряют пропускную способность памяти, а Linpack выполняет операции над матрицами с использованием операций с плавающей запятой. Результаты всех этих тестов (кроме Cachemem) показывают, что система с более скоростной процессорной шиной работает с памятью всего на 2.5-3.5% быстрее. Тест Cachemem сообщает, что скорость чтения возросла на 7%, а записи - только на 2.5%. Очевидно, что это связано с различным характером задержек при чтении и при записи.
Тест Cachemem умеет считать задержки при чтении больших блоков памяти. В частности, он позволяет отобразить количество тактов, которое затрачивает процессор на ожидание данных. Я привожу в таблице данные для чтения блоков, не помещающихся в кэш (то есть более 512 Кб) пакетами по 4 Кб. Мы видим, что задержки сократились ровно на 15% при частоте шины, возросшей на 33%.
Pentium 4-400 (22x100) |
Pentium 4-533 (16x138) |
Разница | |
1 Мб | 295 | 251 | -15% |
2 Мб | 297 | 253 | -15% |
4 Мб | 298 | 254 | -15% |
8 Мб | 299 | 254 | -15% |
16 Мб | 300 | 255 | -15% |
32 Мб | 300 | 255 | -15% |
Посмотрим, есть ли результат от увеличения частот шины процессора в реальных приложениях. Сначала возьмем бизнес-задачи (Word, Excel, PowerPoint, Frontpage, Outlook, Access и т.д.). Тест SYSmark2002 говорит о разнице в 2.6%, Winstone2001 - о 1.4%. То есть практически ничего.
Теперь - более сложные задачи, связанные с подготовкой материалов для веб-сайтов. SYSmark2002 - 1.7%, Winstone2001 - 1.2%. Разница опять незначительна.
Профессиональные графические пакеты, скорость которых измеряет тест SPECviewperf, работают практически одинаково на обеих системах - 1.4% в пользу Pentium-4 с шиной 533 МГц.
В играх Unreal Tournament, SeriousSam, Wolfenstein, Comanche 4 и в тесте 3DMark2001 в низком разрешении, когда видеокарта минимально влияет на производительность, разница тоже не превышает 3.3%. Отличился только Quake3 - целых 10%. Впрочем, эта игра всегда была очень чувствительной ко всем компонентам системы, в том числе и к процессору, поэтому она, скорее, исключение, чем правило. Если же использовать более высокие разрешения, разницы вообще не будет заметно.
Итак, вот, что мы имеем. Увеличение частоты процессорной шины с 400 до 533 МГц позволило на 15% сократить задержки при чтении и записи данных. Тем не менее, в большинстве бенчмарков (как в искусственных тестах, так и в реальных приложениях) это дает прирост порядка 2-3%. Наверняка при использовании более быстродействующей памяти разница будет немного больше, поскольку модернизация Pentium-4 была рассчитана на будущие системы.
Макс КУРМАЗ,
max@hw.by,
"Белорусский 'железный' сайт" (www.hw.by)
Материнская плата ASUS P4B533 и процессор Pentium-4 1.6 предоставлены фирмой "Конструктив"