Конфигурация
AMD Opteron
Компания AMD предоставила нам для тестирования 4-х процессорный сервер в следующей конфигурации: 4хOpteron-846 2.0 GHz, 7 Гбайт оперативной памяти, кэш 1024 Кбайт. На сервер была установлена операционная система Linux SuSE SLES-8 (AMD64) VERSION 8.1, ядро kernel-2.4.19-SMP x86_64, компиляторы gcc 3.2.2 и PathScale Compiler Suite(TM): Version 1.1, а также mpich-1.2.5. Для тестирования был установлен пакет ATLAS 3.6.0 и HPL 1.0a.
Intel Xeon
Для тестирования процессоров Intel Xeon были взяты два узла нашего кластера Leo в следующей конфигурации: 2xXeon 2.6 ГГц, 2 Гбайт оперативной памяти, кэш 512 Кбайт. На кластере установлена операционная система Linux RedHat 7.3, ядро kernel-2.4.25, компиляторы gcc 2.96 и Intel compiler 8.0, а также ScaMPI. Для тестирования был установлен пакет ATLAS 3.6.0 и HPL 1.0a. Для общения узлов использовалась сеть SCI.
Результаты
AMD Opteron
На одном процессоре при использовании 2 Гбайт памяти (матрица 15000x15000) получена производительность 3.38 Gflop/s (84.5% пиковой производительности), а при использовании всей доступной памяти (матрица 29000x29000) - производительность 3.44 Gflop/s (86% пиковой производительности).
На двух процессорах при использовании 2 Гбайт памяти (матрица 15000x15000) получена производительность 6.37 Gflop/s (80% пиковой производительности), а при использовании всей доступной памяти (матрица 29000x29000) - производительность 6.52 Gflop/s (82% пиковой производительности).
На четырех процессорах при использовании 2 Гбайт памяти (матрица 15000x15000) получена производительность 12.01 Gflop/s (75% пиковой производительности), а при использовании всей доступной памяти (матрица 29000x29000) - производительность 12.6 Gflop/s (79% пиковой производительности).
Intel Xeon
На одном процессоре при использовании 2 Гбайт памяти (матрица 15000x15000) получена производительность 3.73 Gflop/s (72% пиковой производительности).
На двух процессорах при использовании 2 Гбайт памяти (матрица 15000x15000) получена производительность 6.67 Gflop/s (64% пиковой производительности).
На четырех процессорах при использовании 2 Гбайт памяти (матрица 15000x15000) получена производительность 11.49 Gflop/s (55% пиковой производительности), а при использовании всей доступной памяти (матрица 21000x21000) - производительность 12.55 Gflop/s (60.3% пиковой производительности).
Лаборатория Параллельных информационных технологий НИВЦ М
|