デュアルコア インテル Xeon プロセッサー 5000 番台(以下、“Dempsey**”)が発表され、同 5100 番台(以下、“Woodcrest**”)の登場も間近に迫っている。‘電力効率’の観点から両者を見ると、Woodcrestに代表されるインテル Core マイクロアーキテクチャー系インテル Xeon プロセッサーは「実行リソースを拡大してポテンシャル (潜在能力) を高める一方、使わない部分の電力は徹底的にカットする」という考え方、片やDempsey のようなIntel NetBurst マイクロアーキテクチャー系は「負荷に応じてこまめにスピード調節し、稼働時間全体の消費電力を抑える」という考え方だ。今回は、既に公開されている主要ベンチマークの中から SPEC (Standard Performance Evaluation Corporation) の SPEC CPU2000 の結果をもとに、性能面に的を絞って見ていこう。
| SPECint_rate 2000 |
対 Dempsey | SPECfp_rate 2000 |
対 Dempsey | ||
|---|---|---|---|---|---|
| Dempsey | 1ウェイ (2コア) |
43.5 | 38.1 | ||
| 2ウェイ (4コア) |
82.8 | 64.2 | |||
| 対 1ウェイ | +90.3% | +68.5% | |||
| Woodcrest | 1ウェイ (2コア) |
61.7 | +41.8% | 46.9 | +23.1% |
| 2ウェイ (4コア) |
120.0 | +44.9% | 81.5 | +26.9% | |
| 対 1ウェイ | +94.5% | +73.8% |
| コア・クロック | システム・バス | DIMM | メモリー容量 | |
|---|---|---|---|---|
| Woodcrest | 3.00GHz | 1333MHz | PC2-5300F | 8GB |
| Dempsey | 3.73GHz | 1066MHz | PC2-4200F | 8GB |
| オペレーティング・システム | コンパイラー | |
|---|---|---|
| SPECint_rate2000 | Microsoft Windows Server 2003 Enterprise Edition SP1 (32-bit) |
Intel C++ Compiler 9.1 |
| SPECfp_rate2000 | 64-bit SUSE Linux Enterprise Server 9 SP3 |
Intel C++ and Fortran Compiler 9.0 for EM64T |
表1 と表2-1、表2-2 は、Fujitsu Siemens Computers の 1U ラック・マウント型サーバー「PRIMERGY RX200 S3」のベンチマーク結果と構成である。尚、表には無いが同社のサイトでチップセットは“インテル 5000P チップセット”となっている。
まず、整数演算のスループットを測る SPECint_rate2000 を見ると、2 ウェイ (4 コア) 構成では Dempsey の 82.8 に対して、Woodcrest は 120 と約 45 % 上回っている。また、1 ウェイ (2 コア) から 2 ウェイにした場合の効果は、Dempsey が +90.3 %、Woodcrest が +94.5 % となる。一方、浮動小数点演算のスループットを測る SPECfp_rate2000 についても同様の比較をすると 2 ウェイ構成では Dempsey が 64.2、Woodcrest が 81.5 と、Woodcrest に約 27 % のアドバンテージがある。2 ウェイ化の効果は Dempsey で +68.5 %、Woodcrest で +73.8 % となる。
OS、コンパイラーは同じ、コア・クロックでは Woodcrest の方が約 20 % 低いにも関わらず、このような結果になっているのはなぜだろうか。
表2-1 からわかることはまず、システム・バス・クロックの違い。Dempsey の 1066 MHz に対して、Woodcrest の 1333 MHz は約 25 % 高い。次にメモリー。コア・クロックをいくら高速化してもメモリー周りが遅ければ、プロセッサーのポテンシャルを引き出すのが難しいことは、もはやコンピューターの常識といえる。しかしこれは、メモリー周りが高性能になれば、それだけプロセッサーの実力が発揮できるようになるとも言い換えられる。今日の主流である DDR2 SDRAM DIMM (Dual In-line Memory Module) は、PC2-4200 で最大 4.2 GB/s、PC2-5300 では同 5.3 GB/s のデータ転送を実現する。これにバッファを付加してメモリー・コントローラーとのインターフェイスをシリアル化したのが FB-DIMM (Fully Buffered DIMM) である。FB-DIMM は、PC2-5300F で最大 5.3 GB/s と、データ転送レートこそ、パラレル・インターフェイス型の従来 DIMM と変わらないが、チャネルあたりに接続可能な DIMM 数が多く、また安定したデータ転送が可能なため、高速・大容量のメモリーが必要な 64 ビット・サーバー環境などに向いている。実際、前世代のデュアルコア インテル Xeon プロセッサー (Paxville DP) に対応したインテル E7520 チップセットがサポートする物理メモリー容量が最大 16 GB (DDR2 メモリーの場合) だったのに対して、インテル 5000P チップセットでは最大 64 GBである。
話をメモリー帯域幅に戻そう。再び表2-1 を見ると、Woodcrest の PC2-5300F、そして Dempsey の場合の PC2-4200F と、規格の異なる FB DIMM が使われている点は、やはり無視できない。インテル 5000P チップセットは、4 チャネルのメモリー・インターフェイスをサポートしているため、Woodcrest の場合のメモリー帯域幅は最大 21 GB/s、PC2-4200F を使った Dempsey の場合は同 17 GB/s となる。システム・バス・クロックと合わせて、こうしたメモリーの違いが性能の差になった可能性は高い。
次回はマイクロアーキテクチャーの違いを見ていく。
日本アイ・ビー・エム IBM System x3250 2011/11/17 UP
東芝 MAGNIA3615R 2010/11/18 UP
日本アイ・ビー・エム IBM System x3200 2010/11/17 UP
日本ストラタステクノロジー ftServer 6310 2010/11/17 UP
日本ヒューレット・パッカード HP ProLiant ML110 G6 2010/11/15 UP
東芝 Satellite B550/B 2011/01/27 UP
東芝 dynabook R730/B 2011/01/27 UP
東芝 Satellite B650/B 2011/01/27 UP
デル Dell Vostro 3400 2010/04/02 UP
デル Dell Vostro 3500 2010/04/02 UP