“高クロック=高性能”神話からの脱却 ―― Woodcrest VS Dempsey ――

2006/6/23 - トピックメーカー/田中伸一

 デュアルコア インテル Xeon プロセッサー 5000 番台(以下、“Dempsey**”)が発表され、同 5100 番台(以下、“Woodcrest**”)の登場も間近に迫っている。‘電力効率’の観点から両者を見ると、Woodcrestに代表されるインテル Core マイクロアーキテクチャー系インテル Xeon プロセッサーは「実行リソースを拡大してポテンシャル (潜在能力) を高める一方、使わない部分の電力は徹底的にカットする」という考え方、片やDempsey のようなIntel NetBurst マイクロアーキテクチャー系は「負荷に応じてこまめにスピード調節し、稼働時間全体の消費電力を抑える」という考え方だ。今回は、既に公開されている主要ベンチマークの中から SPEC (Standard Performance Evaluation Corporation) の SPEC CPU2000 の結果をもとに、性能面に的を絞って見ていこう。

表1-SPEC CPU2000による各ベンチマーク結果
    SPECint_rate
2000
対 Dempsey SPECfp_rate
2000
対 Dempsey
Dempsey 1ウェイ
(2コア)
43.5   38.1  
2ウェイ
(4コア)
82.8 64.2
対 1ウェイ +90.3% +68.5%
Woodcrest 1ウェイ
(2コア)
61.7 +41.8% 46.9 +23.1%
2ウェイ
(4コア)
120.0 +44.9% 81.5 +26.9%
対 1ウェイ +94.5%   +73.8%  
※ システム Fujitsu Siemens Computers PRIMERGY RX200 S3

表2-1-プロセッサー、メモリー周りの構成
  コア・クロック システム・バス DIMM メモリー容量
Woodcrest 3.00GHz 1333MHz PC2-5300F 8GB
Dempsey 3.73GHz 1066MHz PC2-4200F 8GB

表2-2-ソフトウェア環境
  オペレーティング・システム コンパイラー
SPECint_rate2000 Microsoft Windows Server 2003
Enterprise Edition SP1 (32-bit)
Intel C++ Compiler 9.1
SPECfp_rate2000 64-bit SUSE Linux
Enterprise Server 9 SP3
Intel C++ and Fortran Compiler 9.0
for EM64T
SPEC / Second Quarter 2006 SPEC CPU2000 Results より作表
http://www.spec.org/cpu2000/results/res2006q2/ (英語)

 表1 と表2-1、表2-2 は、Fujitsu Siemens Computers の 1U ラック・マウント型サーバー「PRIMERGY RX200 S3」のベンチマーク結果と構成である。尚、表には無いが同社のサイトでチップセットは“インテル 5000P チップセット”となっている。

 まず、整数演算のスループットを測る SPECint_rate2000 を見ると、2 ウェイ (4 コア) 構成では Dempsey の 82.8 に対して、Woodcrest は 120 と約 45 % 上回っている。また、1 ウェイ (2 コア) から 2 ウェイにした場合の効果は、Dempsey が +90.3 %、Woodcrest が +94.5 % となる。一方、浮動小数点演算のスループットを測る SPECfp_rate2000 についても同様の比較をすると 2 ウェイ構成では Dempsey が 64.2、Woodcrest が 81.5 と、Woodcrest に約 27 % のアドバンテージがある。2 ウェイ化の効果は Dempsey で +68.5 %、Woodcrest で +73.8 % となる。

システム・バスと DIMM の違い

 OS、コンパイラーは同じ、コア・クロックでは Woodcrest の方が約 20 % 低いにも関わらず、このような結果になっているのはなぜだろうか。

 表2-1 からわかることはまず、システム・バス・クロックの違い。Dempsey の 1066 MHz に対して、Woodcrest の 1333 MHz は約 25 % 高い。次にメモリー。コア・クロックをいくら高速化してもメモリー周りが遅ければ、プロセッサーのポテンシャルを引き出すのが難しいことは、もはやコンピューターの常識といえる。しかしこれは、メモリー周りが高性能になれば、それだけプロセッサーの実力が発揮できるようになるとも言い換えられる。今日の主流である DDR2 SDRAM DIMM (Dual In-line Memory Module) は、PC2-4200 で最大 4.2 GB/s、PC2-5300 では同 5.3 GB/s のデータ転送を実現する。これにバッファを付加してメモリー・コントローラーとのインターフェイスをシリアル化したのが FB-DIMM (Fully Buffered DIMM) である。FB-DIMM は、PC2-5300F で最大 5.3 GB/s と、データ転送レートこそ、パラレル・インターフェイス型の従来 DIMM と変わらないが、チャネルあたりに接続可能な DIMM 数が多く、また安定したデータ転送が可能なため、高速・大容量のメモリーが必要な 64 ビット・サーバー環境などに向いている。実際、前世代のデュアルコア インテル Xeon プロセッサー (Paxville DP) に対応したインテル E7520 チップセットがサポートする物理メモリー容量が最大 16 GB (DDR2 メモリーの場合) だったのに対して、インテル 5000P チップセットでは最大 64 GBである。

 話をメモリー帯域幅に戻そう。再び表2-1 を見ると、Woodcrest の PC2-5300F、そして Dempsey の場合の PC2-4200F と、規格の異なる FB DIMM が使われている点は、やはり無視できない。インテル 5000P チップセットは、4 チャネルのメモリー・インターフェイスをサポートしているため、Woodcrest の場合のメモリー帯域幅は最大 21 GB/s、PC2-4200F を使った Dempsey の場合は同 17 GB/s となる。システム・バス・クロックと合わせて、こうしたメモリーの違いが性能の差になった可能性は高い。

 次回はマイクロアーキテクチャーの違いを見ていく。

記事アーカイブ

IT Manager's Desk の記事をテーマごとにまとめ読み。

  • IAストラテジー
    • IAとビジネスの新しい展望を解説します
  • IAサーバー
    • IAサーバーの最新動向をレポートします
  • ビジネスPC
    • ビジネスとITの現場を変える最新PCソリューションをお伝えします
  • 事例ウォッチ
    • IAを活用してビジネスを切り拓く、注目の導入事例をピックアップします


新着ビジネスPC