クアッドコアでどう変わる? Dempsey, Woodcrest, Clovertownの「違い」机上検証―― その2.性能 ――

2007/1/10 - トピックメーカー/田中伸一

「クアッドコアでどう変わる Dempsey, Woodcrest, Clovertownの机上検証― その1. スペック ―」ではBensleyプラットフォームに対応した3シリーズ(5300番台、5100番台、5000番台)のXeonについて、スペックの面での違いを見てきた。今回はSPEC (Standard Performance Evaluation Corporation)の公式サイトで公開されているベンチマーク結果(英語)をもとに、Bensleyプラットフォームが性能面でどのように変わるかを検証していく。

サイト上に掲載されている機種の中で、計測されたプロセッサーのバリエーションが最も多いという理由から、Fujitsu Siemens Computers PRIMERGY RX300 S3(以下、RX300 S3)のデータを取り上げることにした。RX300 S3は、インテル 5000Pチップセット(Blackford)を搭載した2Uラックマウント型サーバーで、SPECint_rate_base2000(整数演算のスループット:英語)、SPECfp_rate_base2000(浮動小数点演算のスループット:英語)とも、5000番台3種類(5050 / 5060 / 5080)、5100番台6種類(5110 / 5120 / 5130 / 5140 / 5150 / 5160)、そして5300番台4種類(E5310 / E5320 / E5345 / X5355)の計13種類のXeonについて、1ウェイ、および2ウェイ時の計測値が掲載されている(2006年12月時点)。ベンチマーク時の主な構成は表1-1、1-2の通り。

表1-1. プロセッサー、メモリー周り

  FSB FB-DIMM メモリー容量
 
Dempsey
5050
667 MHz PC2-4200F 8 GB
Dempsey
5060, 5070, 5080
1066 MHz PC2-4200F 8 GB
 
Woodcrest
5110, 5120
1066 MHz PC2-4200F 8 GB
Woodcrest
5130, 5140, 5150, 5160
1333 MHz PC2-5300F 8 GB
 
Clovertown
E5310, E5320
1066 MHz PC2-4200F 8 GB
Clovertown
E5345, X5355
1333 MHz PC2-5300F 8 GB

表1-2. ソフトウェア環境

  OS Compiler
SPECint_rate_base2000
Dempsey Microsoft Windows Server 2003 Enterprise Edition SP1 Intel C++ Compiler 9.0
Woodcrest
Clovertown
Intel C++ Compiler 9.1
SPECfp_rate_base2000
Dempsey
Woodcrest
64-bit SUSE Linux
Enterprise Server 9 SP3
Intel C++ and Fortran
Compiler 9.0 for EM64T
Clovertown 64-bit SUSE Linux
Enterprise Server 10
Intel C++ and Fortran
Compiler 9.1 for EM64T

1P→2Pで約90%の性能向上

まず、1プロセッサーから2プロセッサー構成にした時の性能向上率を見てみた。表2は、各シリーズの中で最もコア・クロックが高い3つ―― Dempsey 5080(3.73 GHz), Woodcrest 5160(3.00 GHz), Clovertown X5355(2.66 GHz)――をピックアップしたものである。概してSPECintでは約+90%、SPECfpでは約+70%の性能向上を示している。また絶対性能では、1P、2PいずれにおいてもClovertownが断トツの数値を示している。因みに(表では省略しているが)、Woodcrest 5120(1.86 GHz)は、Dempsey 5080の1/2のコア・クロックで動作するにも関わらず、SPECintの値がほぼ同じになっている(1P時 : 5120 = 41.0, 5080 = 42.5、2P時 : 5120 = 80.0, 5080 = 81.2)ことは興味深い。両者のTDPもクロックと同様の関係にある(5120 = 65W, 5080 = 130W)ことから、インテル Core マイクロアーキテクチャーの優れたエネルギー効率を、改めて証明する結果となっている。

表2-1. 1P→2Pの性能向上率(SPECint_rate_base2000)

  コア・クロック 1P 2P 対1P
Dempsey 5080 3.73 GHz 42.5 81.2 +91.1 %
Woodcrest 5160 3.00 GHz 62.0 121.0 +95.2 %
Clovertown X5355 2.66 GHz 105.0 200.0 +90.5 %

表2-2. 1P→2Pの性能向上率(SPECfp_rate_base2000)

  コア・クロック 1P 2P 対1P
Dempsey 5080 3.73 GHz 38.0 64.2 +68.9 %
Woodcrest 5160 3.00 GHz 46.9 81.5 +73.8 %
Clovertown X5355 2.66 GHz 60.8 104.0 +71.1 %

同じコア・クロックのWoodcrestに対しては約80%のアドバンテージ

次に、WoodcrestとClovertownの同一クロック対決 (表3)。ご覧の通り、2P構成同士ではClovertownの方がSPECintでは約+80~86%、SPECfpで約+33~35%、Woodcrestを上回る。また、同一クロックという条件は同じでWoodcrestは2P構成のまま、Clovertownを1P構成の場合と比べると、SPECintで約-3~5%、SPECfpでは約-20~22%となり、後者では多少分が悪くなるものの、SPECintにおいては2P構成のWoodcrestとそん色ないレベルである。

表3-1. 同一クロック対決(SPECint_rate_base2000)

コア・クロック Woodcrest 2P Clovertown 2P
(対Woodcrest 2P)
Clovertown 1P
(対Woodcrest 2P)
1.60 GHz 71.2 132.0
(+85.4%)
68.8
(-3.4%)
1.86 GHz 80.7 148.0
(+83.4%)
77.5
(-4.0%)
2.33 GHz 99.4 184.0
(+85.1%)
95.9
(-3.5%)
2.66 GHz 111.0 200.0
(+80.2%)
105.0
(-5.4%)

表3-2. 同一クロック対決(SPECfp_rate_base2000)

コア・クロック Woodcrest 2P Clovertown 2P
(対Woodcrest 2P)
Clovertown 1P
(対Woodcrest 2P)
1.60 GHz 55.7 75.4
(+35.4%)
44.7
(-19.7%)
1.86 GHz 59.2 79.0
(+33.4%)
46.9
(-20.8%)
2.33 GHz 73.6 99.2
(+34.8%)
58.1
(-21.1%)
2.66 GHz 78.2 104.0
(+33.0%)
60.8
(-22.3%)

Dempseyとの最上位対決では+146%

最後にClovertownとDempseyで最もクロックが高い場合と、逆に低い場合について比較してみた(表4)。2P構成で見ると、Clovertown X5355(2.66 GHz)は、Dempsey 5080(3.73 GHz)に対してSPECintで約+146%、SPECfpでは+62%に達する。一方、クロックが低い方に目を向けるとClovertown E5310(1.60 GHz)は、Dempsey 5050(3 GHz)に対してSPECintで約+118%、SPECfpで約+70%である。

表4. 最上位/最下位グレード対決

    SPECint
(対Dempsey 2P)
SPECfp
(対Dempsey 2P)
Dempsey
5080
1P 42.5 38.0
2P 81.2 64.2
Clovertown
X5355
1P 105
(+29.3%)
60.8
(-5.3%)
2P 200
(+146.3%)
104
(+62.0%)
 
Dempsey
5050
1P 32.9 27.0
2P 60.5 44.4
Clovertown
E5310
1P 68.8
(+13.7%)
44.7
(+0.7%)
2P 132
(+118.2%)
75.4
(+69.8%)

因みに、E5310と5050の計測は先の表1からもわかるとおり、同じPC2-4200FのFB-DIMM(Fully Buffered DIMM)を使い、同じOS上で行われたものである。つまり、基本的にプロセッサーを5050からE5310に変えるだけで2倍以上の性能向上が期待できるということになる。5050はエントリー・レベル・サーバーに多く使われているが、それらを導入したユーザーが、更なるパフォーマンスを必要としたとき、(メーカーのサポート次第ではあるが)他の構成はそのままに、プロセッサーをE5310やE5320に入れ替えるだけでも、得られる効果は少なくないだろう。

*
今回の検証は、2006年12月時点のデータをもとに行っています。最新のベンチマーク結果はwww.spec.org(英語)をご確認ください。

まとめ

以上、クアッドコアでBensleyプラットフォームがどのように変わるかを2回に分けて見てきた。前回のスペック編では、クアッドコア化により、プラットフォーム・レベルで見た同時実行命令数やスレッド数が増えた一方、バス帯域幅が窮屈になったという印象を持った。しかし、実際のベンチマークを見ると、1プロセッサーから2プロセッサーで90%以上、同一クロックのWoodcrestと比較した場合80%以上の性能向上が期待できることがわかった*1)

Intel NetBurst系デュアルコアのDempsey(5000番台)、マイクロアーキテクチャーを刷新したインテルCore系デュアルコアのWoodcrest(5100番台)、そして更なるマルチコア化の‘布石’となる同クアッドコアのClovertown(5300番台)という3つのシリーズをサポートするBensleyプラットフォームには、クアッドコアの性能を引き出すポテンシャルを備わっていることは確実である。

*1)
いずれも整数演算のスループットを示すSPECint_rate_base2000において。

SPECのサイトで公開されているClovertown搭載マシン

尚、SPECのサイトには今回取り上げたRX300 S3のほかにも、複数シリーズのXeonについてのベンチマーク結果が公開されている機種が色々とあった。それらの機種名と計測されたプロセッサーの種類、製品情報へのリンクを以下にまとめたので、興味のある方は参考にしていただきたい*2)

*2)
ベンチマークとカタログに記載されたプロセッサーのバリエーションが異なる場合があるので注意。

【SPEC CPU2000】
IBM System X3400 (5130, E5320)
IBM System X3500 (5160, E5320)
IBM System X3550 (5160, E5320)
IBM System X3650 (5160, E5320)
DELL Precision Workstation 690 (5060, 5080, 5110, 5130, 5140, 5150, 5160, E5320)
DELL PowerEdge 1950 (5050, 5110, 5130, 5140, 5150, 5160, 5148, E5310, E5320)
DELL PowerEdge 2950 (5050, 5110, 5130, 5140, 5150, 5160, 5148, E5310, E5320)
Fujitsu Siemens Computers PRIMERGY RX300 S3 (5050, 5060, 5080, 5110, 5120, 5130, 5140, 5150, 5160, E5310, E5320)
Fujitsu Siemens Computers PRIMERGY TX300 S3 (5110, 5120, 5130, 5140, 5150, 5160, E5310, E5320)

【SPEC JBB2005】
DELL PowerEdge 2950 (5050, 5110, 5130, 5140, 5150, 5160, 5148, E5310, E5320)
Fujitsu Siemens Computers PRIMERGY RX300 S3(5080, 5160, X5355)
Fujitsu Siemens Computers PRIMERGY TX300 S3(5160, X5355)
Fujitsu Siemens Computers PRIMERGY TX300 S3(5160, X5355)

【SPEC web2005】
Fujitsu Siemens Computers PRIMERGY TX300 S3(5160, X5355)

記事アーカイブ

IT Manager's Desk の記事をテーマごとにまとめ読み。

  • IAストラテジー
    • IAとビジネスの新しい展望を解説します
  • IAサーバー
    • IAサーバーの最新動向をレポートします
  • ビジネスPC
    • ビジネスとITの現場を変える最新PCソリューションをお伝えします
  • 事例ウォッチ
    • IAを活用してビジネスを切り拓く、注目の導入事例をピックアップします


新着ビジネスPC