「クアッドコアでどう変わる Dempsey, Woodcrest, Clovertownの机上検証― その1. スペック ―」ではBensleyプラットフォームに対応した3シリーズ(5300番台、5100番台、5000番台)のXeonについて、スペックの面での違いを見てきた。今回はSPEC (Standard Performance Evaluation Corporation)の公式サイトで公開されているベンチマーク結果(英語)をもとに、Bensleyプラットフォームが性能面でどのように変わるかを検証していく。
サイト上に掲載されている機種の中で、計測されたプロセッサーのバリエーションが最も多いという理由から、Fujitsu Siemens Computers PRIMERGY RX300 S3(以下、RX300 S3)のデータを取り上げることにした。RX300 S3は、インテル 5000Pチップセット(Blackford)を搭載した2Uラックマウント型サーバーで、SPECint_rate_base2000(整数演算のスループット:英語)、SPECfp_rate_base2000(浮動小数点演算のスループット:英語)とも、5000番台3種類(5050 / 5060 / 5080)、5100番台6種類(5110 / 5120 / 5130 / 5140 / 5150 / 5160)、そして5300番台4種類(E5310 / E5320 / E5345 / X5355)の計13種類のXeonについて、1ウェイ、および2ウェイ時の計測値が掲載されている(2006年12月時点)。ベンチマーク時の主な構成は表1-1、1-2の通り。
| FSB | FB-DIMM | メモリー容量 | |
|---|---|---|---|
| Dempsey 5050 |
667 MHz | PC2-4200F | 8 GB |
| Dempsey 5060, 5070, 5080 |
1066 MHz | PC2-4200F | 8 GB |
| Woodcrest 5110, 5120 |
1066 MHz | PC2-4200F | 8 GB |
| Woodcrest 5130, 5140, 5150, 5160 |
1333 MHz | PC2-5300F | 8 GB |
| Clovertown E5310, E5320 |
1066 MHz | PC2-4200F | 8 GB |
| Clovertown E5345, X5355 |
1333 MHz | PC2-5300F | 8 GB |
| OS | Compiler | |
|---|---|---|
| SPECint_rate_base2000 | ||
| Dempsey | Microsoft Windows Server 2003 Enterprise Edition SP1 | Intel C++ Compiler 9.0 |
| Woodcrest Clovertown |
↑ | Intel C++ Compiler 9.1 |
| SPECfp_rate_base2000 | ||
| Dempsey Woodcrest |
64-bit SUSE Linux Enterprise Server 9 SP3 |
Intel C++ and Fortran Compiler 9.0 for EM64T |
| Clovertown | 64-bit SUSE Linux Enterprise Server 10 |
Intel C++ and Fortran Compiler 9.1 for EM64T |
まず、1プロセッサーから2プロセッサー構成にした時の性能向上率を見てみた。表2は、各シリーズの中で最もコア・クロックが高い3つ―― Dempsey 5080(3.73 GHz), Woodcrest 5160(3.00 GHz), Clovertown X5355(2.66 GHz)――をピックアップしたものである。概してSPECintでは約+90%、SPECfpでは約+70%の性能向上を示している。また絶対性能では、1P、2PいずれにおいてもClovertownが断トツの数値を示している。因みに(表では省略しているが)、Woodcrest 5120(1.86 GHz)は、Dempsey 5080の1/2のコア・クロックで動作するにも関わらず、SPECintの値がほぼ同じになっている(1P時 : 5120 = 41.0, 5080 = 42.5、2P時 : 5120 = 80.0, 5080 = 81.2)ことは興味深い。両者のTDPもクロックと同様の関係にある(5120 = 65W, 5080 = 130W)ことから、インテル Core マイクロアーキテクチャーの優れたエネルギー効率を、改めて証明する結果となっている。
| コア・クロック | 1P | 2P | 対1P | |
|---|---|---|---|---|
| Dempsey 5080 | 3.73 GHz | 42.5 | 81.2 | +91.1 % |
| Woodcrest 5160 | 3.00 GHz | 62.0 | 121.0 | +95.2 % |
| Clovertown X5355 | 2.66 GHz | 105.0 | 200.0 | +90.5 % |
| コア・クロック | 1P | 2P | 対1P | |
|---|---|---|---|---|
| Dempsey 5080 | 3.73 GHz | 38.0 | 64.2 | +68.9 % |
| Woodcrest 5160 | 3.00 GHz | 46.9 | 81.5 | +73.8 % |
| Clovertown X5355 | 2.66 GHz | 60.8 | 104.0 | +71.1 % |
次に、WoodcrestとClovertownの同一クロック対決 (表3)。ご覧の通り、2P構成同士ではClovertownの方がSPECintでは約+80~86%、SPECfpで約+33~35%、Woodcrestを上回る。また、同一クロックという条件は同じでWoodcrestは2P構成のまま、Clovertownを1P構成の場合と比べると、SPECintで約-3~5%、SPECfpでは約-20~22%となり、後者では多少分が悪くなるものの、SPECintにおいては2P構成のWoodcrestとそん色ないレベルである。
| コア・クロック | Woodcrest 2P | Clovertown 2P (対Woodcrest 2P) |
Clovertown 1P (対Woodcrest 2P) |
|---|---|---|---|
| 1.60 GHz | 71.2 | 132.0 (+85.4%) |
68.8 (-3.4%) |
| 1.86 GHz | 80.7 | 148.0 (+83.4%) |
77.5 (-4.0%) |
| 2.33 GHz | 99.4 | 184.0 (+85.1%) |
95.9 (-3.5%) |
| 2.66 GHz | 111.0 | 200.0 (+80.2%) |
105.0 (-5.4%) |
| コア・クロック | Woodcrest 2P | Clovertown 2P (対Woodcrest 2P) |
Clovertown 1P (対Woodcrest 2P) |
|---|---|---|---|
| 1.60 GHz | 55.7 | 75.4 (+35.4%) |
44.7 (-19.7%) |
| 1.86 GHz | 59.2 | 79.0 (+33.4%) |
46.9 (-20.8%) |
| 2.33 GHz | 73.6 | 99.2 (+34.8%) |
58.1 (-21.1%) |
| 2.66 GHz | 78.2 | 104.0 (+33.0%) |
60.8 (-22.3%) |
最後にClovertownとDempseyで最もクロックが高い場合と、逆に低い場合について比較してみた(表4)。2P構成で見ると、Clovertown X5355(2.66 GHz)は、Dempsey 5080(3.73 GHz)に対してSPECintで約+146%、SPECfpでは+62%に達する。一方、クロックが低い方に目を向けるとClovertown E5310(1.60 GHz)は、Dempsey 5050(3 GHz)に対してSPECintで約+118%、SPECfpで約+70%である。
| SPECint (対Dempsey 2P) |
SPECfp (対Dempsey 2P) |
||
|---|---|---|---|
| Dempsey 5080 |
1P | 42.5 | 38.0 | 2P | 81.2 | 64.2 |
| Clovertown X5355 |
1P | 105 (+29.3%) |
60.8 (-5.3%) |
| 2P | 200 (+146.3%) |
104 (+62.0%) |
|
| Dempsey 5050 |
1P | 32.9 | 27.0 |
| 2P | 60.5 | 44.4 | |
| Clovertown E5310 |
1P | 68.8 (+13.7%) |
44.7 (+0.7%) |
| 2P | 132 (+118.2%) |
75.4 (+69.8%) |
|
因みに、E5310と5050の計測は先の表1からもわかるとおり、同じPC2-4200FのFB-DIMM(Fully Buffered DIMM)を使い、同じOS上で行われたものである。つまり、基本的にプロセッサーを5050からE5310に変えるだけで2倍以上の性能向上が期待できるということになる。5050はエントリー・レベル・サーバーに多く使われているが、それらを導入したユーザーが、更なるパフォーマンスを必要としたとき、(メーカーのサポート次第ではあるが)他の構成はそのままに、プロセッサーをE5310やE5320に入れ替えるだけでも、得られる効果は少なくないだろう。
以上、クアッドコアでBensleyプラットフォームがどのように変わるかを2回に分けて見てきた。前回のスペック編では、クアッドコア化により、プラットフォーム・レベルで見た同時実行命令数やスレッド数が増えた一方、バス帯域幅が窮屈になったという印象を持った。しかし、実際のベンチマークを見ると、1プロセッサーから2プロセッサーで90%以上、同一クロックのWoodcrestと比較した場合80%以上の性能向上が期待できることがわかった*1)。
Intel NetBurst系デュアルコアのDempsey(5000番台)、マイクロアーキテクチャーを刷新したインテルCore系デュアルコアのWoodcrest(5100番台)、そして更なるマルチコア化の‘布石’となる同クアッドコアのClovertown(5300番台)という3つのシリーズをサポートするBensleyプラットフォームには、クアッドコアの性能を引き出すポテンシャルを備わっていることは確実である。
尚、SPECのサイトには今回取り上げたRX300 S3のほかにも、複数シリーズのXeonについてのベンチマーク結果が公開されている機種が色々とあった。それらの機種名と計測されたプロセッサーの種類、製品情報へのリンクを以下にまとめたので、興味のある方は参考にしていただきたい*2)。
【SPEC CPU2000】
・IBM System X3400 (5130, E5320)
・IBM System X3500 (5160, E5320)
・IBM System X3550 (5160, E5320)
・IBM System X3650 (5160, E5320)
・DELL Precision Workstation 690 (5060, 5080, 5110, 5130, 5140, 5150, 5160, E5320)
・DELL PowerEdge 1950 (5050, 5110, 5130, 5140, 5150, 5160, 5148, E5310, E5320)
・DELL PowerEdge 2950 (5050, 5110, 5130, 5140, 5150, 5160, 5148, E5310, E5320)
・Fujitsu Siemens Computers PRIMERGY RX300 S3 (5050, 5060, 5080, 5110, 5120, 5130, 5140, 5150, 5160, E5310, E5320)
・Fujitsu Siemens Computers PRIMERGY TX300 S3 (5110, 5120, 5130, 5140, 5150, 5160, E5310, E5320)
【SPEC JBB2005】
・DELL PowerEdge 2950 (5050, 5110, 5130, 5140, 5150, 5160, 5148, E5310, E5320)
・Fujitsu Siemens Computers PRIMERGY RX300 S3(5080, 5160, X5355)
・Fujitsu Siemens Computers PRIMERGY TX300 S3(5160, X5355)
・Fujitsu Siemens Computers PRIMERGY TX300 S3(5160, X5355)
【SPEC web2005】
・Fujitsu Siemens Computers PRIMERGY TX300 S3(5160, X5355)
日本アイ・ビー・エム IBM System x3250 2011/11/17 UP
東芝 MAGNIA3615R 2010/11/18 UP
日本アイ・ビー・エム IBM System x3200 2010/11/17 UP
日本ストラタステクノロジー ftServer 6310 2010/11/17 UP
日本ヒューレット・パッカード HP ProLiant ML110 G6 2010/11/15 UP
東芝 Satellite B550/B 2011/01/27 UP
東芝 dynabook R730/B 2011/01/27 UP
東芝 Satellite B650/B 2011/01/27 UP
デル Dell Vostro 3400 2010/04/02 UP
デル Dell Vostro 3500 2010/04/02 UP