パソコンパーツの歴史
デスクトップパソコン向けCPUの歴史6
〜高まるFSBと64ビット〜
(2005年8月5日公開)

ついに2GHzの大台へ
 
 2GHzの大台へと言ってもPentium4やAthlon XPの事ではない(これらはすでに2GHzに達している)。x86CPUとしては3番目に2GHzの大台に到達したのはCeleronだ。2002年9月18日、Celeronの2GHz版が発表されたのだ。同時に予定通りCeleronはWillametteからNorthwoodへと変更された。しかし、このCeleronはPentium4がNorthwoodへ移行した際に行われた「L2キャッシュ倍増」は行われなかったのだ。つまり128KB据え置きである。Pentium4のL2キャッシュが512KBへ移行してしばらく経つため、Celeronはその半分・256KBでも良いと思うかもしれないが、インテルは128KB固定の方針を選んだ模様だ。ということは性能はクロックが上がった分だけ向上し、コアの変更による向上は全くと言っていいほど無い。
 性能面ではL2キャッシュの少なさが足を引っ張り、同クロックのPentium4と比べて大きく劣るのはこれまでと同じだ。劣ると言っても、L2キャッシュの影響を受けやすい処理ではPentium4(Northwood)の1.5GHz程度、影響の少ない処理では1.9GHzを超える性能を示した。インターネットやワープロソフトを使うには十分な性能だ。いや、これほどの性能があれば、それほどこだわらないのであれば、ビデオ編集や3Dゲームも十分にできるはずだ。
 市場を見ると、Duronが1.3GHzで依然止まっているためにDuronの代わりにCeleronが採用されることが徐々に多くなってきている。また、この新CeleronはNorthwoodコアに移行したということは、製造プロセスが0.18μmから0.13μmへ細分化された。ダイサイズは小さくなり、その結果製造コストが安くなった。AMDがAthlon XPの低クロック版の価格を下げ、Celeronに対抗してきた場合も戦いやすくなった。また、良い面はインテルだけでなく、パソコンメーカーや個人自作ユーザーにもある。Northwoodコアに移行し動作電圧が大幅に下がったため、発熱も小さくなり、より設計の自由度が増した。個人の使用でも発熱に気を配らずにすむのである。
 こうしてCeleronはまた一歩進歩したのだ。

Intel Celeron(Northwood-128K)
動作クロック : 2.0GHz〜2.8GHz
FSB : 400MHz
L1キャッシュ : 8KB/L2キャッシュ : 128KB
拡張命令 : MMX、SSE2
製造プロセス : 0.13μm
対応Socket/Slot : Socket478

新しいチップセット
 
 インテルはさらにチップセットも進化させる。i845E/845G/845GLの後継製品としてそれぞれi845PE/845GE/845GVを発表したのだ。これまでの製品同様、i845PEは外部グラフィック専用、i845GEは内蔵・外部両グラフィック対応、i845GVは内蔵グラフィックスのみとなる。i845PEとi845GEではこれまでのPC1600 DDRSDRAM(転送速度2.1GB/s)とPC2100 DDRSDRAM(同2.4GB/s)に加えて、新たにPC2700 DDRSDRAM(同2.7GB/s)のメモリに対応した。これによりFSB533MHzのPentium4の帯域である4.2GB/sに多少近づき、性能の向上が見られる。また、i845GEのグラフィックスコアは動作クロックが200MHzから266MHzに引き上げられ、若干ながらグラフィック性能の向上が見られる。最下位のi845GVのグラフィックスコアは200MHzのままだが、FSB533MHzに新たに対応した。
 こうしてPentium4/Celeronの環境はまた一歩良くなったといえる。

Athlon XPのFSB333MHz化
 
 インテルがPenium4の2.8GHzを発表し、インテルが圧倒的勝利を収めつつあるあるように思われた10月1日、AMDからFSBを333MHzに引き上げたAthlon XPの2800+/2700+を発表した。
 実はこれまでAMDのロードマップは、Athlon XPはFSBは266MHzのままで333MHzにする事はないとしていた。333MHz化はチップセットメーカー各社が(チップセットを333MHzに対応させてまで)打診したにもかかわらず、AMD返事はNOだったのである。ところがそれからずいぶん経ち、FSB333MHz化をあきらめかかけていた時に、AMDからFSB333MHz化の発表があったのである。つい最近のことである。AMDが急にFSB333MHz化を行う事にしたのは次世代Athlon(開発コード名ClawHammer)の遅れによることが大きいと見られている。AMDは9月にClewHammerのリリースが2002年の第4四半期から2003年の第1四半期に延期され、搭載パソコンの登場は2003年第2四半期になるだろうと発表した。また、L2キャッシュを512KBに増やしたAthlon XP(開発コード名Barton)も2003年第1四半期に延期された。期待のClewHammerを第4四半期に投入できない以上、現行のAthlon XPで第4四半期を戦わなければならない。そのためにFSB333MHz化に踏み切ったようである。
 FSB333MHz化には大きなメリットがある。Athlon XP用のチップセットでは早くからPC2700 DDR SDRAMに対応しており、メモリ帯域幅は2.7GB/sとなっていた。一方、これまでのAthlon XPはFSB266MHzであり、FSB帯域は2.1GB/sであった。せっかくの高速なメモリを使っても、FSBがこれより遅いために十分な性能が発揮できていなかったのだ。今回FSBが333MHzとなったことで、FSB帯域幅は2.7GB/sとPC2700 DDR SDRAMと一致した。これによりメモリに余分な待ちが発生せず、最適なパフォーマンスが発揮できるようになった訳だ。
 この2800+/2700+から、コアに小さな改良が加えられ、これまでの「Thoroughbred A0リビジョン」から「B0リビジョン」になってる。この変更によりトランジスタ数が若干増加(3720万個から3760万個)し、ダイサイズも80mm2から84mm2になったが、リビジョンがA0では2GHzが限界だったクロックももう少し上げられるようになった。
モデルナンバー動作クロックFSB
1500+1333MHz266MHz
1600+1400MHz266MHz
1700+1467MHz266MHz
1800+1533MHz266MHz
1900+1600MHz266MHz
2000+1667MHz266MHz
2100+1733MHz266MHz
2200+1800MHz266MHz
2400+2000MHz266MHz
2600+2133MHz266MHz
2700+2167MHz333MHz
2800+2250MHz333MHz
 右の図はAthlon XPのモデルナンバーと実クロックの表である。今回発表された2700+は、2600+と比べて34MHzしか上昇していない事が分かるだろう。これまでの向上よりも低いのだ。これはFSB333MHz化によるパフォーマンス向上があると考えてのことだろう。つまり実クロック34MHz分の向上とFSB333MHz化を足して100+分になるとした訳だ。また2700+から2800+は83MHz向上している。これは今回よりFSBが333MHz(166MHzのDDR)となり、倍率を0.5倍ずつ上げると83MHz上がるからだ。その事からこれからはモデルナンバー100+=83MHzということになるだろう。これまでの100+=66MHzではモデルナンバーの上昇の割に性能上昇が少ないと言われていたが、83MHzになったことで解消(もしくは緩和)されるだろう。
 肝心の性能はどうだろう。まず2700+だが、2600+→2700+では実クロックが34MHzしか上がらなかったにもかかわらず、2400+→2600+の時よりも性能向上が大きいのは特筆すべきだ。このことからもFSB333MHz化の影響は少なくない事が分かるだろう。また2700+→2800+もクロックあたりの性能が若干向上したことと、実クロックで83MHz上がったことにより、2400+→2600+の時よりも向上している。今回の2700+/2800+はこれまでのAthlon XPの新製品の中でも特に魅力的になったに違いない。
 一方で2800+はライバルのPentium4-2.8GHzには届かないという残念な結果となった。一部のベンチマークテストではPentium4-2.8GHzを超える場合もあるものの、大半のテストでは及ばない。クロックで550MHzもの開きがあること、L2キャッシュが半分しかないことから仕方がないのかもしれない。結局今回のFSB333MHzAthlon XPである2800+/2700+は従来のAthlon XPユーザーには非常に魅力的な製品であるものの、最速の座は奪えないと言う結果の終わった。今後のL2キャッシュ512KB化とさらなる高クロック化に期待したいというところだ。
 ちなみにこの2800+/2700+は2つの問題を抱えている。まず、チップセットの環境が整っていない事だ。各チップセットメーカーはFSB333MHz化を行っていたものの、AMDの急な変更のためにこの時点で市場に出回っている物はFSB266MHzまでとなる。これからFSB333MHzの動作検証と細かな修正を加えて、マザーボードが市場に出回るまでには時間がかかる。FSB333MHzに正式に対応しているnVIDIAのnForce2は出荷が遅れてるために期待できない。またCPU自体の方も10月1日に行ったのは製品発表のみで、実際の搭載パソコンの登場は11月中、しかも限られたメーカーからの限られた機種のみとなる予定だ。10月中旬に入っても2400+すら手に入りにくいほど少量しか流通しておらず、2800+/2700+の単品を店頭で購入できるのはもっと先となりそうだ。
 こうして問題を残しているものの、将来への希望ができたAthlon XP。今後もさらなる高クロック製品を発表しつつ、いかに速く市場に投入できるかが鍵となりそうだ。

AMD Athlon XP(Thoroughbred/FSB 333MHz)
動作クロック : 2700+(2.167GHz)〜2800+(2.25GHz)
FSB : 333MHz
L1/L2キャッシュ : 128KB/256KB
拡張命令 : MMX、3DNow! Professional
製造プロセス : 0.13μm
対応Socket/Slot : SocketA

Hyper-Threading
 
 11月14日、Pentium4はついに3GHzを突破した。3.06GHzというかつて無いクロックの製品が発表されたのだ。しかも、この3.06GHz版は、単なる高クロック版ではない。Hyper-Threading機能が搭載された初の製品だ。搭載されたからといって、Pentium4という名称に変更はない。ただし、従来のPentium4マークにはHyper-Threadingの頭文字を取ったHTの文字が追加されている。
 このHyper-Threading機能とはどういったものだろう。その前に、CPUの処理に関して説明しなければならない。CPUは通常、いくつもの命令を同時にできるように複数の演算ユニットを持っている。そのため1クロックで複数の命令を処理できる。しかし、演算ユニットにはそれぞれ役割があり、処理できる命令の種類が決まっている。どんな命令でも同時に処理できるわけではない。そこで、スケジューラと呼ばれる部分でできる限り同時に実行できるように命令の並び替えを行っている。しかし、それでも4つあれば4つ同時に処理するのは難しい。つまり実行ユニットの一部は動作していないことが多いのだ。これまでに類を見ないほど効率のいいスケジュールを立てるとされているPentium4ですら、平均すれば演算ユニットの使用率は50%に満たないだろう。その余っている演算ユニットを、もう一つのCPUとして使ってやろうというのがHyper-Threadingの考え方だ。
 性能的にはどうかというと、CPUを本当に2つ搭載するDualCPUでも、メモリやPCIバスなどCPU以外の部分が2つにならないため、性能は1.5倍程度になる。さらに今回のHyper-Threadingではあくまで1つのCPUであるため、性能向上は良くて30%程度だと言われている。
 また、問題もいくつかある。Hyper-ThreadingはDualCPUと同じく、OSやアプリケーションが対応していないと意味がない。例えば、Windows95/98/MeではDualCPUに対応していないためCPUは一つしか認識されないのだ。また、DualCPUに対応していないソフトでは、2つのCPUにデーターを渡すことができず、1つで処理をさせる事しかできない。しかしOSに関しては解決されつつある。これまではDual CPUに対応していると言えばWindowsNTであり、敷居が高かった。しかし、最近になってWindows2000、そしてWindowsXPが登場し、DualCPUの環境も整った。またアプリケーションに関しても、一部の動画系ソフトなどがすでにDual CPUに対応している。さらにソフト単体では対応していなくても、複数のソフトを同時に起動し動作させるとDual CPUやHyper-Theradingの恩恵は得られる。ソフトを同時に動作させることなど無いという人もいるだろう。しかし、Windowsを起動した直後から、ユーザーが意図しなくてもさまざまなタスクが起動しているのだ。そのためある程度の恩恵は得られるはずである。
 このHyper-Threadingは実はサーバー向けの製品には既に採用されている。もっと言えば、これまでのPentium4であるNorthwoodやWillametteにもHyper-Threadingの機能自体は搭載されていたのだ。しかし、出荷の時点でその機能を「オフ」にしていたのである。そしてWindowsXPも市場に浸透し、DualCPUが現実味を帯びてきた今回、ついに「オン」になったのである。ちなみにWindowsXP ProfessionalはDualCPUに対応しているがHomeEditionはDual CPUに対応していない。ただしWindowsXPで対応していないのはあくまで「物理的に2つあるCPU」についてであり、Hyper-Threadingの場合は物理的CPU数は1つなので使う事ができる。
   では実際のベンチマークテストの結果からHyper-Threadingの効果を見てみよう。まずDualCPUに対応していないアプリケーションではほとんど効果が得られなかった。Windowsのバックグラウンドで動作しているソフトの処理があるため若干でも効果が得られると思われたが、そうではなかったようだ。逆に、まれなケースだが性能が落ちることがある。これは、Hyper-Threading用の余計な処理が必要なのにもかかわらず、Hyper-Threadingとして処理できないためだと思われる。
 しかしこういったDualCPUに対応していないソフトでも、複数を同時に動かすことで10%程度の性能向上が見られる。つまり、動画や音楽のストリーム再生をしながらインターネットを見たり、動画や音楽のエンコードをバックグラウンドでさせながら、メールや文章を打つといった状況である。このような場合はHyper-Theadingによる恩恵を受けることができる事が確認された。
 一方、DualCPUに対応したアプリケーションでは十分な効果が得られる。Hyper-Threadingをオンにした場合とオフにした場合でさまざまなベンチマークテストを実行してみる。すると、効果の薄い物では5%程の性能向上だが、だいたいは10〜20%、場合によっては30%以上の向上が見られる。画像、映像系ソフトをはDualCPUに対応している事が比較的多く、こういうソフトを使うユーザーにとってはHyper-Threadingの効果は絶大だ。
 もちろん問題が無い訳ではない。まずHyper-Threadingに対応しているチップセットがCPU発売時点では、インテル製のしかもi850E/i845E/G/PE/GE/GVに限られていること。さらに消費電力が81.8Wとついに80Wを超え、これまでにない次元に入ったことだ。これまでの2.66GHzで66.1W、2.8GHzでさえ68.4Wであるから、いきなり70W台を飛び越えた訳だ。これはHyper-ThreadingによりCPUの利用効率が上がったことが問題だが、これによりCPUクーラーに放熱効果の高い物が求められるようになる。さらに言えば、本体ケースの内部にも熱がこもらないように工夫する必要が出てくるだろう。熱という点ではこれまでより使いにくいCPUとなってしまった。
 このように、高消費電力(高発熱)という問題を持ち、Hyper-Thereadingはすべての状態で効果が得られる訳ではないが、場合によってはHyper-Threadingがオンになっただけで20%以上の性能向上が得られるのである。新しいCPUに移行した訳ではないのにこうまで性能向上があるのはすごいことだ。これにより、今回のPentium4-3.06GHzは比較的高クロックのPentium4を使っているユーザーにも十分に魅力的な製品になっただろう。また、Athlon XPに対しても、かなりのアドバンテージを持つことに繋がったはずだ。

Intel Pentium4(Northwood・HT対応・FSB533MHz)

動作クロック : 3.06GHz
FSB : 533MHz
L1/L2キャッシュ : 8KB/512KB
拡張命令 : MMX、SSE2/HTテクノロジ対応
製造プロセス : 0.13μm
対応Socket/Slot : Socket478


新たな低価格CPU
 
 インテルのCeleronは順調に性能を伸ばしていった。2002年11月21日(日本)に2.2/2.1GHzを、2003年に入って4月1日(日本)には2.4GHz/2.3GHz版が発表された。仕様に変更はないが、少しずつ高クロック化されてきている。
 そんな中、新たな低価格CPUが発表された。それがVIAのC3だ。名前こそ従来(Elzaコア)と同じだが、開発コード名「Nehemiah」の新コアへ移行し、大きな進化を果たしている。
 性能向上に大きな影響のある改良点として、浮動小数点演算性能を行うFPUユニットがCPUクロックと同じクロックに動作するようになった点が挙げられる。従来はコアクロックの2分の1で動作していたため、1GHzのプロセッサでもFPUは500MHzだったが、それが今回等速で動くようになったのだ。
 また、一次キャッシュは128KB、二次キャッシュは64KBと従来と変わらないが、二次キャッシュはより効率的に読み書きが出来るように改良された。パイプラインはElzaコアの12段から16段になり、より高いクロックを達成できるようになっている。また従来の3DNow!に代わってSSEに対応している。AMDすらSSEに対応してきており、ビデオ編集ソフトなども3DNow!よりもSSEへの対応が進んでいる現在、意味を持つ変更だと言えるだろう。
 製造プロセスは0.13μmで、従来と同じSocket370対応であるためFSBは133MHzとなる
 性能と直接関係のない点として、「PadLock Data Encryption」と呼ばれる暗号化エンジンをCPUコアに統合した点も注目すべき点だ。これはCPU内部にハードウェア乱数発生装置を搭載することによって、ハードウエア環境のみで乱数を発生させることが出来るというものだ。これまでのソフトとハードの両方を使った暗号化システムと比べるとより安全性が高く、現在では様々な場面で強固なセキュリティが求められているため、今後必要となるであろう機能である。インテルも今後ハードウェアセキュリティシステムを導入するとしているため、VIAではインテルに先んじて搭載したわけだ。
 NehemiahコアのC3は2003年1月22日に発表された。動作クロックは1GHzで、Celeronが2.2GHzになっている中で、見劣りすると言わざるを得ないが、消費電力は11.25WとこれまでのC3プロセッサと同様非常に低い。最近では60Wや70Wは当たり前になりつつある中で、この消費電力の低さは非常に扱いやすいCPUだといえる。
 では、実際にどの程度の性能を持つのだろう。一部のベンチマークテストではCeleronの1GHzにせまる性能も発揮した。しかし、大半のベンチマークテストでは5〜7割程度の性能となった。それでもElzaコアのC3と比べると大きく向上しており、30〜80%も高い性能を示した。特にFPUユニットが従来の倍速になったため浮動小数点演算系のテストでは2倍の性能を示すものもあった。
 確かに性能面では、Celeronと比べると劣ると言わざるを得ない。しかしこのC3の低発熱という特徴を利用して、低回転のCPUファンやケースファンで静音パソコンを作ると言うことも可能なのである。もっともElzaコアのC3の時代から静音パソコン用にある程度用いられてきたが、ElzaコアのC3ではDVDの再生すらコマ落ちを起こすこともあり、実用性は低かった。いくら低発熱・低消費電力でもここまで性能が低いというのは少し問題であったのだ。しかし新しいC3は大きく性能向上し、これまで特に不得意とされていたマルチメディア系の処理性能が格段に向上した。そのためインターネットやDVD再生程度なら不満のない、そしてインテルやAMDのCPUを採用していては決して得られない静音性を得たパソコンを作ることが出来るのである。こういったパソコン向けのCPUとしてはC3は最適といえるのだ。そのため、一部の静音性を重視する自作パソコンなどには使われていった。
 また、その少し前からVIAが「Eden」と呼んでいる規格の、CPUオンボードタイプのコンパクトマザーボードも販売している。EPIAというシリーズで、C3ベースのCPUであるESPプロセッサがオンボードで搭載され、17×17mmに全ての機能が凝縮されている。これまではElzaコアの物だったが、NehemiahコアがC3発表されると、そちらの製品も発表された。EPIAはコンパクトなだけでなく、C3の特徴を持っているため非常に低発熱・低消費電力だ。よってコンパクトなパソコンや、ファンのない静音パソコンなどに少しずつだが採用されていった。

VIA C3(Nehemiah)

動作クロック : 1.0A GHz〜1.5A GHz
FSB : 133MHz
L1/L2キャッシュ : 128KB/64KB
拡張命令 : MMX、SSE
製造プロセス : 0.13μm
対応Socket/Slot : Socket370

Bartonコアへ移行したAthlon XP
 
 2003年2月10日、AMDは3000+/2800+のAthlon XPを発表した。モデルナンバー上はPentium4の3.06GHzにほぼ追いついた格好だ。
コアFSBモデルナンバー動作クロック
Barton
(二次キャッシュ512MB)
333MHz3000+2.17GHz
2800+2.08GHz
Thoroughbred
(二次キャッシュ256MB)
2800+2.25GHz
2700+2.17GHz
2600+2.08GHz
266MHz2600+2.17GHz
2400+2GHz
2200+1.8GHz
 このAthlon XPは、開発コード名Bartonと呼ばれるもので、L2キャッシュが512KBと倍増されている。FSBは333MHzで0.13μmプロセスで製造されるのは従来通りだ。L2キャッシュの増加された事によりクロックあたりの性能が向上した。そのためThoroughbredコアでは2800+が2.25GHzだったが、Bartonコアでは3000+で2.17GHz、2800+で2.08GHzとなる。Thoroughbredの2700+と同クロックで3000+という300+も高いモデルナンバーを付ける事が出来、同じ2800+なら0.17GHzも低い動作クロックにできたのは、言うまでもなく二次キャッシュ倍増のおかげだ。
 しかし、問題が無いわけではない。L2キャッシュを増やしたことにより、トランジスタ数はThoroughbredの3760万個から5430万個まで増加し、ダイサイズも84mm2から101mm2へ大きくなっている。具体的には11mm(W)×8mm(H)が13mm(W)×8mm(H)と細長くのびた。ダイサイズが大きくなると言うことは、1枚のウェハーから取れる枚数が減り、生産個数が減る危険性がある。また製造コストも上がってしまう。それでも、どんどんと動作クロックを上げていくと、発熱・消費電力が高くなりすぎる危険性があり、クロックを上げずに性能を上げる方法をとったのかもしれない。
 一方でAMDにマイナスのニュースもあった。次世代Athlonとして開発中のClawHammerは、Athlon64という名称に決まった一方、2002年第4四半期から2003年第1四半期に変更されていた出荷時期が、再度2003年第3四半期まで延期されてしまったのだ。期待されていた新製品が延期になったというだけでなく、さらに半年間、Athlon XPがハイエンドCPUにとどまる事となった。つまりPentium4にAthlon64で対抗するはずだったのが、もう半年間Athlon XPで対抗しなければならなくなったのだ。そのため、少しでも性能を上げようと二次キャッシュの増量に踏み切ったのかもしれない。
 さて、二次キャッシュの増量は確かに効果があり、2.17GHzである3000+で実際にPentium4-3.06GHzに迫る性能を手にした。一部、二次キャッシュ容量が性能に影響を与えにくいような処理では下回る物の、概ねモデルナンバー通りの性能を示し、Pentium4に離される事はなくなった。

AMD Athlon XP(Barton/FSB 333MHz)
動作クロック : 2800+(2.08GHz)〜3000+(2.17GHz)
FSB : 333MHz
L1/L2キャッシュ : 128KB/512KB
拡張命令 : MMX、3DNow! Professional
製造プロセス : 0.13μm
対応Socket/Slot : SocketA

一気にFSB800MHzに
 
 インテルは2003年4月15日発表のPentium4でFSBを800MHzへ高速化した。これまでの予定では533MHzの次は667MHzであったが、これを変更し一気に800MHzへと移行した。BartonコアのAthlon XP、そして第3四半期に登場予定のAthlon64に対抗するには、FSBを1段階上げる程度ではなく、一気に上げクロック当たりの性能を高める必要があるためだ。動作クロックは3GHzで、Pentium4中で最高クロックである3.06GHzを僅かに下回るものの、FSB800MHz化によってクロック当たりの性能向上が期待される事から、実質、性能面では最高性能を持つと言っても良いだろう。もちろんHyper-Threadingにも対応する。といっても、FSBが800MHzに高速化されただけで内部構造に変更はなく、たいした変更ではないと思うかもしれない。確かに今回は、同時発表された対応チップセットの方が大きな進化を遂げている。
 今回はFSBが800MHzになったと言う事で、FSB533MHzまでしか対応していない従来のIntel 845PE/850Eに代わって、新たにチップセットを用意する必要があった。もちろん従来のチップセットにFSB800MHzに対応させたバージョンを用意しても良かったのだが、これを機に新しいチップセットへと移行した。
 それがIntel 875Pだ。対応メモリとして、従来のPC2700 DDRSDRAM(DDR333:166MHzのDDR動作)より高速なPC3200 DDRSDRAM(DDR400:200MHzのDDR動作)の、しかもデュアルチャンネルに対応した。PC3200 DDRSDRAMは3.2GB/sの帯域幅を持ち、デュアルチャンネルにする事でメモリの帯域幅を6.4GB/sとする事ができる。一方のFSB800MHz版Pentium4のFSB帯域は6.4GB/sである。つまり高速なメモリ+デュアルチャンネルに対応する事で、FSBとメモリ帯域を一致させたのである。  これまでのチップセットの場合、例えばIntel 845PEではPC2700のシングルチャンネル(2.7GB/s)まで対応あり、FSB533MHzのPentium4の4.2GB/sにすら及ばなかった。このままのチップセットでCPUのFSBだけを高速化し帯域幅を上げても、メモリ帯域幅が足を引っ張り思うように性能は向上しない。そこで、今回はPC3200 DDRSDRAMに対応してメモリ帯域をFSB帯域「近くする」だけでなく、デュアルチャンネルに対応し「一致」させたのだ。これにより、CPUとメモリのどちらかが足を引っ張ることがなく、FSB800MHzの効果が現れやすくなっている。
 実際にPentium4-3GHz(FSB800MHz)とIntel 875Pの組み合わせでは、Pentium4-3.06GHz(FSB533MHz)とIntel 845PEの組み合わせよりも、3〜8%ほど、場合によっては十数%も向上しており、FSB/メモリ帯域の向上は大きな効果があったといえる。

Intel Pentium4(Northwood・HT対応・FSB800MHz)

動作クロック : 2.4C GHz〜3.4GHz
FSB : 533MHz
L1/L2キャッシュ : 8KB/512KB
拡張命令 : MMX、SSE2/HTテクノロジ対応
製造プロセス : 0.13μm
対応Socket/Slot : Socket478

Athlon XPもFSB400MHzに
 
 FSBを800MHzに向上させたPentium4に対抗して、Athlon XPもFSBを400MHzに向上させたAthlon XP-3200+を2003年5月13日に発表した。コア自体は従来通りBartonコアを採用しており、FSBを400MHzに向上させただけの製品だ。ただし、クロックあたりの性能は向上している。
 だが、Pentium4の場合と異なり、FSB帯域の向上がモデルナンバーあたりの性能向上に使われるのではなく、クロックをほとんど上げずにモデルナンバーを上げる方向へと使われたことだ。今回発表されたのはモデルナンバー3200+の製品であり、200+分向上しているが、動作クロックは2.2GHzとなっており従来から33MHzしか向上していない。

Athlon XPのモデルナンバーとクロックと

Athlon XPと動作クロックとの関係である。右に行くほどモデルナンバーが高く、上に行くほど動作クロックが高い。
 実際に性能的には「ある程度」向上しており、200+の性能向上は果たしているといえるものだった。つまりPentium4-3.2GHz相当の性能を持つことになる……つまり最速のx86CPUだといえるかと言うと、待ったをかけなくてはいけない。3000+とはFSB533MHzのPentium4-3GHz相当の性能であり、今回はモデルナンバー200+分性能が上がった。これはFSB533MHzのPentium4-3.2GHz相当と言うことになる。実際のPentium4はFSB800MHzへと移行しており、性能が大きく向上している。そのためAthlon XP-3200+はPentium4-3GHz(FSB800MHz)とくらべると劣ると言わざるを得ない。今後、Pentium4は全てFSB800MHzへ移行していくことを考えると、このモデルナンバーに調整が必要になるかもしれない。
 もう一つの懸念材料として、このごろFSBの向上や二次キャッシュの増量を頻繁に行って、動作クロックをそれほど向上させずにモデルナンバーを向上させている事だ。右の図を見て貰おう。右に行くほど高いモデルナンバー、上に行くほど高い動作クロックを表している。これを見ると、2600+まではモデルナンバーが向上するのと同じように順調に動作クロックが向上している。ところが2600+以降、ちょうどFSBが266MHzから333MHzに移行した頃から3200+までほとんどクロックが上がっていないのが分かる。2600+以降はFSBの333MHz化、Bartonへの移行、FSB400MHz化によってモデルナンバーが向上しているようにも見える。当初の予定にはFSB333MHz化すらなかったが結局400MHzまで向上している。二次キャッシュもダイサイズが大きくなると言う問題がありながら結局倍増に踏み切った。Pentium4に対抗しているとも言えるが、FSBはともかくダイサイズという製造コストに影響の出る二次キャッシュを増量したのは気になるところだ。2.25GHz……この辺りが(あくまで想像だが)現在の設計の限界なのかもしれない。クロックが上がらないけれどモデルナンバーは向上させなくてはいけないため、こうした事態になったとも考えられる。

AMD Athlon XP(Barton/FSB 400MHz)
動作クロック : 3200+(2.2GHz)
FSB : 400MHz
L1/L2キャッシュ : 128KB/512KB
拡張命令 : MMX、3DNow! Professional
製造プロセス : 0.13μm
対応Socket/Slot : SocketA

一気に充実、FSB800MHzとHyper-Threading
 
 これまで、Hyper-Threadingは3GHz以上のCPUでのみ使用できるようにするとしていた。ところが2003年5月22日と6月24日に、インテルは一気にFSB800MHzとHyper-Threadingの製品を増やした。まず、5月22日に3.0GHzより下の製品である2.4C/2.6C/2.8C GHz版も発表となった(2.8/2.6/2.4GHz版は既に製品があるため、区別するために「C」を付ける)。また、Intel875Pチップセットの下位のチップセットとして「Intel865PE(グラフィック機能非内蔵)」と「Intel865G(グラフィック機能内蔵)」も発表され(FSB533MHz対応のIntel865Pも同時発表)、FSB800MHz対応チップセットも一気に増えた。Intel875Pの下位と言ってもPC3200(DDR400) DDRSDRAMのデュアルチャンネルに対応しており、FSB800MHzのPentium4の十分に実力を発揮できる。CPUも下位モデルまでが用意され、これまでより安価なチップセットやグラフィック機能を内蔵したチップセットが採用された事で、FSB800MHzとHyper-Threadingが一気に普及した。さらに、2003年6月24日にPentium4最高となる3.2GHz版が発表された。これでFSB800MHzとHyper-Threadingに対応した製品が2.4〜3.2GHzまで、上から下までが一気揃った事となる。これにより、Pentium4は一気にFSB800MHz+Hyper-Threadingに移行していった。
 また、6月26日にはCeleron-2.6/2.5GHz版も発表され、Pentium4、Celeron共に確実に進化している。

Duronの復活?
 
 2002年1月以来クロックの向上が止まっていたDuronだが、突然2003年8月になって復活した。しかも1.8/1.6/1.4GHzの3モデルが発表されたのである。しかし、実はこのDuronは「中国、中南米、その他開発途上国に向けた限定品」という位置づけで、日本での発売予定はなかった。実際は秋葉原等では流通したが、日本では未発表という形になっている。
 このCPUはクロックが向上しただけでなく、製造プロセスが従来の0.18μmから0.13μmに、FSBが200MHzから266MHzに向上している。

全く新しいCPU、Athlon 64
 
 1999年8月以降、大きな変化の無かったAMDのCPUに大きな変化が現れた。2003年9月23日(日本では24日)に発表されたAthlon 64とAthlon 64 FXがそれだ。このCPUはこれまで同様Athlonの名が付いている物の全くの別物と言って良いCPUだ。まず、「64」の名が示すとおり64ビットCPUである点が挙げられる。i386以来Pentium4やAthlonまでずっと32ビットであったCPUが、ついに64ビットへと移行したのである。といっても(サーバー・ワークステーション向け製品であるためこのコーナーで紹介はしていないが)、インテルからは既にItaniumという64ビットCPUが発表されているが、これは過去の32ビット命令との互換性を捨てて64ビットへ移行したため、WindowsXPのような32ビットOSを動かす事が出来ない。それに対してAthlon 64は従来の32ビット命令とも完全に互換性があり、32ビットOSを動かす事が出来る。つまり、64ビットOSが普及するまでは32ビットCPUとして使う事が可能なわけだ。
 それ以外の特徴として、従来はチップセットに内蔵されていたメモリコントローラーがCPUに内蔵されている事が上げられる。つまり従来はチップセットに接続されていたメインメモリがCPUに直接接続される事となった。メモリ→チップセット→CPUと流れていたデーターがメモリ→CPUとなったため、性能が上がると言われている。
 実際に発表されたのはAthlon 64/3200+(2.0GHz)とAthlon 64 FX-51(2.2GHz)の2種類である。ノートパソコン向けAthlon 64/3200+(2.0GHz)と3000+(1.8GHz)も同時に発表されているが、こちらはノートパソコン向けCPUのコーナーで紹介したい。
 Athlon 64 FXは異例な点の多いCPUで、とりあえずAthlon 64から説明していこう。Athlon 64はCleawHammerという開発コード名で呼ばれていたCPUで2.0GHzの動作クロックで3200+のモデルナンバーを付けている。内蔵メモリコントローラーはPC3200(DDR400)DDRSDRAMにまで対応するがシングルチャンネルのみの対応だ。チップセット等とCPUとの接続に用いるHyper-Transportはマルチプロセッサに非対応であるため1リンクのみとなる。全く新しいCPUであるためパッケージも新しく、ピン数は754ピンであり、Pentium4と同じようにヒートスプレッダーが被せられておいる。このヒートスプレッダーのお陰でAthlon XPのようにヒートシンク等を取り付ける際に誤ってコアをかけさせてしまう心配が減った。ちなみに、これらは従来より予定されていたAthlon 64の仕様と同じである。
 一方、Athlon 64の上位に位置づけられるAthlon 64 FXは特異な点が多い。まず51というモデルナンバーからして異例だが、それ以外にピン数がAthlon 64754ピンよりも多い940ピンになってしまっている。また、メモリコントローラーはデュアルチャンネルに対応している点も違うのだが、そのメモリはサーバー・ワークステーションで用いられるRegisteredタイプでなくてはいけないのである。これらの点はすべてある一つの原因から発生している。このAthlon 64 FXはもともとSledgeHammerの開発コード名で呼ばれていたCPUだ。このSledgeHammerとはすでに登場していたサーバー・ワークステーション向けCPUの「Opteron」の開発コード名と同じなのである。つまり、そのOpteronをデスクトップパソコン向けに若干変更を加えたのがAthlon 64 FXと言えるのある。デュアルチャンネルのメモリに対応し、しかもRegisteredタイプ、ピン数が940ピンなのはOpteronと同じでなのである。またOpteronではモデルナンバーを他社製品との比較でなく、あくまで同製品間の性能差を示すために使っており、242や246などのモデルナンバーが付けられている。Athlon 64 FXの51というモデルナンバーもこれに合わせたと考えられる。一方パソコン向けにOpteronから変更した点は、マルチプロセッサや高いI/O能力が求められるサーバー用に3リンク備えていたHyper-Transportを、Athlon 64 FXでは1本に減らしている事と、OpteronではPC2700までの対応であったメモリコントローラーをAthlon 64に合わせてPC3200まで対応させた事だ。ただし、メモリがRegisteredタイプであるのにPC2700対応は問題があるのだ。確かに、サーバー製品向けにRegisteredタイプが販売されてはいるのだが、PC2700までである(インテルもAMDもサーバー向けではPC2700までしか対応していないため)。一方、デスクトップパソコン向けにはPC3200 DDRSDRAMが存在するが、Registeredタイプでないため使用できない。つまり、RegisteredタイプのPC3200 DDRSDRAMはAthlon 64 FX以外に需要が無く、供給量が限られる危険性がある。この事はAMDも分かっており、デュアルチャンネルに対応するがRegisteredタイプでないメモリを使うタイプのAthlon 64 FXを開発中であると言う事だ。ただしこれはサポートするメモリの違いにより、現状のAthlon 64 FXのマザーボードでは使えない。間違って使われないようにピン数が939ピンになると言われている。つまり、940ピンAthlon 64 FXは939ピンタイプへのつなぎのような製品なのである。
 なぜ、このようなデスクトップパソコンには向かない仕様を一部に持ったCPUを用意したのだろう。これはAthlon 64とAthlon XP、Pentium 4との関係があると言われている。Athlon 64は思ったより動作クロックが上がらずAthlon XPより下の2.0GHz、モデルナンバーで見てようやく同等である。64ビットCPUであるという点はあるものの、64ビット版Windowsの登場が先であるため、しばらくはAthlon XPと同じ32ビットCPUとして使われる事になるはずだ。そうなると同モデルナンバーでは積極的に移行する気にはならない。すると64ビットCPUの普及が進まないという事態に陥ってしまう。そこで、Opteronの仕様を一部変更した上位モデルであるAthlon 64 FXを用意し、なんとかAthlon XPを超える必要があったのだ。また、Pentium4がデュアルチャンネルメモリに対応したが、Athlon 64はシングルチャンネルであるため、デュアルチャンネルに対応した製品を用意したのだとも言われている。  理由はどうであれ、モデルナンバーが51というのは何とも分かりにくい。Opteronを基本にしていると言っても、モデルナンバーは3300+や3400+のようなナンバーを付けても良かったのではないかとも思える。しかしそうすると、将来Athlon 64により高モデルナンバーの製品が出た際に重複して分かりにくくなると言う配慮なのか。どう考えての事かは分からない。
 Athlon 64/64 FXは128MBの一次キャッシュと、1MBという大容量の二次キャッシュを内蔵する。Athlon XPと同じ3DNow!やSSEに加えてSSE2にも対応する。0.13μmプロセスで製造される点はAthlon XPと同じだが、ダイサイズは192mm2でありAthlon XP(Barton)の101mm2と比べてかなり大きい。Pentium4の131mm2と比べても大きいと言える。といっても新しい設計のCPUは最初は大きい傾向にあるため、今後製造プロセスが細分化されれば小型化するだろう。

AMD Athlon 64(CleawHammer)

動作クロック : 3000+(2.0GHz)〜3700+(2.4GHz)
Hyper Transport : 1600MHz
L1/L2キャッシュ : 128KB/512KB〜1MB
拡張命令 : 3D!Now Professional、SSE2
製造プロセス : 0.13μm
対応Socket/Slot : Socket754

AMD Athlon 64 FX(SledgeHammer/Socket940)

動作クロック : 51(2.2GHz)〜53(2.4GHz)
Hyper Transport : 1600MHz
L1/L2キャッシュ : 128KB/1MB
拡張命令 : 3D!Now Professional、SSE2
製造プロセス : 0.13μm
対応Socket/Slot : Socket940


Athlon 64の性能と問題
 
 Athlon 64はAthlon XPの最高モデルナンバーと同じ3200+である。しかし動作クロックは200MHz下がっておりクロック辺りの性能がより高くなっているようだ。では実際の性能はどういったものだろう。Athlon 64は64ビットCPUであるため、64ビットOS上で動作させてこそ真価を発揮するとも言えるが、現状ではAthlon 64で利用できる64ビットCPUはTurboLinuxやSuSE Linuxに限られ、当分はWindowsXPを使って高速な32ビットCPUとして利用されるであろう。そこで、WindowsXP上でのベンチマークテストの結果を基に話を進める。
 Athlon 64/3200+はAthlon XP/3200+との比較では軒並みAthlon 64が高い性能を示した。テストによっては2割以上高い性能を示したものもあった。Pentium4/3.2GHzとの比較では得手不得手があり、Athlon 64が若干高い性能を示す場合とPentium4が高い性能を示す場合がある。総合的には若干Pentium4の方が高いと言えるが、Athlon 64/3200+はPentium4/3.2GHzと同じであり、3200+のモデルナンバー通りの性能を持っていると言える。Athlon XP/3200+より高い性能を示しているのに同じ3200+を付けているのは、Athlon XPがHyper-Threadingに非対応のFSB533MHzのPentium4との比較であるのに対して、Athlon64はHyper-Threading対応でFSB800MHzのPentium4との比較になっているためだ。
 このAthlon 64は目新しい部分が沢山あるが、問題点もいくつかある。「メモリーコントローラーをCPUに内蔵」したことも長所に見えるが、同時に短所も両立しているのだ。上記のようにメモリコントローラーを内蔵したことによって、メモリに高速にアクセスでき、CPUの性能がフルに発揮できる。しかし、CPUにメモリコントローラーを内蔵してしまったため、CPU開発の段階で対応するメモリを決めなければならなくなったのだ。ところが、CPUは開発を1年以上も前から始められる事が多いため、この時点で開発完了時点に普及している、もしくは普及にむかうであろう規格を予想しなくてはならない。予想がはずれると、発売時点で普及している規格とは違う、一般的でないメモリを使うことになりCPUの普及の妨げになってしまう。また、たとえ一般的なメモリでも、すでに旧世代の規格であればそれも問題だ。例えば、開発開始時点でAという規格のメモリが普及しているとする。そして開発終了時点ではそれより高速なBという規格が普及しているだろうと予想して開発を始めるとする。ところが実際にはBのさらに高速なCという規格のメモリもすでに普及しはじめているとなったらどうなるだろう。この時点でBという規格にのみ対応しているとすると、「CPUはハイエンドなのに、最新のメモリに対応していない」というアンバランスな状態になってしまう。それを避けるために最新メモリへの対応を行おうとすると、その分発売が遅れてしまう。実は既に1世代目の製品である今回で既に問題が発生している。デュアルチャンネルメモリの意外な普及によって、Athlon 64が対応できない問題がそれだ。そのせいでAthlon 64FXを用意せねばならずややこしくなってしまった。今回はAthlon 64FXの投入で誤魔化せたが、今後もっと深刻な問題が発生する可能性も否定できない。
 もう一つの問題は、グラフィック統合型チップセットに関連した問題だ。グラフィック統合型チップセットではメインメモリの一部をグラフィックメモリとして使用する。ところが問題はここで発生する。CPUにメモリコントローラーを内蔵したことによりCPUから見ればチップセットを介さずにアクセスできるため有利だ。ところがチップセットに内蔵したグラフィックから見れば、従来なら「メモリ→チップセット」とアクセスできるところを、「メモリ→CPU→チップセット」とCPUを介さなくてはならなくなったのだ。つまりCPUからのメモリアクセスには有利だが、チップセット内蔵グラフィックからは不利なのだ。対応としては2つあり、1つはCPUに接続されたメモリを何とかして使用する方法、もう一つはメインメモリとは別にグラフィックメモリを別に搭載する方法だ。前者は設計が難しくなり、またグラフィック性能が落ちる可能性があり、後者はグラフィックメモリ分のコストがかかってしまう。
 さらにもう一つの問題は、1つ目の「普及するメモリを予想しなくてはならない問題」にも関係する。今回はデュアルチャンネルメモリに対応できなかったため、シングルチャンネルのAthlon64とデュアルチャンネルのAthlon 64FXを用意した。ところがAthlon 64FXはRegisteredタイプのメモリしか使えない。そこで、現在Registeredタイプでない一般的なメモリでデュアルチャンネルに対応している製品を開発している。ところがこのCPUは939ピンソケット対応となる。現在のAthlon 64の754ピン、Athlon 64FXの940ピンのいずれとも異なる。そのため現在の754ピン、940ピンは余り長続きせず、互換性という点で問題が発生してしまうのだ。

 こうしてAMDのAthlon 64シリーズが発売され、64ビットCPUとして一歩先に出たAMDだが、まだ問題を残している状態だ。一方のインテルは性能的には問題ないものの、64ビットCPUは一歩遅れた格好だ。今後どうなるのか、そして新たに浮上する発熱量の問題は次回お伝えする。

(H.Intel)