TURBO-MODEの効果
まりもさん作のvxl2coffと言うソフトを試していた時でした。元々このソフトは430VXチップセットのセカンドキャッシュをIPLの段階でOFFにする物と言う事で公開されました。既にマザーボードの改造でセカンドキャッシュを切っていたのですが、折角のまりもさんのソフトだし物は試しと言う事で、無改造のマザーを引っ張り出して動作確認を取っていました。
当然の事とばかりにメモリー系ベンチマークの定番MAB(Memory Access Benchmark 俗称?マブ)をとってセカンドキャッシュの有無を確認。
”ウム、セカンドキャッシュはちゃんとoffになってるな”、と他の項目に目をやると何か見慣れない数値が並びました。(^_^;)
FSBは75MHzですが、NV4下駄を使用していた為、表記上はFSB150MHzとなっています。
Memory Access Benchmark ver1.10 Copyright (C) 1998-1999 Softhouse333 Base Address : 00100000h Processor : AuthenticAMD Family 5, Model 13, Stepping 0 Core Frequency: 525.022MHz ( FSB 150.006MHz ) Access Pattern: Continuous Access| Unbuffered Access[MB/sec] | Buffered Access[MB/sec] Size | Read Write RD/M/WR| Read Write RD/M/WR ------+-----------------------------+----------------------------- 4K | 244.513 243.213 243.571| 2104.196 2044.190 840.034 8K | 247.809 247.140 246.136| 2102.139 2067.777 837.418 16K | 249.086 248.647 248.489| 2101.112 2083.806 839.133 32K | 249.806 249.763 249.683| 2050.036 2036.447 831.629 64K | 250.129 250.069 249.953| 1392.860 1153.502 697.913 128K | 250.381 250.325 250.331| 1396.449 1156.079 698.905 256K | 250.417 250.402 250.382| 1384.913 1146.717 695.947 512K | 250.493 155.148 155.147| 250.488 155.151 155.136 1024K | 250.519 130.359 130.361| 250.519 130.356 130.359 2048K | 250.534 120.712 120.710| 250.534 120.709 120.710 4096K | 250.539 116.405 116.404| 250.540 116.405 116.403 8192K | 250.543 114.364 114.365| 250.543 114.365 114.365
一番左側のUnbuffered Access の値が今までの197MB/sから250MB/sに跳ね上っていました。(約27%アップ)
これは絶対何か有る、と言う事でINTELSATのパラメータをチェック、54のbit=0の値が1から0に変える事で変化するが解りました。これは、INTELの430VXのデーターシート1998年5月のVersion-003(297653pdf)にあるSD-RAM turbo modeの所にもしっかり記述が有りました。
自分の勉強不足もあり、まりもさんに感謝した瞬間でした。
その後の某掲示板の他の方の書きこみなどを纏めると、RvII26等のバンクインターリーブとは基本的に違う物で、どちらかと言うとシステムコントローラ82437TVXと2つのデーターコントローラ82438TDX間の”インターリーブ的な動作”をさせる物という事らしいです。
動作条件は、ALL-DIMM環境、オンボードのセカンドキャッシュはOFF、の状態は必須です。
早速、FSBを弄ったりして遊んでいましたが、流石に今まで最高FSB99.5MHzまで動いた構成でもFSB93.1MHzが限界でした。
その時のMABの数値ですが、FSB99.5MHz-Turbo mode OFFの時が、
Memory Access Benchmark ver1.10 Copyright (C) 1998-1999 Softhouse333 Base Address : 00100000h Processor : AuthenticAMD Family 5, Model 9, Stepping 1 Core Frequency: 497.437MHz ( FSB 99.487MHz ) Access Pattern: Continuous Access| Unbuffered Access[MB/sec] | Buffered Access[MB/sec] Size | Read Write RD/M/WR| Read Write RD/M/WR ------+-----------------------------+----------------------------- 4K | 257.911 79.330 246.790| 1993.640 1989.746 795.899 8K | 259.059 79.449 250.031| 1991.691 1989.746 793.419 16K | 261.051 79.519 251.016| 1990.718 1989.746 795.044 32K | 261.448 79.555 251.559| 1978.636 1944.180 793.380 64K | 261.921 79.572 252.170| 1325.257 660.574 676.489 128K | 262.000 79.581 252.412| 1325.446 496.682 676.636 256K | 262.037 79.585 252.516| 1325.338 441.845 676.612 512K | 262.099 79.588 179.420| 262.140 134.883 179.437 1024K | 262.136 79.589 156.738| 262.146 100.109 156.748 2048K | 262.143 79.589 147.419| 262.151 88.678 147.423 4096K | 262.142 79.590 143.164| 262.146 83.888 143.164 8192K | 262.145 79.590 141.126| 262.148 81.683 141.127
FSB93.1MHz-Turbo mode ONの時の数値が,
Memory Access Benchmark ver1.10 Copyright (C) 1998-1999 Softhouse333 Base Address : 00100000h Processor : AuthenticAMD Family 5, Model 13, Stepping 0 Core Frequency: 557.790MHz ( FSB 92.965MHz ) Access Pattern: Continuous Access| Unbuffered Access[MB/sec] | Buffered Access[MB/sec] Size | Read Write RD/M/WR| Read Write RD/M/WR ------+-----------------------------+----------------------------- 4K | 303.092 301.851 288.291| 2239.910 2203.190 893.162 8K | 306.610 305.401 291.454| 2235.526 2216.012 890.030 16K | 308.338 308.661 293.363| 2233.341 2218.163 891.680 32K | 309.335 309.214 294.217| 2183.451 2168.941 883.790 64K | 309.883 309.964 294.910| 1481.052 1226.360 741.773 128K | 310.237 310.269 295.103| 1484.239 1228.668 742.677 256K | 310.350 310.335 295.185| 1474.050 1220.229 739.968 512K | 310.479 192.316 187.696| 310.477 192.301 187.696 1024K | 310.497 161.571 158.785| 310.508 161.574 158.784 2048K | 310.527 149.615 147.429| 310.533 149.616 147.430 4096K | 310.537 144.281 142.340| 310.539 144.282 142.340 8192K | 310.543 141.753 139.926| 310.544 141.754 139.926
MABの数値的に言えば、ここまで上げる事が出来ればまあ文句無しと言う所でしょうか・・・が、常用は無理でしょう。(メモリー64MB限定ですし)
参考ベンチ(最近のPM掲示板より、色んなデバイスが繋がっているので数値的には少し低いです。)
Hdbench3.40b6
R / W / RW
9873 5473 10749 [有効前]
12591 5883 11556 [有効後]
メモリー系のベンチだけでTurbo-modeを片付けるのも何ですし、パソコンのパフォーマンスはメモリースピードだけではないのでもう少し別なベンチを取って比較してみましょう。
先ずはSuper πの104万桁 条件は起動直後、K6-3E+550@600MHzです。比較用に採った条件ですので最速チューニングはしていません。
確かに17秒程速くなっていますが、比率で言うと約5%ですね。この17秒をどう取るかですね。πの17秒は縮めるのには結構大変ですが、・・・ね。
次に描画系の3Dベンチです。
今は昔のFinal Realityです。しかしこのベンチPC-9821で動かす限り、微妙なデバイスの差を意外に表してくれます。
Database Entry <TURBO MODE OFF> Benchmark results: Radial blur, 5N, 38.61, rips, 5.340, Rmark Chaos zoomer, 5N, 50.68, rips, 2.463, Rmark 25 Pixel, 5N, 162.96, kpps, 5.208, Rmark Robots, 5N, 53.50, rips, 13.861, Rmark Fillrate, 5N, 17.80, MPps, 3.853, Rmark City scene, 5N, 68.69, rips, 17.045, Rmark Video card bus transfer, 5N, 63.03, MBps, 2.007, Rmark Direct3D bus transfer, 5N, 62.27, MBps, 5.323, Rmark ----------------------------------------------------------------------------- Visual appearance, 96.30, percent ----------------------------------------------------------------------------- Overall 3D, 3.823, Rmark Overall 2D, 3.901, Rmark Overall bus rate, 3.002, Rmark ----------------------------------------------------------------------------- OVERALL SCORE, 3.723, Rmark ----------------------------------------------------------------------------- 429993968 Database Entry <TURBO MODE ON> Benchmark results: Radial blur, 5N, 41.13, rips, 5.689, Rmark Chaos zoomer, 5N, 54.32, rips, 2.639, Rmark 25 Pixel, 5N, 163.11, kpps, 5.213, Rmark Robots, 5N, 54.75, rips, 14.184, Rmark Fillrate, 5N, 17.80, MPps, 3.854, Rmark City scene, 5N, 70.29, rips, 17.441, Rmark Video card bus transfer, 5N, 66.03, MBps, 2.102, Rmark Direct3D bus transfer, 5N, 63.15, MBps, 5.397, Rmark ----------------------------------------------------------------------------- Visual appearance, 96.30, percent ----------------------------------------------------------------------------- Overall 3D, 3.859, Rmark Overall 2D, 4.164, Rmark Overall bus rate, 3.091, Rmark ----------------------------------------------------------------------------- OVERALL SCORE, 3.835, Rmark ----------------------------------------------------------------------------- 1333357905
確かにCity sceneやRobotsなどの所は殆ど差が出ませんが、ベンチの最初の部分で計測されるRadial biurやChaos zoomerは数値が伸びているのが解るでしょう。逆に言うと2Dの効果やパレット変換などには効果は有っても、3D系のポリゴン処理速度等3D系には既にメモリースピードはあまり寄与していないかも知れません。(しかし多分にVoodooBansheeの性能の限界とも言えますが・・・・・)
動画再生は実際のフレームレートを測定、某Mpeg4ファイルをMediaPlayer6.4を使い、統計>実際の率、という所で計測。
色々なファイルを再生して見ると、概ね2〜3フレームほど改善されるみたいです。
同じファイルを同じ所で、キャプチャしてみました。(と言ってもcopyキーで貼りつけただけですが)まあ証拠画像という所ですか・・・・・
この手の画像を貼りつけるのは、容量が嵩んでイヤなのですが・・・・・(汗
上がTurbo-mode ON、下がOFF、ちうところです。
動作環境がV200MZD2 K6-3E+550@600MHz、GAは標準装備のMGA-1064SGです(笑 。 まあ抜いちゃ駄目ボードの割には頑張っているでしょう。
結局のところ、Turbo-modeに多大な期待をすると失望しますが、かなりの場面で少しづつ利いてくる感じ、と言うのが一番適切な表現かもしれません。もしTurbo-mode ONの状態で安定した動作が望める状態なら、常時ONで作動させる事をお勧めします。
メインマシンは、NE-SD4100T-64M、それ意外は互換機用256MBメモリーを使用していますが、今の所G8YDPマザーでは特別な不具合は出ていない様です。