TURBO-MODEの効果

まりもさん作のvxl2coffと言うソフトを試していた時でした。元々このソフトは430VXチップセットのセカンドキャッシュをIPLの段階でOFFにする物と言う事で公開されました。既にマザーボードの改造でセカンドキャッシュを切っていたのですが、折角のまりもさんのソフトだし物は試しと言う事で、無改造のマザーを引っ張り出して動作確認を取っていました。

当然の事とばかりにメモリー系ベンチマークの定番MAB(Memory Access Benchmark 俗称?マブ)をとってセカンドキャッシュの有無を確認。

”ウム、セカンドキャッシュはちゃんとoffになってるな”、と他の項目に目をやると何か見慣れない数値が並びました。(^_^;)

FSBは75MHzですが、NV4下駄を使用していた為、表記上はFSB150MHzとなっています。

Memory Access Benchmark ver1.10 Copyright (C) 1998-1999 Softhouse333
Base Address  : 00100000h
Processor     : AuthenticAMD  Family 5, Model 13, Stepping 0
Core Frequency: 525.022MHz ( FSB 150.006MHz )
Access Pattern: Continuous
Access|  Unbuffered Access[MB/sec]  |  Buffered Access[MB/sec]
 Size |   Read      Write    RD/M/WR|   Read      Write    RD/M/WR
------+-----------------------------+-----------------------------
   4K |  244.513   243.213   243.571| 2104.196  2044.190   840.034
   8K |  247.809   247.140   246.136| 2102.139  2067.777   837.418
  16K |  249.086   248.647   248.489| 2101.112  2083.806   839.133
  32K |  249.806   249.763   249.683| 2050.036  2036.447   831.629
  64K |  250.129   250.069   249.953| 1392.860  1153.502   697.913
 128K |  250.381   250.325   250.331| 1396.449  1156.079   698.905
 256K |  250.417   250.402   250.382| 1384.913  1146.717   695.947
 512K |  250.493   155.148   155.147|  250.488   155.151   155.136
1024K |  250.519   130.359   130.361|  250.519   130.356   130.359
2048K |  250.534   120.712   120.710|  250.534   120.709   120.710
4096K |  250.539   116.405   116.404|  250.540   116.405   116.403
8192K |  250.543   114.364   114.365|  250.543   114.365   114.365

一番左側のUnbuffered Access の値が今までの197MB/sから250MB/sに跳ね上っていました。(約27%アップ)

これは絶対何か有る、と言う事でINTELSATのパラメータをチェック、54のbit=0の値が1から0に変える事で変化するが解りました。これは、INTELの430VXのデーターシート1998年5月のVersion-003(297653pdf)にあるSD-RAM turbo modeの所にもしっかり記述が有りました。

自分の勉強不足もあり、まりもさんに感謝した瞬間でした。

その後の某掲示板の他の方の書きこみなどを纏めると、RvII26等のバンクインターリーブとは基本的に違う物で、どちらかと言うとシステムコントローラ82437TVXと2つのデーターコントローラ82438TDX間の”インターリーブ的な動作”をさせる物という事らしいです。

動作条件は、ALL-DIMM環境、オンボードのセカンドキャッシュはOFF、の状態は必須です。


早速、FSBを弄ったりして遊んでいましたが、流石に今まで最高FSB99.5MHzまで動いた構成でもFSB93.1MHzが限界でした。

その時のMABの数値ですが、FSB99.5MHz-Turbo mode OFFの時が、

Memory Access Benchmark ver1.10 Copyright (C) 1998-1999 Softhouse333
Base Address  : 00100000h
Processor     : AuthenticAMD  Family 5, Model 9, Stepping 1
Core Frequency: 497.437MHz ( FSB 99.487MHz )
Access Pattern: Continuous
Access|  Unbuffered Access[MB/sec]  |  Buffered Access[MB/sec]
 Size |   Read      Write    RD/M/WR|   Read      Write    RD/M/WR
------+-----------------------------+-----------------------------
   4K |  257.911    79.330   246.790| 1993.640  1989.746   795.899
   8K |  259.059    79.449   250.031| 1991.691  1989.746   793.419
  16K |  261.051    79.519   251.016| 1990.718  1989.746   795.044
  32K |  261.448    79.555   251.559| 1978.636  1944.180   793.380
  64K |  261.921    79.572   252.170| 1325.257   660.574   676.489
 128K |  262.000    79.581   252.412| 1325.446   496.682   676.636
 256K |  262.037    79.585   252.516| 1325.338   441.845   676.612
 512K |  262.099    79.588   179.420|  262.140   134.883   179.437
1024K |  262.136    79.589   156.738|  262.146   100.109   156.748
2048K |  262.143    79.589   147.419|  262.151    88.678   147.423
4096K |  262.142    79.590   143.164|  262.146    83.888   143.164
8192K |  262.145    79.590   141.126|  262.148    81.683   141.127

FSB93.1MHz-Turbo mode ONの時の数値が,

Memory Access Benchmark ver1.10 Copyright (C) 1998-1999 Softhouse333
Base Address  : 00100000h
Processor     : AuthenticAMD  Family 5, Model 13, Stepping 0
Core Frequency: 557.790MHz ( FSB 92.965MHz )
Access Pattern: Continuous
Access|  Unbuffered Access[MB/sec]  |  Buffered Access[MB/sec]
 Size |   Read      Write    RD/M/WR|   Read      Write    RD/M/WR
------+-----------------------------+-----------------------------
   4K |  303.092   301.851   288.291| 2239.910  2203.190   893.162
   8K |  306.610   305.401   291.454| 2235.526  2216.012   890.030
  16K |  308.338   308.661   293.363| 2233.341  2218.163   891.680
  32K |  309.335   309.214   294.217| 2183.451  2168.941   883.790
  64K |  309.883   309.964   294.910| 1481.052  1226.360   741.773
 128K |  310.237   310.269   295.103| 1484.239  1228.668   742.677
 256K |  310.350   310.335   295.185| 1474.050  1220.229   739.968
 512K |  310.479   192.316   187.696|  310.477   192.301   187.696
1024K |  310.497   161.571   158.785|  310.508   161.574   158.784
2048K |  310.527   149.615   147.429|  310.533   149.616   147.430
4096K |  310.537   144.281   142.340|  310.539   144.282   142.340
8192K |  310.543   141.753   139.926|  310.544   141.754   139.926

MABの数値的に言えば、ここまで上げる事が出来ればまあ文句無しと言う所でしょうか・・・が、常用は無理でしょう。(メモリー64MB限定ですし)

参考ベンチ(最近のPM掲示板より、色んなデバイスが繋がっているので数値的には少し低いです。)

Hdbench3.40b6
R / W / RW
9873
 5473 10749 [有効前]
12591
 5883 11556 [有効後]


メモリー系のベンチだけでTurbo-modeを片付けるのも何ですし、パソコンのパフォーマンスはメモリースピードだけではないのでもう少し別なベンチを取って比較してみましょう。

先ずはSuper πの104万桁 条件は起動直後、K6-3E+550@600MHzです。比較用に採った条件ですので最速チューニングはしていません。

確かに17秒程速くなっていますが、比率で言うと約5%ですね。この17秒をどう取るかですね。πの17秒は縮めるのには結構大変ですが、・・・ね。

次に描画系の3Dベンチです。

今は昔のFinal Realityです。しかしこのベンチPC-9821で動かす限り、微妙なデバイスの差を意外に表してくれます。

 

Database Entry <TURBO MODE OFF>

Benchmark results:
Radial blur,             5N,  38.61, rips,  5.340, Rmark
Chaos zoomer,            5N,  50.68, rips,  2.463, Rmark
25 Pixel,                5N, 162.96, kpps,  5.208, Rmark
Robots,                  5N,  53.50, rips, 13.861, Rmark
Fillrate,                5N,  17.80, MPps,  3.853, Rmark
City scene,              5N,  68.69, rips, 17.045, Rmark
Video card bus transfer, 5N,  63.03, MBps,  2.007, Rmark
Direct3D bus transfer,   5N,  62.27, MBps,  5.323, Rmark
-----------------------------------------------------------------------------
Visual appearance,            96.30, percent
-----------------------------------------------------------------------------
Overall 3D,                   3.823, Rmark
Overall 2D,                   3.901, Rmark
Overall bus rate,             3.002, Rmark
-----------------------------------------------------------------------------
OVERALL SCORE,                3.723, Rmark
-----------------------------------------------------------------------------
429993968


Database Entry <TURBO MODE ON>

Benchmark results:
Radial blur,             5N,  41.13, rips,  5.689, Rmark
Chaos zoomer,            5N,  54.32, rips,  2.639, Rmark
25 Pixel,                5N, 163.11, kpps,  5.213, Rmark
Robots,                  5N,  54.75, rips, 14.184, Rmark
Fillrate,                5N,  17.80, MPps,  3.854, Rmark
City scene,              5N,  70.29, rips, 17.441, Rmark
Video card bus transfer, 5N,  66.03, MBps,  2.102, Rmark
Direct3D bus transfer,   5N,  63.15, MBps,  5.397, Rmark
-----------------------------------------------------------------------------
Visual appearance,            96.30, percent
-----------------------------------------------------------------------------
Overall 3D,                   3.859, Rmark
Overall 2D,                   4.164, Rmark
Overall bus rate,             3.091, Rmark
-----------------------------------------------------------------------------
OVERALL SCORE,                3.835, Rmark
-----------------------------------------------------------------------------
1333357905

確かにCity sceneやRobotsなどの所は殆ど差が出ませんが、ベンチの最初の部分で計測されるRadial biurやChaos zoomerは数値が伸びているのが解るでしょう。逆に言うと2Dの効果やパレット変換などには効果は有っても、3D系のポリゴン処理速度等3D系には既にメモリースピードはあまり寄与していないかも知れません。(しかし多分にVoodooBansheeの性能の限界とも言えますが・・・・・)

 


動画再生は実際のフレームレートを測定、某Mpeg4ファイルをMediaPlayer6.4を使い、統計>実際の率、という所で計測。

色々なファイルを再生して見ると、概ね2〜3フレームほど改善されるみたいです。

同じファイルを同じ所で、キャプチャしてみました。(と言ってもcopyキーで貼りつけただけですが)まあ証拠画像という所ですか・・・・・

この手の画像を貼りつけるのは、容量が嵩んでイヤなのですが・・・・・(汗

上がTurbo-mode ON、下がOFF、ちうところです。

動作環境がV200MZD2 K6-3E+550@600MHz、GAは標準装備のMGA-1064SGです(笑 。 まあ抜いちゃ駄目ボードの割には頑張っているでしょう。

 


結局のところ、Turbo-modeに多大な期待をすると失望しますが、かなりの場面で少しづつ利いてくる感じ、と言うのが一番適切な表現かもしれません。もしTurbo-mode ONの状態で安定した動作が望める状態なら、常時ONで作動させる事をお勧めします。

メインマシンは、NE-SD4100T-64M、それ意外は互換機用256MBメモリーを使用していますが、今の所G8YDPマザーでは特別な不具合は出ていない様です。