告知欄です

1- レス

暑さと台風の連続◆トリップ・チェイサー◆常駐スレpart84


[393]ひよこ名無しさん:04/08/09 17:08
>>392 前のは、Pen4でのトレースキャッシュを無視して最適化を進めた結果だからな。 今回は、基本的に、Pen4向けにトレースキャッシュ容量節約した「退化」ですね。 かのMonaが512kのオンダイなL2キャッシュを積んだIntel系マシンじゃないと スピードが出ない方向に高速化をすすめたように、命令キャッシュ容量のちょっと 余裕のあるマシン向けに最適化を進めたのが、Pen4でスピードがろくに出ないアレの正体なのです。 ちなみに、どっちの実装もまだ手抜きが多いので、最適化の余地はあるのですがね。 Pen4だけ別バイナリにするなら、プリフェッチとかの拡張命令を使ってみたいのだが SSE2の128bitSIMDの利用は、どーやらそれに伴う速度アップも微妙な上に、 微妙なコア部分だけじゃなくてデータ構造もかなり変えなきゃいけなくなる から、保守性の面では微妙だな。 本気でSSE2やるならPen4実機買う必要があるかもしれんな。 俺はノート派だが、Pen4-Mは激しく買いたくないな。


0ch BBS 2004-01-25