2006-06-01から1ヶ月間の記事一覧

SIMD化

手作業によるSIMD化はなかなか時間がかかっています。個人的な目標はCPIを1.0以下にすることですが、思った以上にCPIが減らないので取り合えず現状のパッチをアップします。SIMD化した部分は#ifdef __SIMD__で囲っています。パッチはこちら。個人的にはMMXや…

SIMD化奮闘中

プロファイル結果とソースコードを見ながら、簡単にSIMD化できそうなところから対応中。改善は見られるものの人に見せれる程ではないなぁ。ループアンローリングを手作業でするのも結構面倒。コードサイズが増えるので、スタック領域が減って動かなくなると…

プロファイル

SIMD化するにあたり、どの部分の処理が重いか把握するためgprofを使いプロファイルを取ってみました。spuパートを-pgオプションを付けて実行してみましたが、プロファイル情報のファイルが見当たらないので(そりゃーspu側からどうやってファイルを作るの?…

xlc続き

xlcでビルドしたプログラムが動いていない件はbitfield命令の生成コードが動いていないようです。これ以上xlcにこだわってもしょうがないので、gccでビルドすることにします。地道にsimd化してみます。