他のシステムのインストールがなくなる?

こちらよると「他のシステムのインストール」がなくなる?http://japanese.engadget.com/2010/03/29/ps3-v3-21/最近PS3はDVDプレーヤーと化しているものの、「他のシステムのインストール」があるから旧型を残しているのに。旧型からこの機能を削除するのだ…

コメント

コメントどうもです。 最近すっかりがんばっていません。x264の場合は規模が大きいのでどの処理ブロックをSPEにさせるか難しいです。 当初はとにかくSPEのLSに押し込んで、これを7つのSPEで並列に走らせるつもりでしたが、8段のパイプラインのように処理させ…

pixel_satd_wxhのSIMD化

あけましておめでとうです。さてなんとかpixel_satd_wxhもSIMD化して、さらに速くなりましたが、元通りとまではいかず。 とりあえず現状をまとめて、上の階層をSPUに持ってくることになりそう。今回の速度は、 SPU(SIMD化) 477秒 PPU(前回の測定値) 320秒 前…

motion_compensation_chromaのSIMD化

先週に引き続きmotion_compensation_chromaをSIMD化しさらにちょびっと速くなった。次はpixel_satd_wxhのSIMD化だ。

pixel_avgのSIMD化

がっくりしていてもしょうがないのでSIMD化してみる。まずはpixel_avgをSIMD化し、ちょびっと速くなった。次はmotion_compensation_chromaか。少しずつ進めましょう。

refine_subpelの検証

前日のちょっとがっくりな結果をもう少し調べる。まずはSPUで処理した場合とPPUで処理した場合の違い。 SPU 2.20 fps 815.859 sec PPU 5.59 fps 320.839 sec PPU+SPU 1.96 fps 913.871 sec ということは、913-815の98秒がrefine_subpelのPPUでの実行時間。全…

refine_subpelのSPU化

なんとかrefine_subpelがspuで動き出しました。1スレッドで動かす分にはPPC用と同じデータを生成できるようになったが、6スレッドで動かすとまだ完全には一致しない。 それ以上に悲しいのが、遅い。まー、ここから呼ばれる関数は、PPC用は軒並みaltivecのコ…

kernel 2.6.23.1-10.fc7

ひさびさにyum updateしたらFedora7の2.6.23カーネルがインストールされる様子。今のところrc3のカーネルはちゃんと動いているので文句はないけど(oprofileできなかったけど)、まーこれも経験なのでアップデートしてしまう。で、アップデート後再起動。起動…

refine_subpelのSPU化

SPU化するコードを精査するためにoprofileを実施してみた。が、2.6.23-rc3カーネルはoprofileのモジュールが入っていないので実行できず。へたれな自分としてはカーネルコンパイルまでせず、fedora純正カーネルの2.6.22でbootして実行する。なぜかcallgraph…

x264_fdec_filter_rowのSPU化

x264_fdec_filter_rowのSPU化が動作するようになったのでパッチをアップします。2月にプロファイルを取ったときに全体の約20%の処理時間がかかっていた所です。場所はいつものところ。ベースのコードはr656のままです。 SPU化 1スレッド $ time ./x264 -q 26…

x264_frame_deblock_rowのSPU化

x264のx264_frame_deblock_row関数のSPU化がだいぶできてきたけど、PPUより遅い。イメージデータの転送が遅いのか、SIMD化していないから遅いのかと色々試しても速くならない。調べた結果、イメージデータはまとめてDMAしていたけど、設定情報系(x264_tで定…

kernel 2.6.22.4-65

先ほどyum updateするとカーネル2.6.22.4-65が入った。とりあえず起動はできる。が、ps3-ehci-driverがいろいろ文句を言っている様子。シャットダウン時もusbあたりで止まっている。うー。いまいち。最近はもっぱらsshでPCからログインして使っており、こち…

Fedora7再インストール

結局Fedora7を再インストールしています。LVMなしです。前回同様にネットワーク経由のインストールにすると途中で止まる。しかたなく最低限のソフトのみでとりあえずインストールを行う。yum updateで問題の2.6.22.1-41カーネルを入れる。再起動。あら?あか…

LVM

前回の日記から2週間ほどたち、再度yum updateし、カーネルを2.6.22-1.41.fc7に上げました。が、相変わらず起動しません。2chのPS3の初心者板だとLVMはダメとのこと。yboot.confの起動パラメータのquietオプションを削除し起動すると確かにLVMのVolumeが見付…

yum update注意

今回はFedora7(Coreじゃないんですね)を使っている人向けの情報ちょっとアドエスにうつつを抜かしていて久々にPS3を使った。電源オフ問題もあるのでyum updateで最新版カーネルにならないかなーと思ったら2.6.22カーネルになりそう。喜び勇んでアップデー…

libspe2化

あいかわらず時間がかかりましたが、libspe2対応にしました。サンプルコードやMigration Guideを見ながらコードを変更。ppuとspuとの同期にmailboxとeventを使っていたけど、libspe2だとeventがちょっとわかりにくかったのでmailboxだけにしてみた。が、ここ…

FC7

結局PS3にはFC7を入れました。いろいろ手間がかかったので書いておきます。まずブートローダは昨年12月にインストールしてからアップデートしていませんでしたが、この状態ではFC6のminimum install途中でエラーが発生し、インストールできませんでした。こ…

libspe2

SDK2.1をインストールしました。ドキュメントをみるとlibspe2に移行しろというているし、こちらもlibspe2ベースになっているようなので、移行することにする。とりあえずビルドを通して実機で動かそうとすると動かん。libspe2.soがない。いろいろぐぐるとど…

6スレッド詳細

今回のパッチもいつもの場所に置きました。今回はSPU化は動かすのが第一目的なので速度は二の次です。ですのでDMAでデータを取ってくる処理は全部完了待ちを入れながら処理しますし、SIMD化していません。ですが、せっかくなので速度を見てみます。確認デー…

6スレッド

なんとspuで動くようになったので、マルチスレッドで動くように修正。もともとx264はマルチスレッドに対応しているので、ppuだけでも2スレッド動かせば1.5倍ぐらい速くなる。Pen4のHTみたいなもんですな。今回はspuを使っているので6スレッドで動かしてみる…

やっと動く

ひさびさの書き込みです。前回狙い所としたx264_frame_filter関数のSPU化した部分がやっと動きました。いやー長かった。いえとっくにSPUでは動いていたが、PPUだけで動かしたときと結果が違っていて何がまずいかずーと見ていたらワークエリアのスレッド用の…

ねらい所変更

ひさびさに書きます。x264_macroblock_analyse関数配下をspuに処理させるべく作業を進めていましたが、なかなか進んでいません。ちょっとねらいを変更しx264_frame_filter関数からやり直してみます。前回プロファイルを取ったときの11位の関数です。プロファ…

x264まだ作業中

使っていない関数を外して、マクロで増量したコードを関数化してなんとかLSに収まりました。ここからが大変で、必要なデータをメインメモリからLSに移したり処理結果をLSからメインメモリに戻したりするように直す必要がある。ぼちぼちいきましょう。

x264作業中

昨日のプロファイル結果を元に、x264_macroblock_analyse関数配下をSPU側に移してみる。がコンパイルするとやっぱり256KB越えている。うー。-fno-inlineオプションを付けてもまだ大きい。予想通り大変だ。

パッチ

昨日のパッチはいつもの場所です。

x264プロファイル

SPU化するにあたり、どこがネックか調べるためプロファイルを取ってみる。なぜか32ビットビルド版では変な出力が出るので64ビットビルドする。staitc関数部分はちゃんと出ないようなので、適当にstatic宣言をコメントアウトする。で、gprofの結果。 Call gra…

SDK2.0

ひさびさにps3に戻ってきました。とっくの昔にSDK2.0が出ていたようなのでインストール。開発機は相変わらずFC6だが、makeを細工しなくても無事インストール完了。コンパイラなどのパスが変わったようなので合わせる。面倒くさい。で、x264をビルドすると何…

x264 ppu patch

x264をクロスコンパイルするためのパッチをいつもの場所に置きました。 こちらベースはx264のdaily snapshotです。20061218のコードにパッチが当たることを確認しています。

x264

次なるターゲットは画像エンコ。ということでx264で試してみる。 とりあえずsnapshotをダウンロードして、クロスコンパイル。って、全然通らず。クロスコンパイルはあまり考慮されていないconfigureスクリプト。適当に直してしまう。 ビルドすると今度はalti…

xlc高!

せっかくPS3でFC5が動くのでセルフ開発を基本にしようと思っていたけど、前回のxlcの実力を見てちょっと考えを変えようかと思っています。xlcはi386用しかないので、PCによるクロス開発にしようかなと。普段のブラウザ、メール環境としてもちょっと非力な感…