せっかくだからレンダラを作っていく様子を動画とかにして投稿していこうかな。Windows VMを使って合成音声を動かすフローができたのでLinux上でも合成音声を使った動画が作れるようになったので。
せっかくだからレンダラを作っていく様子を動画とかにして投稿していこうかな。Windows VMを使って合成音声を動かすフローができたのでLinux上でも合成音声を使った動画が作れるようになったので。
さて、また懲りずにレンダラーを作るのをやっていこうかな。今度はAIをメインに使いつつ実装してみたい。AIの実力を知るという意味で自分に多少なりとも知識がある領域を実装させてみて強さを思い知ってみようということで。
自分で喋れば合成音声の読み方修正のような面倒な作業がなくなりサクッと作れるかなと思ったのですが、実際のところは自分が原稿を読み上げても読み間違えたりつっかえたりして結局読み直して切り貼り編集する手間があるのでさほど変わらず。それなら合成音声で良いかなと思ったので……。
YouTubeに先月アップロードした動画、自分が喋っているのが厳しい気分になってきたので合成音声のものに置き換えて投稿し直しました。
自分の声がちょっと厳しく感じてきたので合成音声に置き換えたバージョンで再投稿してオリジナル版は非公開にしました🙏
www.youtube.com/watch?v=Q_P7...
帰宅。お疲れ様でした。
なんとか飛ばしまくって9分30秒程度まで縮めることができた。あとは本番もこのスピードでつっかえずに喋れれば良い。いやー、やっぱり15分枠にしておくべきだった。
発表練習をしているが枠が10分のところ飛ばしまくっても15分でさらに大幅に削っても11分だった。ちょっとどうしたものか。15分枠で申し込んでおけばよかったわ……。
なんとか明日の資料ができた……。あとは明日の朝にこれを10分に収めて話す練習をすればなんとかなるかしら。
SIGGRAPH Asia 2025勉強会の資料作成が地味に終わらないわ。頑張りが必要。
latentの変換は学習で最適化する線形変換なのかな?重たいNNは必要ないっぽい?
この手法でできるのはRGBでの相互反射の色歪みをスペクトラルっぽくすることであって、dispersionのような波長依存にtransportの経路自体が変わるのは無理そう。でもなかなか面白い研究だわね。
latentからスペクトルベースの色の復元は、latent同士のレンダリングの計算で必要な演算(スカラー倍や加算や要素積)などを行った場合にスペクトル側でもそれらの演算をした場合と同じになる、というような制約を満たすようなlatentを考えるのかな?近似になるみたいだけど。
パックしたlatenベクトルの評価を2 RGBだけやるだけでスペクトラルレンダリングっぽくできるという論文?ティーザー画像でRGBレンダリングでは相互反射が色が歪むけど(右)、この手法(左)だとk=6でRGBを2つぶんのサイズを計算するだけでGT(中央)に近い色が出せている。
arxiv.org/abs/2602.18741
私も後でこれを実装してみたいな。以前にベジェ図形の塗りつぶしを作ったときは地味にスキャンラインでのwinding number判定で地味に漏れたり方程式の根が不動小数点のエラーに引っかかったりで上手く塗りつぶしができないとかで苦労した覚えがあるけど。
同じ方の書かれたこちらの方もベジェの塗りつぶしをするうえで非常に役に立つ記事でした。
zenn.dev/yayo1/articl...
👀
> Important: Added support for pxr/usd libraries and tests under wasm32 and wasm64.
github.com/PixarAnimati...
入門として「そういう世界があるんだ」と知るにはよいけど、深く内容を知りたいとなるとこの本だけでは全然完結しない点ではあれかも。まあ広く引用が多いので概要を薄く広く分野外の人がそういう分野があるんだと知るには悪くはなかったかなということで。
おすすめとは書いたけど、この本だけではいろんな文献を引用するだけで入門の入口にしかならない感じはあります。ちゃんと勉強したかったら引用されている文献を当たらないといけないんだろうなあという感じ。タイトルのプラスチックの清潔の話も別にそんな深堀されるわけでもないし。
感覚史をやっている人にとって感覚とはどこまでの範囲で定義されているのか、あるいはあえて定義を狭めずに広く感覚にまつわる歴史と社会の動きを取り上げるという態度が一般的なのか、みたいなことが気になったりしました。面白い本だったのでおすすめです。
www.heibonsha.co.jp/book/b669948...
感覚と言ったときに五感のセンサーとしての感覚と、どういう心情を抱くかと言うような感覚は、同じ感覚というワードを使っていても別物のような気がしていたのですがこの本ではあえて両方の側面を扱っているのかなあという感覚を覚えました(感覚だけに)
「感覚史入門 なぜプラスチックを「清潔」に感じるのか」という本を年末からちまちまと読んでいたのですがようやく読み終わりました。私達が当たり前に感じる感覚がデザインされて作られていたり歴史の流れで生まれたものだったり。そしてそれが差別や階層構造にもつながっていたり。
SIGGRAPH Asia 2025勉強会に参加登録した。担当セッションは個人的興味から普段やっていることとは違う領域を選んだのでpaperの解説説明がちょっと怪しくなるかもですが、どうぞよろしく。
siggraph.xyz/sa2025/
今更ながらプロジェクトヘイルメアリーの小説上下を読み終わった!幸運なことにネタバレを事前に食らうこと無く。これはたしかに評判に効く通りの良いSFですね。科学的なワクワクがこれでもかと詰め込まれているわ。
有給を使って超かぐや姫!を映画館で見てきた。あんな満席の映画館は始めてだったかも。
まあ作るならレイトレ合宿に向けてリアルタイムよりオフラインよりのレンダラを作らせてみよかな。ギリギリになってレンダラを書くのは厳しいので早め早めに。
何度かやり取りの往復はあったとは言え、自分で1行も書かずに私の頭の中にあるものがここまで作られて出てくるのは楽しい。このままレンダラ作成を任せたままどこまで行けるか試してみようかな。
descriptor_heap拡張を試してみたいなあと思い、自分の環境にベータドライバーを入れて上書きするのはちょっと怖いのでAWSのEC2のGPUインスタンスで試そうと思ったけどg5.xlargeのGPUでNVIDIAのbetaドライバーを入れてもvulkanが上手く動かんかったわ。
なんか見落としてる気もするけど、まあ大人しくstableのドライバでVK_EXT_descriptor_heapが動くようになるまで待つかあ。
slangのVulkanの新しいVK_EXT_descriptor_heapの対応はまだなのかな。GL_EXT_descriptor_heapのlayout(descriptor_heap)的なものがslangには無さそうに見える。一応以下にissueは上がっているけど……。
github.com/shader-slang...