今月も Octopus Energy さんから 1k 超えの請求が来た.そろそろなんとかしてほしい.
@tmaehara
https://www.tmaehara.com/ TCS Researcher & ML Engineer. Brilliant British Foods: https://bsky.app/profile/did:plc:dqxsa5cjfrzulhalom4kuyd2/feed/aaaiqwjhlzavy Bluesky Bots https://gitlab.com/tmaehara/bluesky-newsbots
今月も Octopus Energy さんから 1k 超えの請求が来た.そろそろなんとかしてほしい.
Claude に「証明を一行ずつ追いかけて,間違っているところやフォローできなくなるところがあったら教えてください」をやってる.多分人間より精度高い.
論文で初めて Robertson Seymour を使うことになって嬉しい.これでやっとグラフ理論をやった気がしてきた.
カフェを開いてカフェの所属で論文を書きたい
brilliant weather
線型代数ほんとむつかしい.
ゲージ理論を勉強した結果,グラフ理論の証明が大幅に簡略化された(やったぜ).
Claude, Gemini, ChatGPT の中だと Claude が二回りくらい品質の高い査読を返してくれる.とりあえず Gemini が一番ひどい.
なんか知らんがゲージ理論を勉強することになったぞ.どういうことだ.
上が Claude Code の使用トークン数を KPI にしたため独走体制になった.
おしごとで使ってます。チームレベルで git で管理していて、典型的な開発手順(これをやるときはこのファイルを編集しましょう的なもの)とか、oncall の知見とか(このエラーのときはここを見よ的なもの)が勝手に適宜アップデートされてます。
「これらの主張の証明複雑だけどうまく一般化したら簡単にならんかね?」って AI に聞いたら「conservation law of proof complexity」と言われて説得されてしまった.
Lean、おもちゃとして面白いけど自分が示したいことを示すには全然遠い。組合せ論パズルとかAIの得意分野であるべきだと思うけどインフラが揃ってないせいでダメ。
brewdog 閉店さみしい.よく work from pub をしてた場所なので.
サンプルサイズそのものは多い(→ scalability は気にしてる)んですけど,分散を評価するためには同じデータセットに対して複数回アルゴリズムを走らせないといけなくて,それを各位サボってますね(→ statistical correctness を無視してる).LLM 系の一発実行するだけで1ヶ月飛ぶようなやつはしゃあないんすけど.
読み終えた。後半は結構知らない話だった。postgresいつの間にかスイスアーミーナイフになってたんだなあ。
奇書と思って読んでたけど思ったより面白い。知識の整理に良い。
Just Use Postgres! なる奇書を読んでる
✨
うおお研究の雑談をしたいうおお
理論の論文だし,実際しても差なんか出ないのがわかってるのに,AWS で GPU 借りて実験をぶん回すの結構悲しいものがあるな.
これが本当に正しい気がしてきた.まともに標準偏差の推定値を得ようとしたら N=50 とか N=700 とか必要になるけど ML の実験でそれは非現実的だから,統計的な信頼度はそもそも期待しておらず,「複数回実験したけど壊れませんでした」のエビデンスととらえたら N=3 になる気がする.
何回か実験した感を出すのに重要(おしまいの世界)
読んだ複数のML論文がサンプル数3で標準偏差を計算してるんですけど,これなんの意味があるんですか.
実装のイメージが無い人が設計をやれる気があんまりしないので,「実際の実装はこれのすごいバージョンだ」を掴む程度のプログラミング演習は必要な気がするんですよね.中学校でやる木工・半田付けとかの立ち位置として.
三角関数はよく使うけど検索が難しいのでちょっとやっかい.ぱっと思いつくのはこれとか
ieee-focs.org/FOCS-2018-Pa...
「フーリエ変換はコンピュータサイエンスの対象ではない」と言ってる方を見たけど,こういうのは分野の人がどう考えているかを見るべきで,FOCS がフーリエ変換のワークショップを開催している以上,フーリエ変換はコンピュータサイエンスの対象です.
groups.csail.mit.edu/netmit/sFFT/...
British traditional Paella
いずれプログラムを書くかもしれないと思って設計されたプログラミング演習と、いずれ AI にプログラムを書かせるかもしれないと思って設計されたプログラミング演習は違うはずなんだけど、後者がどうあるべきかはよくわかんない。
多項式大好き!一番好きなタコです!