GPT-5.4 のコーディング性能(SWE-Bench Pro (public))差は、
none と low の差が 3.9%
low と mid の差が 4.1%
mid と high の差が 0.3%
high と xhigh の差が 2.1%
Latency でまとめられており、トークン消費量はグラフに出てない
グラフだけの情報を信じるのであれば、mid が一番お得
openai.com/index/introd...
GPT-5.4 のコーディング性能(SWE-Bench Pro (public))差は、
none と low の差が 3.9%
low と mid の差が 4.1%
mid と high の差が 0.3%
high と xhigh の差が 2.1%
Latency でまとめられており、トークン消費量はグラフに出てない
グラフだけの情報を信じるのであれば、mid が一番お得
openai.com/index/introd...
GPT-5.4 出たんだ
あれ、、5.3 って codex じゃないのって出ましたっけ?
悩みに悩んで FOD F1 チャンピオンコースに課金した。。
amazon go と amazon dash どっちかわからなくなる
Vibram のお靴を購入
ワンサイズ大きい方が良いというのを見たので、M44(日本人サイズ 27.5cm) で
ジャストが M43(日本人サイズ 26.5cm) と1cmも違うので、とても不安
αあんしんプログラム の解約は難しそうだ
保証期間の延長も無効になるというのは、本当なのだろうか
タイムズカーシェアを解約した
理由「一度も利用しなかったため」、、、何のために契約をしたのだろうか。。
整理しようと考えているサブスク
Cerebras(直近1カ月間使っていなさそう。。Google AI Ultra を考えている): $50
YouTube Premium ファミリープラン(Google AI Ultra に含まれる): 2,280円
Obsidian Sync Plus(スマホから見ることが稀なので別の同期で良さそう): $8
ATOK(かわせみ4にしようと思ってる): 660円
ソニーストア(そんなしょっちゅう買わないし、サービスを活用したことない): 550円
タイムズカー(契約してから一回も乗ってない): 880円
U-NEXT(直近2カ月間見てない): 2,189円
Google AI Ultra にするか本気で考えている
Terminal Bench 2.0 でトップになっている "Simple Codex" ってなんでしょう?と思って調べたら、Codex を作っている人たちは知らなかった話
github.com/openai/codex...
zai の coding plan をすごく値上げしたらしいですね
gpt-5.3-codex が使えるようになる codex のアップデートもちゃんと来ている
github.com/openai/codex...
Google AI Pro に Google Cloud の $10 分のクレジットが付与されたの素敵すぎる
www.reddit.com/r/google_ant...
Cerebras Code 専用の CLI が爆誕
github.com/kevint-cereb...
GLM-4.7 のモデルの癖に合わせたチューニングがされていることを期待して使ってみる
AIに頼ってすぐ実装に仕掛かれる、でも焦ってはダメだ(自戒の念
LINQ 楽しそうだし、家族でできそうなので、予約忘れないようにしないと
Cerebras Code で使用できるモデルが GLM-4.7 になったので、試してみようと思うのですが、癖が結構ありそう
www.cerebras.ai/blog/glm-4-7...
試行錯誤してやっと、自力で右の肩甲骨が少し剥がれるようになった
mika ちゃんの在庫ディスプレイがまたw
Codex ブームが去り、Claude Code がまた流行っているけど、そろそろ Gemini CLI ブームが来てもいいのではないかと思っている
血管に良いと聞いて、無糖のココアを初めて飲んだ
意外と悪くない
少しghosttyを使っていたけれど、codex cli で文字入力をする際にシーケンスというのか入力した文字以外の文字列がいっぱい打たれるので、weztermに戻ってきた
くわれている形でなくて、安心しています
たまっていた neovim プラグインの破壊的なアップグレードの対応を少し進めた
今日は CodeCompanion.nvim
最近使っていないのですが、大好きなプラグインなので、ちゃんと使っていきたい
頭が頭痛で痛い