SBIntのレッドチームのやつ、3/3でハルシネーション起こさせたけど、定義にあてはまらないっぽくて、なんかよくわからなかった。
SBIntのレッドチームのやつ、3/3でハルシネーション起こさせたけど、定義にあてはまらないっぽくて、なんかよくわからなかった。
本数がどうのこうのの議論は一旦置いといて、シンプルにどうやったら、このペースで論文書けるんだろう。弟子入りしたい。AIマシマシ+ジャンク気味でも僕は頑張って1日2,3ページが限度だし、通すクオリティまで持っていこうとすると、1日半ページが限度なので、まじで学びたい。
x.com/i/status/203...
なんかいたたまれなくなって、つい投げ銭してしまった...自分が直近で抱えてる問題を反映しているようだ。こう、学生に迷惑かけるくらいなら、さっさと引退すべきやなと毎回考える。そしてこの子、バイタリティ凄いな...
x.com/i/status/203...
ありがとうございます。actだと来年以降予算回らないので、さきがけに集中しようと思っています。というか片っ端から申請できるやつ申請しようかと。去年論文に振りすぎたので、今年は予算で。(これくらいやらないと、生き残るの難しいってかなりアカデミアの競争厳しいんですね...)
公費も共同研究費も自分に入ってくるの0で、共同研究取ろうにもボス名義じゃないとあかん言われる。実質競争資金しかないが、来年度スタート支援と若手と民間とって現状300万ちょっと。ここから渡航費とか出していったらインフラに当てれる金がまじでない。今まで甘えてただけと言われればそうだけど、イニシャルコストにかかる費用も工面されない中でこれは厳しい...
自分の研究はこれ見越してGPUとか使わない方向になんとか持っていけた一方、やっぱ学生のやつがね...インフラ握られてるのは痛い...こんなところで変なリスクヘッジしないといけないのが...呉越同舟でラボの発展のためならと思ってたけど、そうでもないらしい。そしてこんなギスギスを学生の前で見せちゃったのがほんま申し訳ない...小講座でこれなんだから、大講座なんて絶対無理だと思う...
これほんま切実で、現状、マネーの虎みたいな激詰めされたあとに、タダでやれとか、ボスを通せって言われるを繰り返してる。なので、論文という明確な目標決まっていて、かつお金を自分名義でくれるのは、ほんま貴重。ラボにお金入っても昨日みたいに突然サーバのオーナーじゃないだろって言われて閉め出されるみたいなのが、ついに表面化しちゃったので、まじでどうしましょう...
ACL/EMNLP確約で未達ならポケットマネーから返金みたいな共同研究を100万で売り込みにいくことが今回の目標。別に10万とかでもいいけど、大学の最低金額がそこなだけ。それくらい切羽詰まっているということ...
別に鉄オタというわけではないが、往復割引券廃止直前&ちょうど600km越えるので、記念にこれ使おう。
emergencyで割り当てられた論文が面白すぎる。大量のゴミの中にこういうのが混ざってるし、レビューの機会がないと論文読まなくなっちゃうので、まあこれでええんかな...早速学生に割り振りましょう。あるいは自分でやっちゃうか。
NLPの賞審査、1人のウェイトが高すぎる上に、3以上つけにくくなってるので、1人が5で、もう一人2とかつければかなり高い評価になるんじゃねとは思ってる。オール2は技術で可能な一方、一人がフィーバーするようなのってなんだろう。僕みたいに1論文20秒くらいで終わらせる人もいればじっくり考えてくれる人もいるわけだから、そういう意味では構造的なガチャ要素もかなりあるんかな。良いか悪いのバイナリ評価か、1-5が正規分布になる評価方法だと結果ガラリと変わりそう。
シンプルに毎回査読したらなんやかんや10本単位で割り振られるので、嫌になる。2ヶ月ちょいで全部終わらせようとするのが原因。reviewだけで時間溶ける...
ARR、レビュワー側で緊急の問い合わせがあったので、2週間ほぼ毎日連絡いれてたのに、ずっと無視され続けたことにまずイラッと来る。そして、emergencyで勝手にassign(not invitation)されたと思ったら、直後にreview完了してないからirresponsible reviewerだってメールきて、共著者への誤り行脚が発生したり。
結局のところ、ossモデル使ってもできる領域に対して、なんでわざわざフルスクラッチで作っているのか、という根本的な質問には答えきれていないのが深刻さを物語っていそう。使い方の部分で優位性だそうとするなら、大量に競合がいるんだから、ほんまに社名で案件とってくるくらいしか活路ないんじゃないの?って詰められたら、言い返せなさそう。
ここも、若干論点が成熟してないと感じていて、toBのニッチ領域がどうたら言い出すと、じゃあ適当なossモデル使ってどうにかすれば良いじゃんってなる。いよいよ松尾研ベンチャーとかと変わらなくなってくるから、この方向の負け惜しみみたいな文言はさらに自分たちの首絞めてるなって思った。
x.com/i/status/203...
ARR二度と自分の論文投稿しないし、レビューも極力引き受けないことを決意。あまりに杜撰すぎる。
Desk-rejection violationのことをhonest mistakeって表現するの、まじで嫌い。表現変えたらなんでもありなんか。
いまになって、acl2025の論文のパンチが利いてるな。大半のinstruction followingのベンチマークはinstruction following能力測っていないだろうって批判が込められている。ただ従えるか測ることになんの意味もないよなってふと思った。
明らかなdesk案件あって、2週間近くずっとPC/SACに連絡いれてるのに、一向に反応がない...ボスにもコンタクトとってもらったり、mailも投げてるけど、うんともすんとも言わない...metareviewしないとdeskにするって脅しメールだけ届く一方通行のコミュニケーション。上から腐ってるからARRまじでくそ。
旅費の上限上がったってことは、国際学会参加費がまた高くなるのか...正直、自分の分は自費とかで圧縮して良いが...さて。
ここまではなんとか対応できるにしても、小刻みにジャーナルだせる医学部とかの権力強くなりそうで、学内政治バランスがとんでもないことになりそうと予感。
Top10%論文、僕の理解が正しければweb of scienceに掲載ジャーナルに限定されるし、その中での引用ネットだから、conferenceメインの情報系は相当不利だと思う。そもそも集計対象外。TMLRもあかん。最適解がJMLR/TACL/TPAMIに大量に通すか、ギリギリ掲載されてる分野の主流ではない雑誌に載せるか。うーん...
みんなで応募しよう。自分にとっては、まじでドンピシャすぎる...
job-boards.greenhouse.io/deepmind/job...
ARRの問題点、resubmitしても前回のスコアでコミットできるので、今回のaclみたく実質2回チャンスあると、前回の点をさらに上げようともう一回コミットして、スコア落ちて、rebuttalもしないで今回分を損切りする、みたいな投稿が出てくるところだと思う。つまりレビュワーは無駄なレビューされられたってことだし、今回の指摘も徒労で終わり。最新のやつのみしか投稿できないとかならんのかな。シンプル不快。
ありがとうございます。今年はJSTも民間もありったけだそうかなって思っています。1年に集約しても(学生分含めた)国際会議の参加費で一瞬で消えるので、重複制限が足枷になるくらいなら、放棄して新しいやつトライする選択肢ってとれるのかなとふと疑問に思った次第です。
なんか気づいたら、今年もう2ヶ月過ぎてる...そして半年前に書いた申請書の中身読んで、テーマを必死に思い出してる。もうLLM評価もテキスト生成も自分の中では終わったテーマってかんじなので、さてどうしましょう。1年間だけ貰って、2年目以降放棄して、別なやつ応募するみたいなことできないんかな。
逆に有効区間とp値載せてる論文のほうが怪しさ出てきてて、もうなにも信じられない...ちょっと試しに次のレビューとかでq値、r値とかアルファベット適当に言って、値だしてくるか検証してみよ。
シンプル疑問でconference文化でNLPより書く分量少ない分野ってどこあるんだ...speech/robotとかはジャーナル整備されてるし、MLはもうちょい書ける。shortの存在とか考えたら、一番やんちゃやってる分野なのかもしれない。
やっぱNLPの論文短すぎな気がしてきた。long 12page、short 8ページとかどうだろう。あまりに薄っぺらい論文多いので、ページ数縛ったら多少はましになるのではと思い始めてきた。さすがに12ページなら駄文で水増ししたらクオリティ下がるでしょう。conferenceのページ制限に助けられてる論文多くて情けない。