Kaggle Grandmasterだったり、atmaCupとかkaggle days championship得意だったり、LLM開発してたり、麻雀好きだったり。息子が可愛すぎてすばら!

Joined January 2010
246 Photos and videos
Pinned Tweet
Mar 10
AgenticRL含め、LLMのAgenticな能力を高めるためのPostTrainingで具体やったこと・学びなどブログ3本分くらい詰め込んだ記事書きました! Tool UseやDeep Researchなどの強化学習まわりの情報は、まだまだ少ないと思うので、知見共有できればです! tech-blog.abeja.asia/entry/g…
32
185
50,481
何もわからんけど、良い同点だった気がする!!
2
273
同点!!!!
2
224
うおおおお!!!
2
261
ぐはぁ
1
197
解説より実況のほうがオランダ選手に詳しいの面白いw
1
517
これめっちゃ面白い〜〜 Agentic RL やってる人にとってはありえん刺さる記事!
LLMのRLで、MegatronやTRLとvllm/SGLangで出力が一緒じゃなくてそうなると、、、的な話であるRollout Correction についてまとめました! tech-blog.abeja.asia/entry/l…
1
3
20
7,215
pao retweeted
国産ヒューマノイドを作る会社を創業しました!!!!!!!!毎日頑張ってます!!!!!!!!
25
167
1,054
75,765
May 25
最近、Claude Codeの喋り方がルー大柴みたいになってきてるの私だけ...??
1
2
10
2,284
May 13
W&BさんのAgentic RLのwhite paperに寄稿させていただきました!! LLMのRLの基本から学べる内容になってると思うので、よければダウンロードください!
Agentic RLのwhite paperを書きました 🗒️ W&B社内では @nejumi_dqx と章を分担し、 またなんとABEJAの @pppaaaooo よりAgentic RLの実装上のリアルなTipsを寄稿いただきました! Agentic RL は注目度が高まっている一方で、まだ体系的にまとまった資料が少ない領域だと思っています。 本資料では約60ページにわたり、 -GRPO / GSPO などのアルゴリズム解説 -Agentic RL の定義 -Agentic RL の実践 -Agentic RL を支える W&B の機能 などをまとめています。 誰でも無料でダウンロードできるようにしています。コミュニティへの貢献になっていれば嬉しいです! Agentic RLはAgentとモデル学習がどっちも味わえる面白い領域です! 誤りや改善点などあれば、ぜひフィードバックいただけるとありがたいです ダウンロードは thread から ↓
1
4
52
5,908
Apr 30
数々の偉業と感動をありがとうございました! プレースタイルも好きでした! BIG4の時代にトップレベルで戦える日本人男子がいた奇跡、忘れません!
5
1,093
Apr 16
RT @odashi_t: LLM-jpを期待してもらえるのはよいのですが、それでR社とかを同時に言及して下げるのはちょっと…プレスは駄目だったけどモデルはいいものだと思いますよ。 継続学習やチューニングは独自の難しさがあるし、自分は事前(中間)学習は分かるがチューニングは素人…
4
Apr 15
開始!
Apr 10
人工知能オリンピックのコンペ設計の意図など話します!
1
859
Apr 15
直接面識はないですが、萩原さんのやられていたステート・オブ・AI ガイドにはお世話になり、学ばせていただきました。 御冥福をお祈りいたします。
Dear Friends, this is Masato's wife Lynn typing. It is with a heavy heart that I share that Masato passed away peacefully yesterday. Thank you for keeping him in your thoughts. You can follow this page for memorial details: caringbridge.org/site/b0895f…
1
5
2,629
Apr 10
人工知能オリンピックのコンペ設計の意図など話します!
【4/15開催】JOAI2026講評会、いったい何が聞けるの?中身を紹介します📣 第一部:JOAI委員会による総括 ・JOAI2026全体の振り返り ・各問題に込められた狙い ・「なぜこの問題を出したのか」を作問者本人が解説 第二部:上位入賞者による解法紹介 ・トップ層は何を考え、どうコードを書いたのか ・解法のアイデアと試行錯誤 ・本人の口から直接聞ける貴重な機会 第三部:スポンサーセッション 論文や記事では得られない「同世代トップの思考プロセス」を、生の言葉で聞けるイベントになっています✨ 日時:4/15(水)19:00〜21:00 形式:オンライン(Zoom)/参加費 無料 申込はこちら! joai-commitee.connpass.com/e…
1
13
2,440
pao retweeted
各所で言われてるけどほまにこれ
88
8,664
39,722
1,249,511