Joined March 2013
159 Photos and videos
Mengsay Loem retweeted
テックブログ公開 Day5です FlashAttentionや昨今のHardware Awareな高速化手法を理解したり、提案したりする上で必須となるCUDA Programmingに関して、基礎から解説していくブログシリーズの第一弾です。3万字超えのブログですが、かなり分かりやすく書いていますのでぜひご覧ください。 CUDA Programming Guide Part 1|Kazuki Fujii zenn.dev/kaz20/articles/1e62…
テックブログ公開 Day4です。 RLVR(強化学習)時代において欠かすことのできないweight syncの機能についてvLLMがどのようにこれを実現しているのかやさしく解説を行いました。 RLVR時代におけるInference Framework: Weight Syncing編|Kazuki Fujii zenn.dev/kaz20/articles/e3c5…
2
93
508
58,426
Mengsay Loem retweeted
GENIAC 4期に採択されました!主任としてリード頑張ります
Sansan株式会社は、国内の生成AI基盤モデル開発支援プロジェクト「GENIAC」に2年連続で採択されました。 採択された「文書に特化した指示追従能力の高い視覚言語モデルの開発」というプロジェクトを通じて、AI技術の発展と、多様なビジネス課題の解決に貢献します。 jp.corp-sansan.com/news/2026…
1
8
41
5,142
Mengsay Loem retweeted
今年もやっていき
Sansan株式会社は、国内の生成AI基盤モデル開発支援プロジェクト「GENIAC」に2年連続で採択されました。 採択された「文書に特化した指示追従能力の高い視覚言語モデルの開発」というプロジェクトを通じて、AI技術の発展と、多様なビジネス課題の解決に貢献します。 jp.corp-sansan.com/news/2026…
1
21
3,262
Mengsay Loem retweeted
Meet Gemma 4 12B! A unified, encoder-free multimodal model designed to bring high-performance intelligence directly to your laptop, and released under an Apache 2.0 license. Bridging the gap between edge efficiency and advanced reasoning. Here is what’s new with Gemma 4 12B: 👇
404
1,793
12,376
3,184,467
Mengsay Loem retweeted
We just posted our paper: “M^3 Scaling Law: Optimizing Multi-Epoch, Multi-Lingual, and Multi-Stage Training for Low-Resource Language Models.” Joint work with @kanaheinousagi and @stillpedant. In this thread, I’ll explain the main idea and key findings. (1/N)
1
5
15
4,294
Mengsay Loem retweeted
#NLPコロキウム での発表で使用した「攻めのAI安全性:必知論文N本🔥」の拡張版スライドを公開しました! 関連研究を追加し、内容がさらにパワーアップしています💪 ぜひご覧ください! speakerdeck.com/kanekomasahi…
2
32
142
12,310
Mengsay Loem retweeted
テックブログ公開 Day4です。 RLVR(強化学習)時代において欠かすことのできないweight syncの機能についてvLLMがどのようにこれを実現しているのかやさしく解説を行いました。 RLVR時代におけるInference Framework: Weight Syncing編|Kazuki Fujii zenn.dev/kaz20/articles/e3c5…
テックブログ公開 Day 3.5です。(軽めの記事なので1日2本にしています) VSCodeのRemote SSH機能を使いスパコンなどの上で作業をしている際に稀に直面する問題について、具体的な症状と解決方法について記しました。 [Tips] vscode remote-ssh updateで発生する問題|Kazuki Fujii zenn.dev/kaz20/articles/e0db…
21
134
49,245
Mengsay Loem retweeted
*ACL論文の執筆方法について書きました。 「この研究お気に入りなのに、いいスコアがつかない」などお悩みの方は読んでみてください。少しは参考になるかも? もっと議論したい方は学会等でお声がけください。ACLは現地参加予定です。2本oralで発表します。 gucci-j.github.io/post/acl-p… #NLProc
11
78
5,367
Mengsay Loem retweeted
I wish companies would include even one line of feedback when rejecting job applications. I know they receive a massive volume, but even a templated reason would be incredibly helpful! 🚨I am currently seeking full-time NLP/ML research roles!🚨 Profile: gucci-j.github.io/about/
5
18
2,824
Mengsay Loem retweeted
安全性の本を執筆しました!!! AI Safetyの技術を余すことなく体系的に学べるよう、単著で1年以上書き続けました。 これまでLINEやSB Intuitionsで安全性の分野に携わり続けてきましたが、この一冊にそれらの経験や知識を凝縮しました。 皆さんのお手元に届くことを心待ちにしています。
【新刊】2026年6月24日発売『生成AIの安全性入門』本体3,000円 税,綿岡晃輝 著,安全なAIを実現するための終わりなき挑戦gihyo.jp/book/2026/978-4-297…
76
331
51,287
請求書ドメインのモデル構築からプロダクトへの実装までやりました
Sansanは、国家プロジェクト「GENIAC」で開発した文書特化型AIモデル「Cello」をContract OneとBill Oneへ実装。 高精度かつ高速なデータ化により、企業のAI活用と業務効率化をさらに後押しし、労働生産性の向上にも貢献します。 jp.corp-sansan.com/news/2026…
1
6
1,104
Mengsay Loem retweeted
📢 大規模日本語マルチモーダル事後学習データセット「Jagle」を公開しました! JagleはLLM-jp-4-VL 9B betaの学習でも用いられており、日本語タスク性能の向上に貢献しています。 VLMの学習にぜひご利用ください。 huggingface.co/datasets/llm-…
1
45
239
27,232
Mengsay Loem retweeted
Swallow Leaderbord v2で評価したモデルの中で顕著だったのがGemma 4 31Bです。多くのベンチマークタスクでトップクラスの性能で、フロンティアモデルに匹敵します。JamC-QAや機械翻訳の性能の高さから、日本語にも強いモデルと言えます。 詳細な結果はこちら: swallow-llm.github.io/leader…
1
38
187
23,994
Mengsay Loem retweeted
Gemma 4 just got even faster! We're releasing Multi-Token Prediction (MTP) drafters that deliver up to a 3x speedup, without any degradation in output quality or reasoning logic.
98
353
3,346
206,694
When LLMs Don’t Speak Your Language: Three Surprises in Adaptation Research medium.com/p/when-llms-dont-…

1
83
Mengsay Loem retweeted
We propose HATCH🐣, a human-inspired training framework for multi-image spatial reasoning in VLMs 🐤 HATCH improves multi-image spatial reasoning ability while preserving single-image reasoning capabilities 🐓 📚️arxiv.org/abs/2602.08735
Two first-author papers accepted to #ICML2026 🇰🇷 ! - Human-like multi-image spatial reasoning in multimodal LLMs (@silviasetitech @sponddd @dai0NLP Prof. Inoue @chokkanorg) - Autoregressive direct preference optimization (Mahiro Ukai @MasahiroKaneko_ @chokkanorg Prof. Inoue)
6
23
1,731
Mengsay Loem retweeted
Two first-author papers accepted to #ICML2026 🇰🇷 ! - Human-like multi-image spatial reasoning in multimodal LLMs (@silviasetitech @sponddd @dai0NLP Prof. Inoue @chokkanorg) - Autoregressive direct preference optimization (Mahiro Ukai @MasahiroKaneko_ @chokkanorg Prof. Inoue)
1
20
95
22,562
Mengsay Loem retweeted
Excited to present SureLock at #ICLR2026 🇧🇷 — a principled decoding method that locks converged tokens in Masked Diffusion Language Models, cutting 30–50% FLOPs at same quality! w/ @Bollegala @MasahiroKaneko_ @chokkanorg 🕙 Friday, 24th April, 10:30 AM 📍Pavilion 3 (#826)
11
35
4,080
Mengsay Loem retweeted
#NLP2026参加報告会 に参加してくださった皆様、登壇してくださった皆様、ありがとうございました!!! 是非、来年のNLPでお会いしましょう!!!
4
9
1,911