しるびあ

しるびあ

159 Photos and videos

Tweets

Mengsay Loem retweeted

しるびあ

@silviasetitech

だいぶ前に書いたのが出ました日本語視覚言語モデルのタスク横断評価と実証的分析 jstage.jst.go.jp/article/jnl…

日本語視覚言語モデルのタスク横断評価と実証的分析

視覚言語モデル (Vision–Language Model; VLM) は急速に発展しているが，日本語における評価はタスクや領域ごとに散在しており，能力の全体像と妥当な比較を一貫して捉えにくい．本研究は，日本語に対応するVLMの能力を総合的・体系的に測る評価基盤を構築し，タスク横断の実証評価を示 …

jstage.jst.go.jp

913

Kazuki Fujii

Mengsay Loem retweeted

Kazuki Fujii

@kazukifujii

Jun 4

テックブログ公開 Day5です FlashAttentionや昨今のHardware Awareな高速化手法を理解したり、提案したりする上で必須となるCUDA Programmingに関して、基礎から解説していくブログシリーズの第一弾です。3万字超えのブログですが、かなり分かりやすく書いていますのでぜひご覧ください。 CUDA Programming Guide Part 1｜Kazuki Fujii zenn.dev/kaz20/articles/1e62…

Kazuki Fujii

@kazukifujii

May 31

テックブログ公開 Day4です。 RLVR(強化学習)時代において欠かすことのできないweight syncの機能についてvLLMがどのようにこれを実現しているのかやさしく解説を行いました。 RLVR時代におけるInference Framework: Weight Syncing編｜Kazuki Fujii zenn.dev/kaz20/articles/e3c5…

508

58,426

Wataru Hashimoto

Mengsay Loem retweeted

Wataru Hashimoto @hashing52

Jun 4

GENIAC 4期に採択されました！主任としてリード頑張ります

【公式】Sansan

@SansanJapan

Jun 4

Sansan株式会社は、国内の生成AI基盤モデル開発支援プロジェクト「GENIAC」に2年連続で採択されました。採択された「文書に特化した指示追従能力の高い視覚言語モデルの開発」というプロジェクトを通じて、AI技術の発展と、多様なビジネス課題の解決に貢献します。 jp.corp-sansan.com/news/2026…

5,142

さしすせ奏

Mengsay Loem retweeted

さしすせ奏 @s_aiueo32

Jun 4

今年もやっていき

【公式】Sansan

@SansanJapan

Jun 4

3,262

Google Gemma

Mengsay Loem retweeted

Google Gemma

@googlegemma

Jun 3

Meet Gemma 4 12B! A unified, encoder-free multimodal model designed to bring high-performance intelligence directly to your laptop, and released under an Apache 2.0 license. Bridging the gap between edge efficiency and advanced reasoning. Here is what’s new with Gemma 4 12B: 👇

404

1,793

12,376

3,184,467

K. Akimoto

Mengsay Loem retweeted

K. Akimoto @kosuke1701

Jun 3

We just posted our paper: “M^3 Scaling Law: Optimizing Multi-Epoch, Multi-Lingual, and Multi-Stage Training for Low-Resource Language Models.” Joint work with @kanaheinousagi and @stillpedant. In this thread, I’ll explain the main idea and key findings. (1/N)

4,294

Masahiro Kaneko

Mengsay Loem retweeted

Masahiro Kaneko @MasahiroKaneko_

Jun 2

#NLPコロキウムでの発表で使用した「攻めのAI安全性：必知論文N本🔥」の拡張版スライドを公開しました！関連研究を追加し、内容がさらにパワーアップしています💪 ぜひご覧ください！ speakerdeck.com/kanekomasahi…

NLP colloquium: AI Safety Survey

speakerdeck.com

142

12,310

Kazuki Fujii

Mengsay Loem retweeted

Kazuki Fujii

@kazukifujii

May 31

Kazuki Fujii

@kazukifujii

May 30

テックブログ公開 Day 3.5です。(軽めの記事なので1日2本にしています) VSCodeのRemote SSH機能を使いスパコンなどの上で作業をしている際に稀に直面する問題について、具体的な症状と解決方法について記しました。 [Tips] vscode remote-ssh updateで発生する問題｜Kazuki Fujii zenn.dev/kaz20/articles/e0db…

134

49,245

Atsuki Yamaguchi

Mengsay Loem retweeted

Atsuki Yamaguchi @_gucciiiii

May 31

*ACL論文の執筆方法について書きました。「この研究お気に入りなのに、いいスコアがつかない」などお悩みの方は読んでみてください。少しは参考になるかも？もっと議論したい方は学会等でお声がけください。ACLは現地参加予定です。2本oralで発表します。 gucci-j.github.io/post/acl-p… #NLProc

ACL論文執筆のヒント

ACL系列の国際学会に向けた論文執筆のコツ

gucci-j.github.io

5,367

Atsuki Yamaguchi

Mengsay Loem retweeted

Atsuki Yamaguchi @_gucciiiii

May 25

I wish companies would include even one line of feedback when rejecting job applications. I know they receive a massive volume, but even a templated reason would be incredibly helpful! 🚨I am currently seeking full-time NLP/ML research roles!🚨 Profile: gucci-j.github.io/about/

Atsuki Yamaguchi

A Technical Blog about NLP and ML

gucci-j.github.io

2,824

綿岡(わたおか)

Mengsay Loem retweeted

綿岡(わたおか)

@Wataoka_Koki

May 20

安全性の本を執筆しました！！！ AI Safetyの技術を余すことなく体系的に学べるよう、単著で1年以上書き続けました。これまでLINEやSB Intuitionsで安全性の分野に携わり続けてきましたが、この一冊にそれらの経験や知識を凝縮しました。皆さんのお手元に届くことを心待ちにしています。

技術評論社販売促進部

@gihyo_hansoku

May 20

【新刊】2026年6月24日発売『生成AIの安全性入門』本体3,000円税，綿岡晃輝著，安全なAIを実現するための終わりなき挑戦gihyo.jp/book/2026/978-4-297…

331

51,287

Mengsay Loem

Mengsay Loem

@loem_ms

May 19

請求書ドメインのモデル構築からプロダクトへの実装までやりました

【公式】Sansan

@SansanJapan

May 19

Sansanは、国家プロジェクト「GENIAC」で開発した文書特化型AIモデル「Cello」をContract OneとBill Oneへ実装。高精度かつ高速なデータ化により、企業のAI活用と業務効率化をさらに後押しし、労働生産性の向上にも貢献します。 jp.corp-sansan.com/news/2026…

1,104

Issa Sugiura

Mengsay Loem retweeted

Issa Sugiura @strayer_13

May 12

📢 大規模日本語マルチモーダル事後学習データセット「Jagle」を公開しました！ JagleはLLM-jp-4-VL 9B betaの学習でも用いられており、日本語タスク性能の向上に貢献しています。 VLMの学習にぜひご利用ください。 huggingface.co/datasets/llm-…

239

27,232

Naoaki Okazaki

Mengsay Loem retweeted

Naoaki Okazaki @chokkanorg

May 8

Swallow Leaderbord v2で評価したモデルの中で顕著だったのがGemma 4 31Bです。多くのベンチマークタスクでトップクラスの性能で、フロンティアモデルに匹敵します。JamC-QAや機械翻訳の性能の高さから、日本語にも強いモデルと言えます。詳細な結果はこちら: swallow-llm.github.io/leader…

187

23,994

Google Gemma

Mengsay Loem retweeted

Google Gemma

@googlegemma

May 5

Gemma 4 just got even faster! We're releasing Multi-Token Prediction (MTP) drafters that deliver up to a 3x speedup, without any degradation in output quality or reasoning logic.

353

3,346

206,694

Mengsay Loem

Mengsay Loem

@loem_ms

May 5

When LLMs Don’t Speak Your Language: Three Surprises in Adaptation Research medium.com/p/when-llms-dont-…

Masanari Oi

Mengsay Loem retweeted

Masanari Oi @stjohn2007

May 1

We propose HATCH🐣, a human-inspired training framework for multi-image spatial reasoning in VLMs 🐤 HATCH improves multi-image spatial reasoning ability while preserving single-image reasoning capabilities 🐓 📚️arxiv.org/abs/2602.08735

Masanari Oi @stjohn2007

May 1

Two first-author papers accepted to #ICML2026 🇰🇷 ! - Human-like multi-image spatial reasoning in multimodal LLMs (@silviasetitech @sponddd @dai0NLP Prof. Inoue @chokkanorg) - Autoregressive direct preference optimization (Mahiro Ukai @MasahiroKaneko_ @chokkanorg Prof. Inoue)

1,731

Masanari Oi

Mengsay Loem retweeted

Masanari Oi @stjohn2007

May 1

22,562

Daisuke OBA

Mengsay Loem retweeted

Daisuke OBA

@dai0NLP

Apr 22

Excited to present SureLock at #ICLR2026 🇧🇷 — a principled decoding method that locks converged tokens in Masked Diffusion Language Models, cutting 30–50% FLOPs at same quality! w/ @Bollegala @MasahiroKaneko_ @chokkanorg 🕙 Friday, 24th April, 10:30 AM 📍Pavilion 3 (#826)

4,080

RandyGen

Mengsay Loem retweeted

RandyGen @RandyGen0905

Apr 21

#NLP2026参加報告会に参加してくださった皆様、登壇してくださった皆様、ありがとうございました！！！是非、来年のNLPでお会いしましょう！！！

1,911