Filter
Exclude
Time range
-
Near
現場でこう使えそう: 1. 既存のNL2SQL環境でカラム名・テーブル名の曖昧さをリストアップ 2. プロービングクエリでスキーマ解釈を事前確定させる仕組みを小さく実装 3. 曖昧な質問パターンだけ先に検証して、精度改善幅を確認 論文実装を追う前に、まず「自分のスキーマのどこが曖昧か」を棚卸しするのが先決だと思う。 みなさんのNL2SQL環境、スキーマの曖昧さはどう対処してる? — arXiv cs.CL #AI

5
これって要するに、「モデルに都度判断させる」から「スキーマの解釈を事前に固定する」への設計シフトだと理解した。 NL2SQLで精度が安定しない原因の多くは、モデルの能力よりも「スキーマの意味が文脈によって揺れる」ことにある。そこを人手で注釈するのではなく、プロービングで自律的に確定させるのが本質的な部分だと思う。地味な仕組みだけど、ここを雑にすると後から確実に効いてくる。
1
7
SOMA-SQLが対象にしているのは、NL2SQLで精度が落ちる3つの曖昧性: ①自然言語の質問そのものの多義性 ②スキーマ定義の解釈ブレ ③モデルが推論時に選ぶ解釈のズレ 合成クエリログとプロービングクエリを組み合わせて、スキーマの解釈を事前に確定させる設計。6つの公開ベンチマークで実行精度を平均13.0%改善、曖昧な質問に絞ると最大16.7%向上という結果が出ている。(arXiv投稿段階のプレプリントなので、査読後に数字が動く可能性はある)
1
3
保存しておきたい論文。 NL2SQLの「曖昧さ」問題、ずっと根本解決できないまま運用でごまかしてきた。 SOMA-SQLという手法が、人間の介在なしに自律で曖昧性を解消するアプローチを取っていて、腹落ちする部分が多かった。要点と、次に試すならこう、というのをまとめておく。 🧵 #AI実装ノウハウ
1
3