StartSpace株式会社の公式アカウントです。2025年10月から、社内メンバーが運営しています。IT・AIなどの取り組みや日々の活動を発信しています。

Joined October 2025
Photos and videos
構造化RAGは検索改善ではない。 QdrantでもRerankでもHyDEでもない。 壊れていたのは検索ではなく「読む前の文書」だった。 まず読める状態を作る。それが構造化RAGの正体です。 zenn.dev/startspace/articles… #RAG #生成AI #LLM
239
「PDFガイドラインを対象にRAG PoCを構築して分かったこと」を公開しました。 LlamaParse Qdrant Azure OpenAIでRAGチャットボットを構築。 実装よりも難しかったのは、 ・PDF前処理 ・チャンク設計 ・速度と精度のバランス ・何を作らないかの判断 4日間のPoCで得た学びをまとめています。 zenn.dev/startspace/articles… #RAG #生成AI #LLM #AzureOpenAI #Qdrant
24
LLMは「理解」ではなく「予測」。ニュースだけで投資判断させると、それっぽい理由で誤る。投資AIの本質はモデル性能ではなく「設計」にある。実験ログ付きで解説👇 zenn.dev/startspace/articles… #AIエージェント #LLM
1
1
58
Microsoft Foundryは単なるPaaSではなく、モデル・エージェント・ツール・評価・ガバナンスまで統合したAI基盤。全体像を整理しながら、実務でどう使うかを考察しました👇 zenn.dev/startspace/articles… #AIエージェント #Azure #LLM
26
AIエージェントは完全自動化ではない。判断はできても責任は持てない。だから最終意思決定は人間が担う。Human-In-The-Loopの本質は「制御」。どこに人を入れるかが設計の核心。実務で使える設計パターンを解説👇 zenn.dev/startspace/articles… #AIエージェント #LLM #生成AI
26
LLMは「覚えている」のではない。記憶は外にある。 AIエージェントはState(状態)を持ち、Think→Act→Observeで更新し続けることで業務を進める。 Memoryの本質を解説👇 zenn.dev/startspace/articles… #AIエージェント #LLM
14
Function Callingは「一回の行動」で終わる。業務は終わらない。AIエージェントが動き続ける理由は、State→Think→Act→Observeのループ構造にある。賢さではなく「制御された繰り返し」が本質。Control Flowの設計を解説👇 zenn.dev/startspace/articles… #AIエージェント #LLM
41
LLMは「実行できるようになった」のではない。 Function Callingで外部と接続され、意思決定と実行が分離されたことで、業務が進む構造が生まれた。 AIエージェントの本質=賢さではなく構造。 その仕組みを解説👇 zenn.dev/startspace/articles… #AIエージェント #LLM
51
RAGは「正しい答え」を出せるが、「仕事を終わらせる」ことはできない。必要なのは検索ではなく行動。AIエージェントは状態・思考・行動・観測のループで業務を完結させる。RAGは部品、Agentはシステム。その設計を解説しました👇 zenn.dev/startspace/articles… #AIエージェント #RAG #LLM
77
RAGの検索精度は「チャンク設計」で大きく変わります。 しかし検索に最適なチャンクサイズと、LLMが理解しやすいチャンクサイズは一致しません。 このトレードオフを解決する設計が Parent-Child Chunk。 階層Chunkで検索精度と文脈保持を両立する仕組みを解説しました。 zenn.dev/startspace/articles… #RAG #生成AI #LLM
107
Hybrid Searchを実務でどう設計するか? Qdrantで Dense(Embedding) Sparse(BM25) RRF を組み合わせた検索基盤を実装しました。 PostgreSQL pgvectorの限界、日本語BM25の注意点、Python実装まで整理しています👇 zenn.dev/startspace/articles… #RAG #生成AI #VectorDB
130
RAGの精度はchunk以前に決まる。 LlamaParseかVGCかではなく「文書理解レイヤーをどこに置くか」が設計の本質。 VLM時代の前処理パイプラインを整理しました👇 zenn.dev/startspace/articles… #RAG #生成AI #VLM
156
Markdown化しても構造は確定しない。 構造化RAGの「空白」を埋める工程と、Vision-Guided Chunkingをどこで使うべきかを整理しました。全文VGCではなく“必要箇所だけ適用”という設計論です👇 zenn.dev/startspace/articles… #RAG #構造化RAG #VGC #生成AI
120
RAG精度が伸びない原因、検索でもEmbeddingでもない。 多くは「PDFパース設計」で既に上限が決まっています。 LlamaParseは復元ではなく整形。その実務的な位置づけを解説👇 zenn.dev/startspace/articles… #RAG #LLM
101
RAGの精度が頭打ちになる原因、検索でもChunkingでもありません。 多くの場合「PDFをテキスト化した瞬間」に構造が壊れています。 なぜPDF取得が精度上限を決めるのかを実例で整理しました👇 zenn.dev/startspace/articles… #RAG #生成AI #LLM
1
101
RAGの精度が伸びない原因、検索でもRerankでもありません。 多くのRAGは「入力データの時点で壊れている」。 なぜテキストChunkingでは限界に到達するのかを整理しました👇 zenn.dev/startspace/articles… #RAG #生成AI #LLM
2
123
RAGを長期運用するなら 「どのObservabilityを使うか」より 「なぜそれを選ぶのか」が重要になります。 LangSmithとLangfuseを 運用設計・セキュリティ・コストの観点から整理しました👇 zenn.dev/startspace/articles… #RAG #LangSmith #Langfuse #LLMOps
1
170
RAGは「作った瞬間」がピークになりやすい。 本番で精度が落ちる原因は、モデルや検索以前に“運用設計”がないからかもしれません。 Langfuseで回す、評価→仮説→改善の現実的なサイクルを整理しました👇 zenn.dev/startspace/articles… #RAG #Langfuse #生成AI #LLMOps
1
193
RAGの精度が伸びない原因は、RerankやEmbedding以前に「どのDB構成を前提にしているか」かもしれません。 Aurora(PostgreSQL)という制約下で、 FTS × pgvector によるハイブリッド検索はどこまで現実的なのか。 理想論ではなく“割り切り”を含めて検証しました👇 zenn.dev/startspace/articles… #RAG #PostgreSQL #FTS #pgvector #生成AI #検索
174
RAGの精度が伸びない原因は、EmbeddingやRerank以前に「検索戦略」そのものかもしれません。 ベクトル検索だけに頼らず、BM25と組み合わせる ハイブリッド検索がどこで効くのかを検証しました👇 zenn.dev/startspace/articles… #RAG #検索 #ハイブリッド検索 #BM25 #LangChain #LLM
150