StartSpace株式会社 (@startspace_cp) | Aguea

Photos and videos

Tweets

Pinned Tweet

StartSpace株式会社

@startspace_cp

Mar 2

構造化RAGは検索改善ではない。 QdrantでもRerankでもHyDEでもない。壊れていたのは検索ではなく「読む前の文書」だった。まず読める状態を作る。それが構造化RAGの正体です。 zenn.dev/startspace/articles… #RAG #生成AI #LLM

構造化RAGの正体｜文書を読む前処理という発想

239

StartSpace株式会社

@startspace_cp

Jun 8

「PDFガイドラインを対象にRAG PoCを構築して分かったこと」を公開しました。 LlamaParse Qdrant Azure OpenAIでRAGチャットボットを構築。実装よりも難しかったのは、・PDF前処理・チャンク設計・速度と精度のバランス・何を作らないかの判断 4日間のPoCで得た学びをまとめています。 zenn.dev/startspace/articles… #RAG #生成AI #LLM #AzureOpenAI #Qdrant

PDFガイドラインを対象にRAG PoCを構築して分かったこと

24

StartSpace株式会社

@startspace_cp

May 7

LLMは「理解」ではなく「予測」。ニュースだけで投資判断させると、それっぽい理由で誤る。投資AIの本質はモデル性能ではなく「設計」にある。実験ログ付きで解説👇 zenn.dev/startspace/articles… #AIエージェント #LLM

AIはなぜ間違った投資判断をするのか｜投資エージェント実験の出発点

1

1

58

StartSpace株式会社

@startspace_cp

Apr 27

Microsoft Foundryは単なるPaaSではなく、モデル・エージェント・ツール・評価・ガバナンスまで統合したAI基盤。全体像を整理しながら、実務でどう使うかを考察しました👇 zenn.dev/startspace/articles… #AIエージェント #Azure #LLM

Microsoft Foundryとは何か｜AIエージェント開発基盤としての全体像を整理する

26

StartSpace株式会社

@startspace_cp

Apr 20

AIエージェントは完全自動化ではない。判断はできても責任は持てない。だから最終意思決定は人間が担う。Human-In-The-Loopの本質は「制御」。どこに人を入れるかが設計の核心。実務で使える設計パターンを解説👇 zenn.dev/startspace/articles… #AIエージェント #LLM #生成AI

AIエージェントはなぜ人間と協働するのか｜Human-In-The-Loopで理解する意思決定の最終制御

26

StartSpace株式会社

@startspace_cp

Apr 13

LLMは「覚えている」のではない。記憶は外にある。 AIエージェントはState（状態）を持ち、Think→Act→Observeで更新し続けることで業務を進める。 Memoryの本質を解説👇 zenn.dev/startspace/articles… #AIエージェント #LLM

AIエージェントはなぜ覚えられるのか｜Memoryで理解する状態を持つLLM

14

StartSpace株式会社

@startspace_cp

Apr 6

Function Callingは「一回の行動」で終わる。業務は終わらない。AIエージェントが動き続ける理由は、State→Think→Act→Observeのループ構造にある。賢さではなく「制御された繰り返し」が本質。Control Flowの設計を解説👇 zenn.dev/startspace/articles… #AIエージェント #LLM

AIエージェントはなぜ動き続けるのか｜Control Flowで理解するループの本質

41

StartSpace株式会社

@startspace_cp

Mar 30

LLMは「実行できるようになった」のではない。 Function Callingで外部と接続され、意思決定と実行が分離されたことで、業務が進む構造が生まれた。 AIエージェントの本質＝賢さではなく構造。その仕組みを解説👇 zenn.dev/startspace/articles… #AIエージェント #LLM

AIエージェントはなぜ実行できるのか｜Function Callingで理解する行動するLLM

51

StartSpace株式会社

@startspace_cp

Mar 23

RAGは「正しい答え」を出せるが、「仕事を終わらせる」ことはできない。必要なのは検索ではなく行動。AIエージェントは状態・思考・行動・観測のループで業務を完結させる。RAGは部品、Agentはシステム。その設計を解説しました👇 zenn.dev/startspace/articles… #AIエージェント #RAG #LLM

RAGの次は検索ではなく行動である｜Semantic Kernelで理解するAIエージェントの設計思想

77

StartSpace株式会社

@startspace_cp

Mar 16

RAGの検索精度は「チャンク設計」で大きく変わります。しかし検索に最適なチャンクサイズと、LLMが理解しやすいチャンクサイズは一致しません。このトレードオフを解決する設計が Parent-Child Chunk。階層Chunkで検索精度と文脈保持を両立する仕組みを解説しました。 zenn.dev/startspace/articles… #RAG #生成AI #LLM

Parent-Child Chunkとは何か｜RAG検索精度を上げる階層Chunk設計

107

StartSpace株式会社

@startspace_cp

Mar 11

Hybrid Searchを実務でどう設計するか？ Qdrantで Dense（Embedding） Sparse（BM25） RRF を組み合わせた検索基盤を実装しました。 PostgreSQL pgvectorの限界、日本語BM25の注意点、Python実装まで整理しています👇 zenn.dev/startspace/articles… #RAG #生成AI #VectorDB

QdrantでHybrid Searchを設計する｜dense sparse RRFの実戦設計

130

StartSpace株式会社

@startspace_cp

Feb 24

RAGの精度はchunk以前に決まる。 LlamaParseかVGCかではなく「文書理解レイヤーをどこに置くか」が設計の本質。 VLM時代の前処理パイプラインを整理しました👇 zenn.dev/startspace/articles… #RAG #生成AI #VLM

構造化RAGの次へ｜文書理解レイヤーという設計思想

156

StartSpace株式会社

@startspace_cp

Feb 19

Markdown化しても構造は確定しない。構造化RAGの「空白」を埋める工程と、Vision-Guided Chunkingをどこで使うべきかを整理しました。全文VGCではなく“必要箇所だけ適用”という設計論です👇 zenn.dev/startspace/articles… #RAG #構造化RAG #VGC #生成AI

テキストChunkingの次へ｜VisionGuidedChunkingを構造化RAGにどう接続するか

120

StartSpace株式会社

@startspace_cp

Feb 9

RAG精度が伸びない原因、検索でもEmbeddingでもない。多くは「PDFパース設計」で既に上限が決まっています。 LlamaParseは復元ではなく整形。その実務的な位置づけを解説👇 zenn.dev/startspace/articles… #RAG #LLM

LlamaParseは復元ではなく整形｜構造化RAGの入口としてのPDFパース設計

101

StartSpace株式会社

@startspace_cp

Feb 3

RAGの精度が頭打ちになる原因、検索でもChunkingでもありません。多くの場合「PDFをテキスト化した瞬間」に構造が壊れています。なぜPDF取得が精度上限を決めるのかを実例で整理しました👇 zenn.dev/startspace/articles… #RAG #生成AI #LLM

RAGの精度はPDF取得で決まる｜テキスト化した瞬間に構造が壊れる理由

1

101

StartSpace株式会社

@startspace_cp

Jan 27

RAGの精度が伸びない原因、検索でもRerankでもありません。多くのRAGは「入力データの時点で壊れている」。なぜテキストChunkingでは限界に到達するのかを整理しました👇 zenn.dev/startspace/articles… #RAG #生成AI #LLM

RAGの精度は入力構造で決まる｜なぜテキストChunkingでは限界に到達するのか

2

123

StartSpace株式会社

@startspace_cp

Jan 19

RAGを長期運用するなら「どのObservabilityを使うか」より「なぜそれを選ぶのか」が重要になります。 LangSmithとLangfuseを運用設計・セキュリティ・コストの観点から整理しました👇 zenn.dev/startspace/articles… #RAG #LangSmith #Langfuse #LLMOps

LangSmithは長期RAG運用で使えるか？Langfuseと比較して見えた設計判断の違い

1

170

StartSpace株式会社

@startspace_cp

Jan 13

RAGは「作った瞬間」がピークになりやすい。本番で精度が落ちる原因は、モデルや検索以前に“運用設計”がないからかもしれません。 Langfuseで回す、評価→仮説→改善の現実的なサイクルを整理しました👇 zenn.dev/startspace/articles… #RAG #Langfuse #生成AI #LLMOps

RAGの精度は運用で決まる｜Langfuseで回す改善サイクルの現実解

1

193

StartSpace株式会社

@startspace_cp

Jan 8

RAGの精度が伸びない原因は、RerankやEmbedding以前に「どのDB構成を前提にしているか」かもしれません。 Aurora(PostgreSQL)という制約下で、 FTS × pgvector によるハイブリッド検索はどこまで現実的なのか。理想論ではなく“割り切り”を含めて検証しました👇 zenn.dev/startspace/articles… #RAG #PostgreSQL #FTS #pgvector #生成AI #検索

RAGの精度はDB設計で決まる｜PostgreSQL FTSで実現するハイブリッド検索の現実解

174

StartSpace株式会社

@startspace_cp

Jan 2

RAGの精度が伸びない原因は、EmbeddingやRerank以前に「検索戦略」そのものかもしれません。ベクトル検索だけに頼らず、BM25と組み合わせるハイブリッド検索がどこで効くのかを検証しました👇 zenn.dev/startspace/articles… #RAG #検索 #ハイブリッド検索 #BM25 #LangChain #LLM

RAGの精度は検索戦略で決まる｜ハイブリッド検索が効く理由を検証する

150