LLM router agent ベース RAG の実装:8 ツール構成と、Cloudflare Workers + Azure OpenAI 環境で踏んだ 5 つの罠
TEI/XML 形式の古典文書コーパスを対象としたベクター検索 RAG に、LLM が問いを見て道具を自動で選ぶ Router Agent を導入した記録。8 ツール構成の設計、構造化データとベクター検索の相補性、そして実装で踏んだ 5 つの罠 (Cloudflare Workers 3 MiB 上限・Azure OpenAI URL pattern・JSON_CONTAINS の盲点・reasoning モデルの multi-turn 問題・TPM ボトルネック) を記録します。




