AWS Bedrock×社内文書RAG検索 | Development

## AWS Bedrock×RAGによる社内文書検索システム ### プロジェクト概要 AWS Bedrock×社内文書RAG検索は、AWS Bedrockの大規模言語モデルとRAG（Retrieval-Augmented Generation）技術を組み合わせた、次世代の社内文書検索システムです。自然言語で質問するだけで、社内に散在する文書から必要な情報を抽出し、分かりやすく回答します。 ### 背景と課題企業内には膨大な文書が存在しますが、必要な情報を見つけることは容易ではありませんでした。 **情報の散在**：社内Wiki、ファイルサーバー、グループウェア、各種SaaSなど、情報が様々な場所に分散しており、どこを探せばよいか分からない状況でした。 **キーワード検索の限界**：従来の検索は完全一致のキーワード検索が中心で、表現が異なると必要な文書にたどり着けないケースがありました。 **検索結果の過多**：検索結果が多すぎて、本当に必要な情報を見つけるために大量の文書を読む必要がありました。 ### ソリューションの詳細 **1. 自然言語検索** 「〇〇プロジェクトの予算はいくら？」「休暇申請のフローを教えて」など、日常的な言葉で質問できます。専門用語を知らなくても、意図を理解して適切な情報を検索します。 **2. 回答生成・要約** 検索結果の文書をそのまま返すのではなく、質問に対する回答を生成します。複数の文書から情報を統合し、簡潔な回答を作成します。 **3. 出典明示** 回答の根拠となった文書へのリンクを表示します。「この情報の出典は〇〇マニュアルのp.15です」といった形で、信頼性を担保します。 **4. マルチソース対応** SharePoint、Confluence、Google Drive、Box、Notionなど、複数の文書ソースを横断して検索します。情報の保存場所を意識せずに、統合的な検索が可能です。 **5. 権限管理統合** 既存の権限管理システムと連携し、ユーザーがアクセス権を持つ文書のみを検索対象とします。機密情報の漏洩リスクを防ぎます。 ### 技術的特徴 AWS Bedrockが提供する複数の基盤モデル（Claude、Titan Embeddings等）を用途に応じて使い分けています。埋め込みベクトル（Embedding）には高精度な専用モデルを使用し、検索精度を向上させています。 Amazon OpenSearch Serviceをベクトルデータベースとして使用し、大量の文書に対しても高速な類似検索を実現しています。増分インデックス更新により、新しい文書も即座に検索対象に追加されます。 ### 導入効果導入企業では、情報検索に費やす時間が1人あたり週3時間から30分に短縮されました。「前に見たあの資料」を探す手間がなくなり、業務効率が大幅に向上しています。新入社員のオンボーディングでも、「まず聞いてみる」という行動が定着し、立ち上がりが早くなったという報告もあります。