LLM Frontline
開発・エージェント

RAGとは何か|仕組み・向き不向き・導入判断の考え方

ミナト開発・API担当
・ 約6分で読めます
RAGとは何か|仕組み・向き不向き・導入判断の考え方

「社内の規程やマニュアルをAIに読み込ませて、質問に答えられるようにしたい」。この要望に対する現在の代表的な答えがRAG(Retrieval-Augmented Generation、検索拡張生成)です。ただし、RAGは万能の魔法ではなく、得意な質問と苦手な質問がはっきり分かれる技術です。この記事では、仕組みをエンジニア以外にも分かる粒度で説明したうえで、向き不向きと導入判断の考え方を整理します。

RAGの仕組み:検索してから生成する

LLM単体に「わが社の経費精算の上限は?」と聞いても、社内規程を知らないため答えられないか、もっともらしい誤答を返します。RAGはこの問題を、回答の直前に関連文書を検索して渡すことで解決します。

利用者の質問
  -> 1. 検索: 質問と関連が深い文書の断片を社内データから探す
  -> 2. 組み立て: 見つけた断片を質問と一緒にプロンプトへ挿入する
  -> 3. 生成: LLMが「渡された文書に基づいて」回答を作る
  -> 回答と根拠(どの文書を参照したか)を返す

モデル自体は何も覚えていません。試験会場に毎回カンニングペーパーを持ち込ませるようなもので、ペーパーに書いてあることしか正しく答えられない代わりに、文書を差し替えれば知識を即日更新できます。

検索部分が精度を決める

RAGの回答品質は、LLMの賢さよりも「正しい文書の断片を検索で引き当てられるか」に大きく左右されます。検索には、キーワード一致に加えて、文章の意味の近さで探すベクトル検索(埋め込み検索)がよく使われます。文書を適切な長さに区切る(チャンク分割)、タイトルや部署名などのメタデータを付ける、キーワード検索と併用するといった地道な工夫が、精度改善の中心になります。

メモ

「RAGの精度が低い」という相談の多くは、生成ではなく検索の問題です。回答がおかしいときは、まずどんな断片が検索されてLLMに渡ったのかを確認すると、原因の切り分けが速くなります。

向いている用途・向かない用途

質問のタイプRAGとの相性
ピンポイントの事実確認経費精算の上限は。申請の締切はいつ得意
手順の参照入社手続きの流れを教えて得意
根拠つきの回答が必要この規程の該当箇所を示して得意
資料全体の集計全契約書のうち更新月が3月のものを数えて苦手
網羅的な列挙規程に書かれた禁止事項をすべて挙げて苦手
文書横断の推論二つの規程の矛盾点を分析して条件次第

苦手な質問に共通するのは「文書の一部ではなく全体を見る必要がある」ことです。検索は関連の強い断片を数件〜数十件返す仕組みなので、全件を対象にした集計や網羅列挙は原理的に不得意です。この種の要件には、データベースや全文処理など従来型の仕組みを組み合わせるほうが適しています。

「規程の変更点を全部リストアップして、という質問にきちんと答えられず信頼を失った」という話を聞くことがあります。できる質問とできない質問を利用者に最初に伝えておくことも、導入設計の一部です。
社内ヘルプデスクの担当者

導入判断のポイント

  1. 1

    元文書の状態を確認する

    最新版がどれか分からない、部署ごとに版が違う、という状態ではRAGも誤答します。文書の棚卸しと更新フローの整備が事実上の前提条件です。
  2. 2

    想定質問集で検証する

    実際に寄せられる質問を50問ほど集め、回答と参照元が正しいかを人が採点します。体感ではなく正答率で判断します。
  3. 3

    根拠表示を必須にする

    回答に「どの文書のどの箇所を参照したか」を必ず添えます。利用者が一次情報を確認できることが、誤答の被害を最小化します。
  4. 4

    答えられない質問の挙動を決める

    検索で十分な根拠が見つからないときは、推測せず「分かりません。担当窓口へ」と返す設計にします。

RAGの実装方式(検索の種類・チャンク分割・再ランキングなど)は各社の開発者向けドキュメントで解説が公開されています。実装前にOpenAIやAnthropicなどの公式ドキュメントで現行の推奨構成を確認してください。

自前構築か、既製サービスか

RAGは自前で組むこともできますが、近年は文書をアップロードするだけで検索と生成を面倒見てくれる既製機能・サービスも増えています。まず既製サービスで小さく検証し、検索精度のチューニングやアクセス権限の細かい制御が必要になった段階で自前構築を検討する、という順序が失敗しにくい進め方です。自前構築の場合も、埋め込みモデルやベクトルデータベースの選定は変わり得るため、コンポーネントを差し替えられる構成にしておくことをおすすめします。

よくある質問

ファインチューニングとRAGはどう違いますか
ファインチューニングはモデル自体を追加学習させる手法で、文体や形式の習得に向きます。知識の追加・更新が目的ならRAGのほうが、文書の差し替えだけで済むため運用が容易です。両者は排他ではなく併用もできます。
文書を丸ごとプロンプトに貼ればRAGは不要ではありませんか
文書が少なければその方法(ロングコンテキスト活用)で十分な場合もあります。文書量が多い、更新が頻繁、コストを抑えたいといった条件が揃うほどRAGの利点が出ます。
RAGを入れればハルシネーションはなくなりますか
減らせますが、なくなりません。検索が外れた断片を返せば、それらしい誤答が生成されます。根拠表示と、答えられないときに答えない設計をあわせて導入してください。
社内文書を外部のAIに渡して大丈夫ですか
サービスのデータ取り扱い条件(学習利用の有無・保持期間)と社内の情報管理ルールの確認が先です。アクセス権限のある文書だけが検索対象になる設計も重要です。
導入にはどれくらいの規模の開発が必要ですか
既製サービスの利用なら開発なしで検証を始められます。自前構築の規模は、文書量・権限管理・精度要件によって大きく変わるため、まず小さな検証で要件を固めることをおすすめします。

まとめ

RAG導入前のチェックリスト

  • 答えたい質問のタイプがRAGの得意領域か確認した
  • 元文書の最新性と更新フローを整備した
  • 想定質問集で正答率を検証した
  • 根拠表示と、答えられないときの挙動を設計した
  • データの取り扱い条件と権限制御を確認した

RAGは「AIに社内知識を答えさせる」ための現実的な出発点ですが、精度の大半は検索と文書整備という地味な部分で決まります。検索や生成を自律的に組み合わせて動くAIエージェントの考え方も、次の一歩としてあわせて押さえておくと設計の見通しが良くなります。

あわせて読みたい

AIエージェントとは何か|従来の自動化との違いと任せてよい仕事

出典・参考

この記事をシェア

関連する記事