« O-COCOSDA 2024 in 新竹 (2): 龍山寺周辺 | トップページ | AI時代での情報検索 (2) 英語 »

AI時代での情報検索 (1) RAG

2024年12月 4日 (水) 投稿者: メディア技術コース

技術コースの盧です.

ChatGPTがAIの代名詞みたくなっているような時代ですが,個人的には期待はずれの経験が多すぎて,もうChatGPTは使っていません.だと言って,私はこの類のサービスを全く使わないのか?それは違います.単純にChatGPTを使わないだけで,私も日々この類のサービスを使っています.

それで?私が何のサービスを使っているのか?こういう団体の公式ブログで直接サービスのお名前を載せると広告みたくなってしまうので敢えて実名は控えておきますが,私の主に使っているものの大枠だけ載せます.それは RAG (Retrieval-Augmented Generation) です.日本語では「検索拡張生成」とか訳されるそうです.

私はあくまで使う側の人間なので,仕組みについてそこまで詳しくありませんが軽く解説しておきます.

基本的にChatGPTみたいな最新のチャット・ボットは,裏に事前学習されたLLM(Large-Language Model)を持っており,質問をそのモデルに基づいて解釈し答えを生成してくれるような仕組みです.ここで,ChatGPTのようなLLMのみでは,答えを作る段階で事前学習されたデータにしか使えないため,構造的にいわゆる「嘘を吐く」幻覚(hallucination)現象が起きてしまいがちです.以前,どれほど使い物になるのか気になって,答えを知りながらも自分の専門の細かい内容だったり,趣味レベルでもかなり詳しい分野について質問したところ,個人的にはChatGPTの答えはもう信用できないと結論づけました.今は改善されている可能性はあると思いますが,構造的に一定水準以上の改善の余地がないのが分かっているのでもう個人的には使う意義を持ちません.

それに比べて,RAGは事前学習されたデータのみならず,裏で内容について検索を行った上,両方のデータに基づいて答えを生成してくれます.それで,基本的には下手な嘘は吐けない構造になっている訳です.なお,疑わしい結果に対しても元情報へのリンクを提供してくれてそこに辿れるわけで,出力結果への信頼性もかなり高いです.実際,いままで使ってて最終的には期待外れの答えを得た経験はあまりありませんでした.また,ちょっと意図とは違う結果が出てもすぐ修正プロムプトを入れれば良いです.基本的に結果への信頼性があるからこういう修正プロムプトを入れる甲斐があるわけです.

なので,私はChatGPTは全く使わないけど,こちらは頻繁に使っています.

雑感」カテゴリの記事

« O-COCOSDA 2024 in 新竹 (2): 龍山寺周辺 | トップページ | AI時代での情報検索 (2) 英語 »