https://www.techbang.com/posts/115773-what-is-rag
為為解決這個問題,谷歌大腦實驗室提出了RAG(Retrieval Augmented Generation,檢索增強生成)技術。RAG是一種全新的LLM訓練模式,透過將「資訊檢索」與「文字生成」結合,讓LLM能夠動態取用並理解新的知識,提升其在特定場景下的問答及文字生成品質。
RAG的工作原理是先利用檢索模型從龐大知識庫(如網路、維基百科等)中找出與問題相關的文字資訊片段,再將這些資訊片段連同原始問題一起輸入語言生成模型,讓模型理解這些補充知識後,生成準確且連貫的答案文字。
RAG技術的另一大優點,在於它讓LLM生成的文字可追溯知識來源。傳統LLM雖然擁有驚人的生成能力,但很難知道模型到底是基於什麼樣的知識做出回應。而RAG則採用了向量資料庫技術,讓我們能清楚看到模型生成的答案是源於知識庫中的哪些特定文字資訊。
以上是簡單的摘要,本人認為RAG的發展是很正確的方向,這與人類獲取知識的方式很相近,透過檢索,閱讀與修正,始能成為該領域的專家!