Name: RAG技術: 智能助手開發實戰 - 第二週
Start: 2024-09-07T14:00:00+08:00
End: 2024-09-07T17:30:00+08:00

什麼是擷取增強生成 (RAG)？

擷取增強生成 (Retrieval-Augmented Generation; RAG) 是一種先進的技術，將自然語言處理與資訊檢索結合，旨在提升大型語言模型 (Large Language Model; LLM) 生成答案的準確性。透過整合外部資料庫的資訊，RAG 技術能夠在回答問題時萃取相關數據，從而提供更具參考價值和可靠性的回應。與傳統的語言生成模型相比，RAG 不僅依賴於訓練數據，還能即時檢索最新的資訊，這使得它在實際應用中更加靈活、實用，適合需要動態更新資訊的領域。
RAG 在各種應用場景中展現了它的潛力，從醫療診斷到法律諮詢，再到金融分析，它都能夠提供基於最新數據的專業建議。此外，RAG 還能夠克服許多傳統 LLM 模型的局限性，例如在專業知識領域的準確性和時效性問題。透過將強大的語言生成能力與即時的資料檢索相結合，RAG 技術成為了構建智能助手、知識管理系統以及其他需要高效資訊處理的應用的理想選擇。這使得 RAG 成為業界關注的焦點，並逐漸成為許多企業與研究機構在開發 AI 應用時的首選方案之一。

擷取增強生成有利解決幻覺 (Hallucination) 議題！！

大型語言模型在生成內容時，常常會面臨所謂的「幻覺」問題，即模型生成的內容可能與事實不符或完全虛構，這對於專業領域的應用尤其具有挑戰性。RAG技術則提供了一種有效的解決方案。透過資訊檢索和生成技術等兩大技術結合，RAG 能夠在生成回應時調用外部資料庫或實時數據，從而大幅減少模型生成不準確內容的風險。此外RAG 在生成答案的過程中引入的檢索步驟，使模型能夠從可信來源獲取最新且準確的資訊，這不僅提高了回應的可靠性，也減少了幻覺出現的概率。例如，在醫療應用中，RAG 能夠根據患者的最新檢測數據或醫學文獻來生成診斷建議，避免傳統 LLM 可能提供的陳舊或錯誤資訊。透過結合最新的檢索結果，RAG 技術為解決語言模型的幻覺問題提供了一條可行之路，確保了模型生成的內容更具真實性與可靠性，使其在各種應用場景中具有更高的實用性。

以 LangChain 框架實現 RAG

LangChain 是一個專為構建基於大型語言模型應用而設計的框架，它簡化了語言模型與外部工具或數據源的整合過程，你可以藉由 LangChain 輕鬆實現 RAG 技術，將資料檢索與內容生成緊密結合，提供精確且具時效性的回應。LangChain 提供了模組化的設計，使開發者能夠靈活選擇和定制不同的組件，無論是數據來源的接入、檢索策略的設計，還是生成回應的調整，都能根據需求進行調整。因此，LangChain 是實現 RAG 的理想工具，尤其適合需要快速開發與部署自然語言應用的專案。

學習目標

經過本次工作坊，學員預期能夠學會以下專業技能

RAG 運作原理，以及應用場景
藉由 LangChain 框架實現 RAG 技術
文本摘要、聊天問答等多種任務類型
搭配 RAG 技術完成 Streamlit 前端開發

課程內容

RAG 技術簡介、LangChain 開發環境設定與基礎組件介紹

大型語言模型的挑戰與限制
解決方案：擷取增強生成 (Retrival-Argumented Generation; RAG)
RAG 的優勢
設置開發環境（包含模組、API 申請等）
代理人 (Agent) 在 LangChain 中的角色
順序鏈 (Sequential Chain) 兩種類協
LangChain Tools: DuckDuckGo and Wikipedia

建立文字詞嵌入以及向量資料庫

向量嵌入簡介
向量嵌入與向量資料庫
藉由 LangChain 建置向量資料庫
利用 LangChain、Pinecone 與 GPT 模型構建 LLM 驅動的問答應用
利用 LangChain 不同代理人，建構文本摘要系統

綜合演練

Streamlit 簡介與其組件說明
將 LLM 掛載至 Streamlit 前端框架，實現對話介面呈現
綜合演練

RAG技術: 智能助手開發實戰 - 第二週

線上活動