从 RAG 到 LLM Wiki：让知识不再每次从零开始

用户4590

4月28日修改

资料来源：

官方：

https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f

LLM Wiki个人个性化优化：

https://zhuanlan.zhihu.com/p/2024921762337398826

https://datasciencedojo.com/blog/llm-wiki-tutorial/

RAG基础讲解：

https://blog.csdn.net/m0_48891301/article/details/156265899

背景（问题）

LLM 的能力来自训练阶段学到的参数知识，但这类知识有几个问题：​

1.
知识过期​
 模型训练完成后，后续的新论文、新工具、新项目状态，它默认不知道。 ​

2.
专业知识不足​
 通用模型知道很多通识，但对你自己的课题、实验记录、代码库、内部文档、前几次分享会内容并不了解。 ​

3.
幻觉与不可验证​
 它可能生成听起来很合理但没有来源的答案​

所以早期大家自然会想：如果 LLM 本身不知道，那能不能让它“先查资料，再回答”？​

这就进入了 RAG。

RAG：企业落地大模型的标准配置（方法）

https://blog.csdn.net/m0_48891301/article/details/156265899

RAG，全称 Retrieval-Augmented Generation，意思是检索增强生成。

不要让 LLM 只凭记忆回答，而是在回答前先从外部知识库里找相关资料，再把资料塞进 prompt，让模型基于资料回答。​

common.docs_name - LarkCCM_Docs_Menu_Image

1.
检索（Retrieval）：主动“找知识”而非“记知识” 。​
传统大模型的知识局限于训练数据，想了解新信息、公司内部文档等，根本无从下手。而RAG会主动从外部知识库中，通过近似最近邻搜索（ANN）算法，精准定位与用户问题相关的知识片段。相当于给大模型配了一个“实时搜索引擎”，随时能调取最新、最专属的知识。​

2.
增强（Augmented）：动态扩展上下文，零成本更新知识。​
检索到的知识不会直接给用户，而是先“喂”给大模型，作为上下文的一部分补充进去。这一步解决了两个问题：一是不用花几百万、几千万重新训练大模型，就能让它掌握新知识；二是规避了大模型上下文窗口有限的问题，只把最相关的知识片段传进去，提升效率。​

生成（Generation）：基于权威依据，生成可信答案。

大模型结合用户的原始问题和检索到的权威知识，生成最终回复。关键是，它能自动关联知识来源，不仅减少了“胡编乱造”的幻觉问题，还让答案可追溯、可验证。​

优点：

1.
让模型访问私有知识，并且知识可以更新​

比如你的实验记录、公司文档、项目会议纪要、代码库说明，这些都不在模型训练集当中，并且相比重新训练模型，更新 RAG 知识库便宜得多。​

2.
降低幻觉，方便引用溯源​

LLM的回答可以基于检索到的外部材料，模型不必完全依赖参数记忆，并且可以告诉你答案来自哪些 chunk、哪些文件、哪些页面​

缺点：

1.
每次 query 都重新综合​

从 RAG 到 LLM Wiki：让知识不再每次从零开始​

从 RAG 到 LLM Wiki：让知识不再每次从零开始