从 RAG 到 LLM Wiki:让知识不再每次从零开始
输入“/”快速插入内容
从 RAG 到 LLM Wiki:让知识不再每次从零开始
用户4590
用户4590
4月28日修改
资料来源:
官方:
https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f
LLM Wiki个人个性化优化:
https://zhuanlan.zhihu.com/p/2024921762337398826
https://datasciencedojo.com/blog/llm-wiki-tutorial/
RAG基础讲解:
https://blog.csdn.net/m0_48891301/article/details/156265899
背景(问题)
LLM 的能力来自训练阶段学到的参数知识,但这类知识有几个问题:
1.
知识过期
模型训练完成后,后续的新论文、新工具、新项目状态,它默认不知道。
2.
专业知识不足
通用模型知道很多通识,但对你自己的课题、实验记录、代码库、内部文档、前几次分享会内容并不了解。
3.
幻觉与不可验证
它可能生成听起来很合理但没有来源的答案
所以早期大家自然会想:如果 LLM 本身不知道,那能不能让它“先查资料,再回答”?
这就进入了 RAG。
RAG:企业落地大模型的标准配置(方法)
https://blog.csdn.net/m0_48891301/article/details/156265899
RAG,全称 Retrieval-Augmented Generation,意思是
检索增强生成
。
不要让 LLM 只凭记忆回答,而是在回答前
先从外部知识库里找相关资料
,
再把资料塞进 prompt
,让模型基于资料回答。
1.
检索(Retrieval):
主动“找知识”而非“记知识” 。
传统大模型的知识局限于训练数据,想了解新信息、公司内部文档等,根本无从下手。而RAG会主动从外部知识库中,通过近似最近邻搜索(ANN)算法,精准定位与用户问题相关的知识片段。相当于给大模型配了一个“实时搜索引擎”,随时能调取最新、最专属的知识。
2.
增强(Augmented):
动态扩展上下文,零成本更新知识。
检索到的知识不会直接给用户,而是先“喂”给大模型,作为上下文的一部分补充进去。这一步解决了两个问题:一是不用花几百万、几千万重新训练大模型,就能让它掌握新知识;二是规避了大模型上下文窗口有限的问题,只把最相关的知识片段传进去,提升效率。
3.
生成(Generation):
基于权威依据,生成可信答案。
大模型结合用户的原始问题和检索到的权威知识,生成最终回复。关键是,它能自动关联知识来源,不仅减少了“胡编乱造”的幻觉问题,还让答案可追溯、可验证。
优点:
1.
让模型访问私有知识,并且知识可以更新
比如你的实验记录、公司文档、项目会议纪要、代码库说明,这些都不在模型训练集当中,并且相比重新训练模型,更新 RAG 知识库便宜得多。
2.
降低幻觉,方便引用溯源
LLM的回答可以基于检索到的外部材料,模型不必完全依赖参数记忆,并且可以告诉你答案来自哪些 chunk、哪些文件、哪些页面
缺点:
1.
每次 query 都重新综合