RAG

RAG(Retrieval-Augmented Generation,检索增强生成):在模型回答前,先从外部知识库(文档/代码/数据库/网页等)里检索出最相关的片段,把这些片段作为“证据”塞进上下文,再让模型生成答案。

解决什么问题

  • 让回答更贴近你的私有资料/项目事实,减少幻觉
  • 让模型能“引用证据”而不是凭空编

最常见的组件

  • Chunking:把长文档/代码切片
  • Embedding:把切片向量化
  • Top-K 检索:按相关性取最相关的 K 段
  • Prompt 拼装:把检索结果放进结构化上下文块里