rag-engineer
检索增强生成系统构建专家。精通嵌入模型、向量数据库、文本分块策略及大语言应用检索优化。适用场景:搭建RAG系统、向量搜索、嵌入处理、语义搜索、文档检索。
作者
分类
AI 技能开发安装
热度:5
下载并解压到你的 skills 目录
复制命令,发送给 OpenClaw 自动安装:
下载并安装这个技能 https://openskills.cc/api/download?slug=sickn33-skills-rag-engineer&locale=zh&source=copy
RAG Engineer - 检索增强生成系统架构专家
技能概述
RAG Engineer 是专门负责构建检索增强生成(RAG)系统的 AI 技能,精通向量嵌入、向量数据库、文档分块策略和检索优化,帮助开发者打造高质量的 LLM 文档问答应用。
适用场景
核心功能
- 基于语义边界而非固定 token 数量的分块策略
- 保留文档结构(标题、段落)和上下文重叠
- 自动检测主题切换,确保分块内容语义完整
- 添加元数据支持,实现精确过滤
- 分层索引策略(段落、章节、文档多粒度)
- 粗筛+精馏两阶段检索流程
- 父子文档关系维护,兼顾精度与上下文
- 相关性阈值过滤,避免噪声上下文
- BM25/TF-IDF 关键词匹配 + 向量语义检索融合
- Reciprocal Rank Fusion 分数合并策略
- 针对不同查询类型动态调整权重
- 检索结果重排序优化
- 独立的检索质量评估指标
常见问题
RAG 系统是什么?适合什么场景?
RAG(检索增强生成)系统是一种将信息检索与大语言模型结合的技术架构。它先从知识库中检索相关文档片段,再将这些内容作为上下文提供给 LLM 生成答案。RAG 特别适合需要基于特定文档回答问题的场景,如企业知识库问答、技术文档助手、合同审查等,相比纯模型生成能显著减少幻觉,提高答案准确性。
文档分块为什么重要?有什么最佳实践?
文档分块直接影响检索质量。固定大小分块会切断句子和语义边界,导致检索结果不完整。最佳实践是采用语义分块:按句子和段落边界分割,利用嵌入相似度检测主题变化,保留适当的上下文重叠,并添加元数据(如章节标题、文档类型)用于后续过滤。
如何提高 RAG 系统的检索准确率?
提高检索准确率需要多方面优化:1)采用混合搜索,结合语义和关键词检索;2)添加元数据预过滤,缩小检索范围;3)针对不同内容类型评估并选择合适的嵌入模型;4)实现分层检索,先粗筛后精炼;5)对检索结果进行重排序;6)使用相关性阈值过滤低质量结果;7)建立独立的检索评估指标,持续优化。