UltraRAG 2.0

UltraRAG 2.0：面向科研的“RAG实验”加速器

检索增强生成系统（RAG）正从早期“检索+生成”的简单拼接，走向融合自适应知识组织、多轮推理、动态检索的复杂知识系统（典型代表如 DeepResearch、Search-o1）。但这种复杂度的提升，使开发者在方法复现、快速迭代新想法时，面临着高昂的工程实现成本。

为了解决这一痛点，清华大学 THUNLP 实验室、东北大学 NEUIR 实验室、OpenBMB 与 AI9Stars 联合推出 UltraRAG 2.0 （UR-2.0）—— 首个基于 Model Context Protocol (MCP) 架构设计的 RAG 框架。这一设计让科研人员只需编写 YAML 文件，就可以直接声明串行、循环、条件分支等复杂逻辑，从而以极低的代码量快速实现多阶段推理系统。

其核心思路是：

组件化封装：将 RAG 的核心组件封装为标准化的独立 MCP Server；
灵活调用与扩展：提供函数级 Tool 接口，支持功能的灵活调用与扩展；
轻量流程编排：借助 MCP Client，建立自上而下的简洁化链路搭建；

与传统框架相比，UltraRAG 2.0 显著降低了复杂 RAG 系统的技术门槛与学习成本，让研究者能够将更多精力投入到实验设计与算法创新上，而不是陷入冗长的工程实现。

大道至简：让科研实验专注思想而非工程

“简”的价值，在实践中尤为直观。以 IRCoT 这一经典方法为例，它依赖基于模型生成的 CoT 进行多轮检索直至产出最终答案，整体流程相当复杂。

IRCoT流程图

在官方实现中，仅 Pipeline 部分就需要近 900 行手写逻辑；即便使用标杆级 RAG 框架（如 FlashRAG），也仍需 超过 110 行代码。相比之下，UltraRAG 2.0 只需 约 50 行代码 即可完成同等功能。更值得强调的是，其中约一半还是用于编排的 Yaml 伪代码，这大幅降低了开发门槛与实现成本。

不同框架实现 IRCoT 的代码规模与结构差异

我们进一步展示了不同框架在相同功能实现上的差异。可以看到，FlashRAG 的实现仍然需要较长的控制逻辑，涉及显式的循环、条件判断与状态更新。而在 UltraRAG 2.0 中，这些逻辑仅需 几行 Pipeline YAML 配置 即可表达，分支与循环均以简洁的声明方式完成，避免了繁琐的手动编码。

# 1. 初始检索
questions = [item.question for item in items]
retrieval_results, scoress = self.retriever.batch_search(questions, return_score=True)
for retrieval_result, scores in zip(retrieval_results,scoress):   
    doc2score = {doc_item['id']: score for doc_item, score in zip(retrieval_result, scores)}
    id2doc = {doc_item['id']: doc_item for doc_item in retrieval_result}
    batch_retrieval_results.append(retrieval_result)
    doc2score_batch.append(doc2score)
    id2doc_batch.append(id2doc)
# 2. 开始迭代过程
active_item_ids = list(range(len(items)))  # Track items that need more iterations
while iter_num < self.max_iter:
    # 3. 构建提示词
    input_prompts = [
        self.prompt_template.get_string(
            question=items[item_id].question,
            retrieval_result=batch_retrieval_results[item_id],
            previous_gen=' '.join(batch_thoughts[item_id])
        )
        for item_id in active_item_ids
    ]
    # 4. 生成思维链
    new_thoughts_batch = self.generator.generate(input_prompts, stop=['.', '\n'])
    # 5. 判断循环或结束
    new_active_item_ids = []
    for idx, item_id in enumerate(active_item_ids):
        new_thought = new_thoughts_batch[idx]
        batch_thoughts[item_id].append(new_thought)
        items[item_id].update_output(
                f'intermediate_output_iter{iter_num}', 
                {
                    'input_prompt': input_prompts[idx],
                    'new_thought': new_thought,
                },
            )
        if "So the answer is:" not in new_thought:
            new_active_item_ids.append(item_id)
    # 6. 继续循环
    active_item_ids = new_active_item_ids
    if active_item_ids:
        new_thoughts_for_retrieval = [batch_thoughts[item_id][-1] for item_id in active_item_ids]
        new_retrieval_results, new_scoress = self.retriever.batch_search(new_thoughts_for_retrieval, return_score=True)
        for i, item_id in enumerate(active_item_ids):
            new_retrieval_result, new_scores = new_retrieval_results[i],new_scoress[i]
            for doc_item, score in zip(new_retrieval_result, new_scores):
                doc_id = doc_item['id']
                id2doc_batch[item_id][doc_id] = doc_item
                if doc_id in doc2score_batch[item_id]:
                    doc2score_batch[item_id][doc_id] = max(doc2score_batch[item_id][doc_id], score)
                else:
                    doc2score_batch[item_id][doc_id] = score
            sorted_doc_score = sorted(doc2score_batch[item_id].items(), key=lambda x: x[1], reverse=False)
            sorted_doc_id = [t[0] for t in sorted_doc_score]
            batch_retrieval_results[item_id] = [id2doc_batch[item_id][id] for id in sorted_doc_id]
    iter_num += 1
# 7. 停止并保存结果
for item_id, item in enumerate(items):
    item.update_output('retrieval_result', batch_retrieval_results[item_id])
    item.update_output('pred', ' '.join(batch_thoughts[item_id]))

# 1. 初始检索
- benchmark.get_data
- loop:
    times: 2
    # 2. 开始迭代过程
    steps:
    - retriever.retriever_deploy_search
    # 3. 构建提示词
    - prompt.ircot_next_prompt
    # 4. 生成思维链
    - generation.generate
    # 5. 判断循环或结束
    - branch:
        router:
        - router.ircot_check_end
        branches:
          # 6. 继续循环
          incomplete:
          - custom.ircot_get_first_sent
          # 7. 停止并保存结果
          complete: []
- retriever.retriever_deploy_search
- prompt.ircot_next_prompt
- generation.generate
- custom.ircot_extract_ans

FlashRAG 与 UltraRAG 的代码实现对比

简而不凡：数十行代码实现高性能RAG系统

对 UltraRAG 2.0 而言，“简”并不意味着功能受限。借助 MCP 架构与灵活的 YAML 流程定义，UltraRAG 2.0 为科研人员提供了一个高性能、可扩展的实验平台。研究者可以在极短时间内搭建出类似 DeepResearch 的多阶段推理系统，支持动态检索、条件判断、多轮交互等高级能力。

在示例中，我们将 Retriever、Generation、Router 等模块通过 YAML 串联，构建了一个同时具备循环与条件分支的推理流程，实现了 Plan 生成 → 知识整理 → 子问题生成等关键步骤，而这一切仅需 不到 100 行代码。

示例系统流程图

在性能上，该系统在复杂多跳问题上，相较 Vanilla RAG 性能提升约 12%，充分验证了 UltraRAG 2.0 在快速构建复杂推理系统方面的潜力。

示例系统性能表现

以下展示的是我们构建的示例系统在小红书平台上针对两个真实用户提问所生成的案例：

Case 1：毕业秋招求职

❓问题输入

个人情况大概是本科时没有好好学习成绩很烂然后来了一年水硕硕士期间成绩还不错但是真东西没怎么学到只有一段实习没有项目现在感觉找技术岗对我来说很难很迷茫求一些就业方向的建议#应届生找工作 #应届生 #应届 #秋招 #校招 #26秋招 #水硕

✅生成结果

电子信息专业应届生秋招求职方向建议

求职现状分析

当前电子信息专业应届生在求职过程中普遍面临多重挑战。本科阶段学习态度不积极、成绩不佳，导致基础知识薄弱，缺乏扎实的理论支撑。硕士阶段虽然成绩有所提升，但学习内容偏向“水硕”性质，实际技术能力提升有限，缺乏系统性的专业训练[1]。实习经历较为单一，缺乏实际项目经验和技术深度，难以在技术岗竞争中脱颖而出。此外，电子信息行业对技术能力的要求日益提高，尤其是在AI等新技术的冲击下，初级技术岗位需求减少，应届生求职难度加大[2]。因此，求职者需要正视自身技术储备的不足，同时寻找适合自身背景的就业方向，以提升竞争力。

电子信息行业秋招概况

2026届电子信息行业秋招呈现出对技术人才，尤其是AI相关岗位的强烈需求。各大互联网大厂如阿里巴巴、字节跳动、腾讯、美团等纷纷扩大招聘规模，其中技术类岗位占据核心地位。例如，字节跳动计划招聘超过5000个岗位，研发类岗位占比显著，算法、前端等方向需求增幅最大；阿里巴巴则将AI相关岗位占比提升至六成以上[3]。企业对校招应届生的核心要求集中在技术能力、项目经验以及对AI工具的掌握程度上[4]。此外，实习经历成为重要的筛选标准，有大厂实习经历的本科生甚至比无实习经历的清北硕士生更受青睐。同时，非技术岗位也对求职者的数字化素养提出更高要求，如能熟练使用AI工具进行数据分析或内容创作等。

求职方向探索

对于本科阶段基础薄弱、硕士阶段学习偏“水硕”、实习经历单一的电子信息专业应届生，技术岗的竞争力确实有限，但仍有多个方向可供探索。首先，可考虑技术岗中对项目经验要求相对较低的岗位，如嵌入式软件工程师、硬件测试工程师、软件技术支持工程师等，这些岗位更注重动手能力和基础技能，而非复杂的项目经验[5]。其次，非技术岗如产品经理、市场运营、销售支持等方向也值得考虑，尤其是那些对技术背景有一定要求但更看重沟通能力和市场敏感度的岗位。此外，电子信息专业在跨行业就业中也具备一定优势，例如进入消费电子品牌公司、智能硬件公司或新能源企业，从事产品策划、技术支持、客户服务等工作[6]。通过实习经历的包装和技能的针对性提升，仍有机会在秋招中找到适合自己的岗位。

简历与面试准备

在简历优化方面，电子信息专业应届生应重点突出实习经历，并巧妙弥补项目经验的不足。首先，实习经历的描述应具体、量化，突出实际参与的任务和取得的成果。例如，可以强调在实习中掌握的技术工具、完成的具体任务、以及对团队或项目的具体贡献[7]。其次，如果缺乏项目经验，可以通过参与课程设计、竞赛项目或开源项目来弥补，将这些经历以项目形式写入简历，并突出其中的技术难点和解决方法[8]。此外，简历中的技能部分应结合岗位要求，选择性地列出与目标职位相关的技能，避免泛泛而谈。最后，建议使用简洁清晰的排版，突出重点，便于招聘人员快速捕捉关键信息。在面试准备方面，应针对简历中的内容进行深入准备，确保能够清晰、自信地回答与实习和项目相关的问题，同时展示出对目标岗位的理解和热情。

求职心态与资源支持

在求职过程中，电子信息专业应届生常常会感到迷茫和焦虑，尤其是在面对激烈的竞争和不确定的未来时。首先，要培养成长性思维，相信自身能力是可以通过努力不断进步的，而不是一成不变的[9]。其次，要善于利用弱联系资源，通过参加各类活动、与不同背景的人交流，拓展人脉，获取更多求职信息和机会。同时，要保持积极的心态，通过运动、社交、表达等方式缓解压力，避免陷入“躺平”状态。此外，还可以寻求学校就业指导中心、校友网络、心理咨询等资源的支持，获取职业规划建议和心理调适方法[10]。最重要的是，要设定清晰的目标和计划，逐步提升自身竞争力，以更自信和从容的姿态面对秋招挑战。

Reference

24届电子信息应届硕士生秋招+春招心得与感悟 - CSDN博客. 链接
电子信息（0854）专业学位12个领域详解与就业去向 - 微信公众号. 链接
毕业季 | Dream offer 这样拿！ - 微信公众号. 链接
筑梦研途｜南航研究生求职故事 - 微信公众号. 链接
成功签约最重要的是什么？如何拿下令人心动的offer…中南大学学子就业经验分享 - MBAChina网. 链接
【就业先锋】2025届毕业生程惠甜：筑梦起航，奋斗正当时 - 杭州电子科技大学材料与环境工程学院. 链接
非科班转码，勤勤恳恳自学三年，为什么秋招0offer，颗粒无收！- 牛客网. 链接
毕业季 | Dream offer 这样拿！ - 微信公众号. 链接
筑梦研途｜南航研究生求职故事 - 微信公众号. 链接
24届电子信息应届硕士生秋招+春招心得与感悟 - CSDN博客. 链接

Case 2：高考志愿填报

❓问题输入

弟弟今年高考马上报志愿士官学校和大专走义务兵那个好一点呀？有没有过来人指点一下呀！ #不懂就问有问必答 #万能的小红书

✅生成结果

士官学校与大专走义务兵的优劣分析及选择建议

理解两种选择的基本定义与特点

士官学校是军队院校的一种，主要面向现役士兵招生，培养具备一定专业技术能力的士官人才[1]。士官学校通常设有严格的军事训练和专业课程，旨在为部队输送高素质的技术骨干。士官学校的学生在入学时已是现役军人，接受的是军事化管理和专业技能培训，毕业后直接进入部队服役。

大专走义务兵的含义及政策要求
大专走义务兵是指考生通过高考进入定向培养士官院校（即直招士官生），在高校完成前2.5年的学习后，进入部队进行半年的实习和入伍训练[2]。毕业后直接转为士官，享受现役士官待遇。报考该类院校需参加体格检查和政治考核，合格后方可录取。定向培养士官的招生对象为普通高中应届毕业生，年龄不超过20周岁，且未婚[3]。

两种路径的共同点与差异点
士官学校与大专走义务兵的共同点在于，两者最终目标都是为部队培养专业技术士官。不同之处在于，士官学校面向现役士兵招生，而大专走义务兵则是通过高考进入地方高校进行定向培养，毕业后直接入伍。士官学校的培养更偏向军事化，而大专走义务兵则融合了地方高校的教育和部队的实习训练，更具灵活性。

分析两种选择的优劣势

士官学校的优势与局限
士官学校的优势在于学生入学即为现役军人，享受军人待遇，训练体系成熟，军事化管理严格，专业技能培养针对性强，毕业后直接进入部队服役，无需担心就业问题。此外，士官学校的学生在部队中晋升路径清晰，可通过考核逐步提升军衔等级，待遇随军衔提升而增加。然而，士官学校的局限在于招生对象为现役士兵，普通高中生无法直接报考，且训练强度大、生活节奏紧张，适合有明确军旅志向、身体素质较强的学生[1]。

大专走义务兵的优势与风险
大专走义务兵的最大优势在于通过高考即可进入高校学习，毕业后直接转为士官，享受现役士官待遇，且学费可全额返还[5]。这种模式适合分数不高但有军旅梦想的考生，既能接受地方高校的教育，又能在部队实习中提前适应军营生活。此外，定向培养士官的报考风险较低，即使未被录取也不会影响后续普通专科志愿的录取。然而，这种模式也存在一定风险，如体格检查和政治考核要求严格，部分学生可能在体检或面试阶段被淘汰；此外，部队生活纪律严明，训练强度大，不适合对纪律性要求不高的学生[6]。

对未来就业和发展的潜在影响
从职业发展来看，士官学校的学生在部队中晋升路径明确，适合长期在部队发展的学生。而大专走义务兵的学生则可以选择在部队长期服役，也可以在服役满一定年限后退役，享受国家安置政策或自主择业[7]。从待遇角度看，士官学校的学生毕业后即为士官，待遇稳定；而大专走义务兵的学生在实习后转为士官，待遇与士官学校毕业生基本一致。从灵活性来看，大专走义务兵的模式更具选择性，学生可以根据自身情况决定是否继续在部队服役或退役后进入地方工作。

结合个人情况制定选择策略

在为考生制定士官学校或大专走义务兵的选择策略时，需综合考虑家庭背景、兴趣特长和经济状况等因素。首先，家庭背景是重要考量之一，如果家庭经济条件一般，且希望孩子有一份稳定职业，士官学校或大专走义务兵都是不错的选择，因为两者均提供学费代偿和稳定待遇，且毕业后直接进入部队服役，无需担心就业问题[8]。其次，兴趣特长决定了学生是否适合部队生活。如果学生对军事有浓厚兴趣，具备较强的纪律性和吃苦耐劳精神，士官学校或大专走义务兵都能提供良好的发展平台[9]。但如果学生对部队生活兴趣不大，或者更倾向于地方工作，则应慎重考虑是否选择此类路径。最后，经济状况也是关键因素，士官学校和大专走义务兵均能减轻家庭经济负担，但若家庭条件较好，学生希望接受更广泛的教育，可考虑先通过普通大专或本科教育提升学历，再选择是否入伍。

过来人的经验与建议

定向培养军士毕业后直接进入部队服役，且在部队的晋升路径明确，但服役时间较长，通常至少5年，部分人服役满12年后才可转业[10]。士官学校的毕业生则在部队中发展稳定，但需具备较强的适应能力和吃苦精神。相比之下，大专走义务兵的学生在服役期满两年后可选择退役，灵活性更高，但部队中的专业技能可能在地方上应用有限。此外，有经验者指出，若家庭条件一般且希望孩子有一份稳定职业，士官学校或定向培养士官是较为稳妥的选择。而如果只是想体验军旅生活或短期服役，大专走义务兵更合适[11]。总体来看，选择哪种路径需结合个人职业规划和家庭实际情况综合考虑。

最终决策建议与行动指南

在做出最终决策时，建议考生结合自身兴趣、家庭条件和未来职业规划，综合权衡士官学校和大专走义务兵的优劣势。如果希望长期在部队发展，并具备较强的纪律性和适应能力，士官学校或定向培养士官是较为理想的选择[12]。若更倾向于接受地方教育，同时对军旅生活有一定兴趣，大专走义务兵则更具灵活性。在志愿填报时，应优先选择与自身兴趣和特长匹配的院校和专业，并确保符合体检和政审要求。此外，考生应提前准备体检和政审材料，确保顺利通过相关考核[13]。最后，无论选择哪条路径，都应树立明确的职业目标，并为未来的发展做好充分准备。

Reference

士官学校冷门原因及转军校可能性解析 - 乐见教育. 链接
定向培养军士和上完大专当兵有什么不同 - 智优志愿服务. 链接
高考后，直招士官学校是一个好选择？ - 搜狐. 链接
大学毕业后参军的几大优势！（专科&本科） - 军界PLA. 链接
定向培养士官值得报考吗?有什么优缺点? - 腾讯新闻. 链接
武警定向培养士官政策解答 - 辽宁省交通高等专科学校学生管理处. 链接
定向士官淘汰率多高？最新官方数据与淘汰情形 - 掌上高考. 链接
定向士官培养期间淘汰率与常见淘汰原因 - 瀚博招生网. 链接
同是入伍，定向士官与义务兵的四个不同 - 微信公众号“从宇升学规划”. 链接
高考300-450的逆袭路：定向士官 vs 大专当兵 - 搜狐. 链接
一次说清楚，大学毕业后当兵的三大优势！！！ - 锦州军创. 链接
士官学校毕业去哪儿？解析技术岗、管理岗与跨军种分配 - 领航教育. 链接
军考辅导：考士官学校是不是比军官学校容易一些？ - 哔哩哔哩. 链接

示例系统生成案例

UltraRAG 2.0 让复杂推理系统的构建真正做到 低代码、高性能、可落地。用户不仅能在科研任务中获得性能提升，也能够在行业应用中快速落地，例如智能客服、教育辅导、医疗问答等典型场景，输出更可靠的知识增强答案。

秘诀：MCP 架构与原生流程控制

在不同的 RAG 系统中，检索、生成等核心能力在功能上具有高度相似性，但由于开发者实现策略各异，模块之间往往缺乏统一接口，难以跨项目复用。Model Context Protocol (MCP) 作为一种开放协议，规范了为大型语言模型（LLMs）提供上下文的标准方式，并采用 Client–Server 架构，使得遵循该协议开发的 Server 组件可以在不同系统间无缝复用。

受此启发，UltraRAG 2.0 基于 MCP 架构，将 RAG 系统中的检索、生成、评测等核心功能抽象并封装为相互独立的 MCP Server，并通过标准化的 函数级 Tool 接口 实现调用。这一设计既保证了模块功能扩展的灵活性，又允许新模块以“热插拔”的方式接入，无需对全局代码进行侵入式修改。在科研场景中，这种架构让研究者能够以极低的代码量快速适配新的模型或算法，同时保持整体系统的稳定性与一致性。

UltraRAG 2.0 框架示意图

复杂 RAG 推理框架的开发具有显著挑战，而 UltraRAG 2.0 之所以能够在 低代码 条件下支持复杂系统的构建，核心在于其底层对多结构 Pipeline 流程控制 的原生支持。无论是 串行、循环还是条件分支，所有控制逻辑均可在 YAML 层完成定义与调度，覆盖复杂推理任务所需的多种流程表达方式。在实际运行中，推理流程的调度由内置 Client 执行，其逻辑完全由用户编写的外部 Pipeline YAML 脚本 描述，从而完成与底层实现的解耦。开发者可以像使用编程语言关键字一样调用 loop、step 等指令，以声明式方式快速构建多阶段推理流程。

# 串行：依次执行工具
pipeline:
- benchmark.get_data
- retriever.retriever_deploy_search
- prompt.qa_rag_boxed
- generation.generate
- custom.output_extract_from_boxed
- evaluation.evaluate

# 循环：循环执行一组工具
pipeline:
- benchmark.get_data
- retriever.retriever_deploy_search
- loop:
    times: 3  
    steps: 
      - prompt.generate_subquery
      - generation.generate  
      - retriever.retriever_deploy_search
- prompt.generate_answer
- generation.generate
- evaluation.evaluate

# 分支：根据路由结果执行不同工具
pipeline:
- benchmark.get_data
- retriever.retriever_deploy_search
- loop:
    times: 3         
    steps:
    - prompt.generate_query_or_answer
    - generation.generate
    - branch:
        router:
          - router.check_query_or_answer   
        branches:
          is_query:
            - retriever.retriever_deploy_search
          is_answer: []    
- evaluation.evaluate

多结构 Pipeline 流程控制：顺序 / 循环 / 分支

通过将 MCP 架构 与 原生流程控制 深度融合，UltraRAG 2.0 让复杂 RAG 系统的搭建像“编排流程”一样自然高效。此外，框架内置 17 个主流 benchmark 任务与多种高质量 Baseline，配合统一的评测体系与知识库支持，进一步提升了系统开发的效率与实验的可复现性。

欢迎访问教程文档快速上手 UltraRAG 2.0！

更少代码，更低门槛，更快实现

UltraRAG 2.0：面向科研的“RAG实验”加速器

大道至简：让科研实验专注思想而非工程

IRCoT流程图

不同框架实现 IRCoT 的代码规模与结构差异

FlashRAG 与 UltraRAG 的代码实现对比

简而不凡：数十行代码实现高性能RAG系统

示例系统流程图

示例系统性能表现

Case 1：毕业秋招求职

电子信息秋招求职

❓问题输入

✅生成结果

求职现状分析

电子信息行业秋招概况

求职方向探索

简历与面试准备

求职心态与资源支持

Reference

Case 2：高考志愿填报

士官学校 vs 大专走义务兵

❓问题输入

✅生成结果

理解两种选择的基本定义与特点

分析两种选择的优劣势

结合个人情况制定选择策略

过来人的经验与建议

最终决策建议与行动指南

Reference

示例系统生成案例

秘诀：MCP 架构与原生流程控制

UltraRAG 2.0 框架示意图

多结构 Pipeline 流程控制：顺序 / 循环 / 分支