人大高瓴AI金融分析师超越GPT-5与Gemini Deep Research查数据画图表写研报

时间：2026-06-19 13:52

中国人民大学高瓴人工智能学院提出多模态研报生成系统玉兰·融观，能自动拆解任务、搜集多源数据并生成万字图文报告。该系统在AFAC2025夺冠，多项评测超越GPT-5等模型，展现接近人类专家的金融分析与写作能力。

一款能够自动检索数据、撰写深度分析并绘制专业金融图表的AI金融分析师正式登场！

近日，中国人民大学高瓴人工智能学院推出了一款面向真实金融投研场景的多模态研报生成系统——玉兰·融观（Yulan-FinSight）。该系统能够生成图文并茂的专业研究报告，全面覆盖从数据采集到视觉呈现的完整流程。

面对用户的研究需求，FinSight能够智能拆解任务，自动从互联网及金融数据库中搜集股价、财务报告、新闻资讯等多源异构数据，并生成包含“发展历程”、“核心业务架构”、“竞争格局”等章节的万字级图文分析报告。

△

该系统在AFAC 2025金融智能创新大赛挑战组的1289支队伍中脱颖而出、荣获冠军，并在多项评测中展现出超越GPT-5 w/Search、OpenAI Deep Research及Gemini-2.5-Pro Deep Research的卓越性能，其金融分析与写作能力已接近人类专家水准。

以下为您带来详细解读。

为何通用AI难以胜任金融研报？

问题的核心并非模型“不会写作”，而是金融行业的研究报告本身就是一项高度结构化、逻辑严密且依赖多模态可视化的专业级任务。其涉及的多重流程，远非简单的问答或文本生成所能比拟。

金融投研对数据的整合能力、分析深度及表达形式的要求，远超通用任务。具体而言，现有通用AI系统主要面临以下三大挑战：

1、领域知识与数据割裂：
通用搜索系统难以有效融合股价、财务报表等结构化金融数据，以及新闻、公告等非结构化信息。由于缺乏统一的数据表示与多智能体协作分析机制，系统往往只能对单一信息源进行浅层处理，难以形成系统性的金融洞察。

2、专业可视化能力缺失：
金融研报高度依赖图表来传递高密度信息。然而，现有模型大多只能生成静态图片或简单折线图，无法支持多维对比、事件标注等专业金融图表需求。同时，图文之间缺乏严格的数据一致性约束，图文无关甚至信息矛盾的情况时有发生。

3、缺乏“迭代式研究”能力：
绝大多数系统仍采用固定的“先检索、后生成”流程，研究路径一旦确定便难以调整。而人类分析师恰恰相反，他们会根据中间发现不断修正研究重点。这种基于中间结果的动态策略调整能力，正是当前通用AI系统普遍欠缺的。

FinSight的核心思路：模拟金融分析师的工作模式

为突破上述局限，FinSight并未简单地“堆砌模型”，而是从认知流程入手，模拟人类金融专家的工作方式，并提出了三项关键技术创新。

核心架构：代码驱动的可变内存智能体架构

△

FinSight底层采用了一种全新的、名为Code-Driven Variable-Memory（CA VM）的多智能体架构。现有Agent架构本质上受限于对话式记忆范式，即以消息或任务进度等历史作为状态载体。当任务复杂度与流程长度增长时，这种方式容易暴露出表达能力与可控性的结构性瓶颈。

CA VM将这一范式重构为代码驱动的变量记忆空间。系统不再以自然语言对话作为协作媒介，而是将数据、工具与中间推理结果统一映射为可读写的程序变量，由多个Code Agent通过共享变量空间完成协同推理。通过将“记忆”从消息序列提升为可操作的变量结构，CA VM使得复杂任务得以显式建模、持续修正与模块化组合，为长时程、多流程的专家级推理提供了必要的结构支撑。

△

在这一设计中，数据、工具和智能体被统一抽象为可编程变量空间：财务报表、行情数据、新闻文本作为数据变量；搜索、分析、绘图等能力作为工具变量；不同功能的Agent通过Python代码进行调度与协作。这种“以代码为中枢”的设计，使系统能够高效处理大规模异构金融数据，并支持复杂的多流程任务协作。

视觉突破：迭代式视觉增强机制

针对金融图表生成中普遍存在的专业性与可信度问题，研究团队提出了Iterative Vision-Enhanced Mechanism，将绘图过程建模为一个可迭代优化的视觉生成问题。

△

该机制采用了Actor–Critic协作范式：文本大模型作为Actor，负责生成可编译、可执行的绘图代码，充分发挥其在代码生成与逻辑控制上的优势；而视觉语言模型则作为Critic，直接对图像进行视觉层面的审视，从数据完整性与整体美观性等维度提供反馈。

这一设计的精髓在于优势互补：语言模型擅长编码与思考，却难以获取真实的视觉反馈；视觉模型具备强大的感知与判别能力，但在复杂代码生成上能力受限。通过将二者解耦并置于闭环中，系统在测试阶段通过多轮“生成—评估—修正”实现持续优化，使绘图质量随迭代次数自然提升。

△

最终，系统能够稳定生成包含双轴对齐、事件标注以及复杂结构的专业金融图表，将原本一次性生成的静态结果，转化为一种测试时可扩展的过程。

两阶段写作框架：先分析，再成文

在写作层面，FinSight并不试图一次性生成完整的长篇研报，而是将研报写作重构为“分析—整合”的两阶段过程。

△

首先，系统生成一组“分析链”（Chain-of-Analysis，CoA）：每条分析链对应一个明确的子任务（如公司历程、财务分析、竞争对手分析、风险因素等），在局部范围内完成证据收集、关键判断与核心结论提炼。这一步骤的必要性在于，一份研究报告往往由多个子问题耦合构成，若直接端到端生成长文，很难兼顾所有分析的准确性和深度。

随后，系统以这些CoA作为“骨架”，将分散的洞察在全局层面进行组织与编排，生成大纲并分章节逐步撰写。在保证章节结构与论证链条连贯的同时，将文本叙述、数据引用与图表呈现进行对齐，最终合成为一份逻辑自洽的长篇报告。这种“先分析、后写作”的策略，有效避免了长文常见的逻辑松散问题，使报告在篇幅超过2万字时仍能保持结构清晰、论证深入。

为了进一步保证长篇研报中的事实准确性与图文一致性，研究团队在写作阶段还引入了一种生成式检索（Generative Retrieval）机制。不同于传统“先检索、后生成”的后处理做法，该方法将检索过程嵌入写作本身：模型在生成具体段落时，会根据当前的分析链与写作上下文，动态生成数据和图片的索引标识符，再通过后处理统一嵌入。这样一来，引用的准确性和图文的一致性得到了最大程度的保证。

△

通过这种方式，FinSight能够在长篇写作过程中持续对齐文本叙述、数据来源与可视化结果，有效避免了常见的事实错配与图文脱节问题，从而在报告篇幅不断扩展的情况下，依然保持整体逻辑与证据链的稳定性与一致性。

实验结果：全面超越现有Deep Research系统

研究团队在涵盖公司研究与行业研究的高质量基准测试中，对FinSight进行了系统评估。

结果显示，FinSight在事实准确性、分析深度与呈现质量三项核心指标上均显著优于Gemini-2.5-Pro Deep Research与OpenAI Deep Research，综合评分达到8.09。在可视化维度上，得益于迭代式视觉增强机制，FinSight获得9.00的评分，明显领先对比系统，充分体现了其在专业金融图表生成能力上的有效提升。

而迭代式绘图的效果分析同样令人瞩目：

在长文本生成场景中，系统生成的研报平均长度超过20000字，包含50余张图表与结构化数据引用，且随着篇幅增长，报告质量保持稳定，未出现显著退化。

此外，在AFAC 2025金融智能创新大赛中，FinSight在来自企业与高校的1289支参赛队伍中排名第一，荣获挑战组赛题四冠军，进一步验证了其在真实场景中的实用性与鲁棒性。

FinSight不仅仅是一个金融工具，它更展示了Agent架构在高复杂度垂直领域中的巨大潜力。通过统一数据、工具与智能体，并引入视觉与写作的多阶段闭环，AI系统首次在金融投研这一“专家密集型”场景中，展现出接近人类分析师的工作能力。

这一范式的意义远不止于金融。它表明，在那些高度依赖专业知识、长时程推理与多模态表达的“专家密集型”场景中，AI系统不再只是信息汇总器，而是开始承担起类似人类专家的工作方式：分解问题、验证假设、修正结论，并最终形成可被审阅与追溯的完整成果。

从这个角度来看，FinSight更像是一个起点。随着Agent架构的不断成熟，未来的科研分析、法律研判、医疗决策等复杂领域，或将逐步迎来以专家级AI Agent为核心的新一代生产力形态。

来源：https://www.aiagiai.com/15931.html

上一篇Karpathy坦言：作为程序员从未如此焦虑落后 下一篇首批AI原生应用企业交出答卷

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-07-02

内网RPA离线部署从依赖打包到7×24无人值守踩坑与避坑方案

这三年，内网RPA项目接了不下二十个。每次开局都像闯关——断网、缺依赖、多机同步、定时执行、批量分发、源码保护、AI离线化，八个坑一个比一个深。今天把这些实战经验整理出来，希望能帮正在内网搞自动化的兄弟们少踩点雷。一、内网无网络环境怎么部署RPA流程：先搞清楚什么叫“真离线” 很多工具宣传“支持本

AI教程 · 2026-07-02

水利工程师用WorkBuddy写洪水报告效率提升3倍

WorkBuddy开发者分享季水利工程师AI提效实战：用WorkBuddy撰写洪水影响评价报告，效率提升3倍 WorkBuddy 效率人工智能开发工具一、我是谁，为什么需要AI 先介绍一下自己——我是一名水利工程师，在湖南长沙的一家小型水利设计公司任职。当前行业环境不太

AI教程 · 2026-07-02

日志服务数据加工规则洞察仪表盘使用指南

数据加工诊断仪表盘想实时掌握日志服务加工功能的运行状态？直接从加工列表页点击那个“规则洞察”按钮，仪表盘就会立刻呈现出来。入口就在那儿，不绕弯子。跳转后，你可以按作业名称、实例ID或源LogStore来筛选任务状态。比如下边这张图，展示的是当前实例ID（90c9d47714dbb807d47c1

AI教程 · 2026-07-02

基于RFID的固定资产管理系统技术架构与工程实践

固定资产管理难题是众多企事业单位的普遍困扰，资产数量动辄数千件，且广泛分布于不同部门、楼层乃至园区。传统人工盘点方式在工程维度上始终面临三大关键瓶颈：采集效率低下、数据闭环中断、状态同步滞后。使用条码枪逐一扫描标签，识别距离通常不超过30厘米，操作人员需逐个寻找并扫描，盘点效率完全受限于人力。面对5

AI教程 · 2026-07-02

WorkBuddy实战用AI搭建A股智能盯盘助手省心高效

炒股的朋友们想必都深有体会——每天重复盯盘、查行情、分析板块轮动，这一整套流程下来耗费大量精力。手动翻查数据不仅身心俱疲，还很容易错过关键买卖节点。今天我们就来聊聊如何打造一款趁手的盯盘工具，借助AI替你分担这些重复性工作。背景：盯盘的核心痛点股民都有同感——每天不只要查询单只股票的实时行情，还