距离 SuperSonic 上个版本发布已过去两个月,但不少用户早已从 master 分支抢先体验了新特性,并陆续提交了大量反馈和 Pull Request。可以说,社区的力量为项目注入了强劲动力。0.9.8 版本的核心关键词,可以凝练为两个词:实用与灵活。

在实用层面,从大模型连接、语义层到记忆管理和问答体验,多个模块都迎来了新功能与交互升级;在灵活层面,用户现在可以从更多维度定制自己所需的 Chat BI 环境,例如提示词配置、多轮对话策略、是否启用用户确认机制,乃至 SQL 修正和数据解读均可按需启用。
简单来说,SuperSonic 的“可玩性”提升了一个档次,正在向更通用的 Chat BI 框架持续迈进。
大模型管理:告别分散式配置
过去,大模型的连接配置要么在助理级别局部设置,要么在系统设置中全局完成。但随之而来的是:同一连接如何被多个助理复用?不同场景下如何灵活切换大模型?以及每个场景的提示词如何实现差异化定制?
问题主要聚焦在三个方面:复用、场景选择与提示词定制化。
新版本对这一部分进行了重构。交互上最直观的变化,是新增了一个独立的大模型管理模块,与数据库管理并列。在助理管理下,则新增了大模型配置模块——用户可以为不同场景选择一个大模型连接,同时也能调整对应的提示词。
Dify 连接器:直接响应社区呼声
不少社区用户已经使用 Dify 搭建了 AI 应用工作流,他们期望 SuperSonic 能直接通过 Dify 对接大模型。这一需求非常明确,新版本在接口协议中新增了 DIFY 类型。
维度管理:终于实现可控管理
维度值本质上是企业的私有知识库。SuperSonic 一直支持从数据库自动导入维度值来构建词典,但此前缺少管理界面,用户无法方便地搜索、编辑或维护。新版本升级了维度管理界面,让导入、搜索、编辑等操作变得流畅高效。
记忆管理:手动注入,冷启动更轻松
0.9.4 版本引入的记忆抽象,简单来说就是将历史成功的问答转化为未来的 few-shot 提示词,这是增强大模型生成能力的关键手段之一。理论上,它能让助理实现“持续学习进化”。
但问题在于:如果记忆完全依赖用户实际问答,那么冷启动阶段助理将没有任何记忆可用。此前的解决方式是配置一些示例问题,由系统后台自动触发问答来填充记忆——这属于间接手段。部分专业用户希望直接手动注入记忆。新版本因此新增了手动录入功能。需要提醒的是,Schema 映射和语义 S2SQL 的录入有特定格式,建议参考系统自带的 s2-exemplar.json 案例。
语义 S2SQL:引入 WITH 子句,拓宽应用场景
SuperSonic 的核心理念是融合 Headless BI 与 Chat BI。具体到查询流程,是一条清晰的路径:用户自然语言 → 语义 S2SQL → 数据库 SQL。通过语义层作为中转,优势显而易见:既能充分利用数据语义信息增强理解,又能缩小问题空间,将多表 join、计算公式、SQL 方言等复杂语句对模型屏蔽。
为了应对更多元化的提问,支持带 WITH 子句的 S2SQL 成为必须突破的关卡。新版本对语义层进行了针对性优化,应用场景大幅扩展。
语义建模:外键关联正式到来
前面提到,语义层的重要作用之一是屏蔽复杂语句,例如多表 join。这就要求在建模时,模型间的关联关系必须清晰定义。过去 SuperSonic 仅支持主键之间的关联,这带来了一些不必要的限制。新版本支持定义外键,并实现了外键与主键的关联。
问答交互:用户确认机制,让意图更精准
如何精准理解用户问题,匹配到正确的数据集和指标维度,一直是问答有效性的核心挑战。许多场景下,用户表述与数据语义都存在模糊地带,系统很难稳定命中意图。
此前的做法是使用启发式规则对候选解析结果打分,默认选择得分最高的。但启发式规则几乎无法覆盖所有场景,bad case 自然难以避免。新版本对 Query 流程进行了升级,支持流程暂停——待候选意图解析确认后,再继续执行。
这个用户确认特性可以在助理管理中开启或关闭。关闭时回退到传统启发式规则,开启时则将选择权交给用户。
再试一次:为概率输出提供纠错机会
大模型本质上是概率输出,即便 temperature 设为 0,两次调用也可能产生截然不同的结果。之前 SuperSonic 通过 self-consistency 机制,系统触发多次并行调用,再按投票选出多数相同的结果。新版本更进一步,增加了一个再试一次按钮,让用户自行决定是否重跑。初步经验表明,部分 bad case 在重跑之后结果正确。
基于大模型的 SQL 修正(Experimental)
从初版开始,SuperSonic 就实现了基于规则的 Corrector。但随着社区实践的深入,场景越来越多样化,规则的局限性也逐渐暴露,有时甚至“帮倒忙”。新版本引入了基于大模型的 Corrector,用户可以选择开启,并支持自定义提示词。不过,该特性尚未经过广泛实践验证,因此默认关闭并标记为 Experimental。欢迎社区用户试用反馈,共同推动其迭代优化。
基于大模型的数据解读(Experimental)
SuperSonic 一直默认使用可视化图表来呈现结果,但不少用户提出希望系统能对数据做进一步总结和分析。坦率地说,我们调研过一些具备数据洞察分析能力的产品,目前体验仍较为有限,给出的结论不够深入,食之无味。这也可以理解,因为洞察分析具有强烈的领域属性,很难采用通用模板,必须因地制宜。
虽有不足,但弃之也觉可惜。本着先上线再优化的原则,新版本推出了一个 Experimental 版本。用户在助理管理中打开数据解读后,即可看到该功能。未来可能会设计某种机制,让领域知识和经验融入其中,使其真正变得实用。
