AI高考志愿填报,能否比人类咨询师更靠谱?最新测评给出答案
6月23日,国内首份聚焦高考志愿填报场景的AI能力测评报告——《高考志愿AI测评基准》正式发布。该报告由独立研究团队友松实验室完成,首个测评对象是依托夸克8年高考服务数据与经验构建的千问高考志愿填报Agent。
测评结果令人惊喜:千问在多项核心指标上已达到人类资深志愿咨询师的水准,在稳定性、精确性、结构化表达以及效率等维度上,优势尤为显著。
选择千问作为首个测评对象并不意外——凭借夸克长达8年的高考服务数据积累,其产品形态、数据基础与用户覆盖面在行业内均属标杆级。换言之,这绝非临时凑数的选手。

对照组则由53名从业者组成,平均从事志愿咨询工作4.6年,绝非新手。整个测评覆盖高考志愿填报的四大核心环节:基本事实与规则问答、模拟志愿填报、开放式咨询以及志愿推荐报告生成——这意味着,从查资料、看规则,到排方案、做决策,考生和家长可能经历的每一步都得到了系统拆解。
数据表现相当硬核。在44道客观题中,千问的准确率达到100%,全部答对;而人类咨询师的平均正确率为89.3%。模拟填报环节,千问生成的方案包含6个可录取志愿,未出现任何显性偏好偏离,并精准命中考后评估出的最优录取结果;相比之下,人类咨询师平均只能给出5.3个可录取志愿。

在开放式咨询环节,表现更为突出。评审专家在100场匿名盲比中,有58次选择了千问的回答。千问的回答被评为“可直接向学生和家长展示”的比例为56.0%,而人类咨询师仅为33.0%。专家们一致认为:千问在专业路径拆解、风险提示以及表达清晰度方面,展现出更稳定的水准。
可以说,在给定的任务范围内,千问的多项表现已能与资深人类咨询师比肩。尤其是在稳定性、精确性与结构化表达上,优势几乎是压倒性的。
然而,报告也特别指出:人类咨询师的核心价值,并非算法所能替代。例如,涉及收入预期、就业判断等需要结合家庭个体情况谨慎权衡的话题时,咨询师更能提供贴合实际的建议。而在亲子协商、价值取舍这类充满人情味的场景中,即便是结构再漂亮的AI方案,也无法替代人与人之间真实的沟通与判断。
报告给出的建议务实而清晰:AI更适合在信息核验、资料整理与方案初筛这些高效环节发力;而人类咨询师则可将精力集中于家庭沟通、价值引导与个性化决策上。两者形成互补,既能提升填报的效率与准确性,也能更好回应用户和家庭的真实需求——这才是高考志愿填报应有的理想形态。
