当人们探讨AI安全的议题时,我们究竟在关注哪些核心问题?
是暴力内容、偏见歧视,还是伦理困境?这些固然重要,但对于将AI投入实际业务的企业而言,有一条更为致命却长期被忽视的安全红线正频繁被触及:你精心打造的"法律咨询"聊天机器人,可能正在热情洋溢地为用户提供医疗建议。
这仅仅是模型偶尔偏离主题那么简单吗?不,这本身就是一种安全隐患。
在这篇最新研究中,来自南洋理工大学等机构的学者们首次提出了一个创新概念——运行安全(Operational Safety),旨在彻底重塑我们对AI在特定场景下安全边界的认知。

论文标题:OffTopicEval: When Large Language Models Enter the Wrong Chat, Almost Always!
论文地址:https://arxiv.org/pdf/2509.26495
论文代码:https://github.com/declare-lab/OffTopicEval
评测数据集:https://huggingface.co/datasets/declare-lab/OffTopicEval
