前瞻AI安全评估体系与基座平台入选北京前沿成果
新京报贝壳财经讯(记者罗亦丹)2026北京人工智能创新高地建设推进会于1月5日举办,会上发布了北京人工智能8大前沿成果。其中,由北京前瞻人工智能安全与治理研究院发布的“前瞻人工智能安全评估体系与基座平台”在列。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
作为人工智能安全与治理的代表性北京创新成果,“前瞻人工智能安全评估体系与基座平台”探讨如何以安全为基石,引领人工智能的稳健发展。该体系突破传统安全评估的单一维度局限,形成了全领域、多层次的评估框架。从覆盖范围来看,它植根基础安全,延伸至具身智能安全、科学智能安全、社会安全、环境安全、灾难性与生存性风险五大维度,覆盖教育科研、医疗健康、金融经济、信息传媒、工业基建、政务民生等多个关键领域。从评估重点来看,特别聚焦隐私与数据保护、滥用恶用、身心伤害、虚假信息防范、自主人工智能高阶风险等核心痛点,进行体系化设计与评估。
前瞻院通过测试发现了一个关键问题:近年来的大模型在安全性方面并未明显提升,部分新近模型的攻击成功率甚至更高。但同时前瞻院也验证了一个重要结论:人工智能模型防御并不必然需要重新训练模型,在在线推理阶段通过部署安全护栏,就能显著提升模型安全水平。针对前瞻安全基准中的各类风险,前瞻院打造了“前瞻·灵御”AI安全攻防平台,可为企业提供标准化评估流程、全面系统的安全分析,帮助企业准确识别模型安全水平,并提供针对性的防护方案与加固建议。
此外,前瞻院还构建了“前瞻·灵度”AI伦理评估平台,专注于AI伦理的智能评估与价值校准。平台能够对上百个大模型进行实时动态监控与并行测试,评估其在六大维度、90个细分类别的伦理合乎度。其集成了以中国价值观为核心的大规模中文价值语料库,覆盖3个层面、12个核心价值、50个衍生价值,累积25万余条规则;收录了全球200余项伦理原则与规范,以及40余项中英文法律法规与国际公约,提供精准的合规指引。可以对人工智能、数据安全、神经科学、脑机接口、医疗健康、生物安全、危险化学物质、核物质、自动驾驶等领域进行自动化伦理评估辅助。
前瞻院认为,人工智能安全应成为“第一性原理”,是不可删除、无法违背的底线要求。安全治理能力基座的构建是北京引领人工智能稳健发展的基础,让我们更有把握地将AI安全地应用于现代化建设,与全世界共享人工智能发展的机遇与成果。
编辑 杨婧媛
校对 陈荻雁
相关攻略
网易汽车3月18日综合报道2昨日,元戎启行作为全球领先的人工智能企业代表,再次受邀参加由NVIDIA主办的GTC大会。会上,元戎启行CTO曹通易发表技术主题演讲,系统介绍了以Foundation M
北京商报讯(记者 魏蔚)3月16日,智谱推出一个面向OpenClaw龙虾场景深度优化的基座模型GLM-5-Turbo。GLM-5-Turbo从训练阶段就针对龙虾任务的核心需求进行专项优化,增强如工具
新京报贝壳财经讯(记者罗亦丹)在近期“龙虾”(OpenClaw)热潮下,Kimi、MiniMax等国产模型因相对便宜、性价比高的特点成为不少“龙虾”用户的使用首选,这一“卖铲人”的角色也让上述公司收
一个模型,改变行业。作者|张麟如今,讨论自动驾驶系统的终极模型架构究竟是VLA还是世界模型,对实现L4自动驾驶能力已经变得毫无意义。3月2日,小鹏汽车举办了马年春节后的第一场发布会,宣布第二代VLA
一凡 发自 凹非寺量子位 | 公众号 QbitAI2026,什么最火爆?具身智能和世界模型,今年合计已吸金超300亿元,前者是物理AI落地的产品,后者是物理AI的“训练场”,它们共同组成了物理AI的
热门专题
热门推荐
IT之家 3 月 30 日消息,彭博社记者马克 · 古尔曼昨天在最新一期《Power On》通讯中表示,他对苹果首款折叠屏手机 iPhone Fold 寄予厚望。他表示,这款手机将成为“iPhone
3月29日消息,Intel全新的Arrow Lake Refresh系列处理器酷睿Ultra 200S Plus已经于3月26日正式上市,包括酷睿Ultra 5 250K Plus和酷睿Ultra
企查查正式推出智能体数据平台(agent qcc com),可通过标准MCP协议对接阿里云百炼、扣子Coze、飞书集成平台等主流Agent平台。该平台针对AI Agent企业级应用面临的模型幻觉、上
【张雪机车获世界顶级赛事冠军】在3月28日进行的世界超级摩托车锦标赛(WSBK)中量级赛事(葡萄牙站)中,法国车手Valentin Debise驾驶张雪机车(编号53)820RR-RS车型,以领先近
IT之家 3 月 30 日消息,GoPro 上周(3 月 25 日)宣布将在 4 月 19 日-22 日的 NAB Show 2026 展会上发布新一代相机产品,搭载下一代 GP3 影像处理器。据介





