抖音AI主动反网暴全新上线开启智能防护

时间：2026-06-14 11:47

抖音推出AI反网暴Agent系统，从“被动等举报”转向“主动找风险”。通过识别模型与研判模型协同，日均识别潜在风险人群扩大91 5%，人工外呼受害者增长147%。平台建立分层保护机制，低风险用户收到提醒，高风险用户专人援助，并对施暴者梯度处置。

你是否曾在评论区遇到过“到七天了吗”这类看似平常的询问？它表面是简单提问，背后却可能隐藏着一场针对特定网购用户的、有组织的无声围猎。如今的网络暴力早已改头换面，不再局限于直接的辱骂，而是演变为利用表情包进行阴阳怪气、借助谐音梗进行人身攻击、通过断章取义来带节奏——这种更具隐蔽性的恶意，往往让传统的审核机制难以有效识别。更为严峻的是，许多伤害来自长期、零散的持续性骚扰，这些看似微小的恶意累积起来，足以对当事人的心理与精神状态造成沉重打击。

正是为了应对这一日益复杂的挑战，抖音平台近期升级并推出了一套系统化的AI反网暴举措，其核心是一套名为“AI反网暴Agent”的智能系统。该系统让AI识别模型、研判模型与人工审核协同作业，并同步优化了外呼救助流程。从早期风险识别、事件综合研判，到主动干预治理、启动外呼援助，平台构建了一个完整的反网暴处置链条。这标志着平台治理思路的重要转变：从过去“被动等待用户举报”转向如今“主动发现并预警风险”。

成效数据颇为显著：系统升级后，平台日均识别出的潜在网暴风险用户数量提升了91.5%，每日有数千名收到风险预警的用户主动开启了评论过滤等防护功能；因风险等级较高而获得人工外呼主动援助的受害者数量，更是增长了147%。

变被动为主动：平台提前识别网暴风险信号

传统的“人工审核+用户举报”后处置模式，已难以匹配当下多变、隐蔽的网络暴力形态。其一，依赖举报往往意味着伤害已然发生，无法实现事前预警与防范；其二，常规审核通常只能覆盖短时间内的内容，容易遗漏那些持续时间长、跨越多个热点周期的持续性攻击，更难以根据不同用户群体的心理承受能力进行差异化判断——对成年网民可能无伤大雅的“玩梗”，对青少年群体而言可能就是巨大的心理负担。

升级后的AI反网暴Agent系统，通过让识别模型与研判模型协同运作，能够在网暴风险发酵的早期阶段就捕捉到异常信号。识别模型不再孤立地分析单条评论的关键词，而是综合评估用户的整体互动态势——当某用户的评论区突然涌入大量负面言论、其主页被频繁访问、或@该用户的异常信息激增时，系统便会启动计算，生成该用户的“网暴风险指数”。更为智能的是，系统具备持续学习能力，能全天候复盘误判案例，自主学习新兴的网暴话术与手段，即便是刚流行的新梗攻击也能快速识别，有效堵截恶意规避审核的行为。

研判模型则赋予平台更宏观的“事件视角”，进行全局分析。它整合用户近30天内的文字、图片、视频及音频等多模态互动数据，致力于还原事件的全貌与脉络，从而精准区分正常的观点交锋与恶意的攻击围猎，最大限度避免误伤，保障健康的讨论氛围。针对未成年人、老年人等需要特殊保护的群体，模型还设置了差异化的识别标准，适度提升风险敏感度。其最终输出的研判报告清晰包含事件经过、风险源头、关键证据链等信息，极大提升了人工审核专家介入处置的效率，为及时开展外呼救助争取了宝贵时间。

分层保护与精准响应：为受害者构建支持网络

基于AI反网暴Agent提供的精准识别与研判结论，平台已建立起一套更精细、更人性化的分层保护与响应机制。对于低风险用户，平台主要通过App站内信进行提醒，用户可一键启用“防网暴模式”，开启评论过滤、限制陌生人私信等功能；对于高风险用户，或经识别属于未成年人等特殊保护群体的，平台则会主动通过智能外呼电话联系用户，并安排专人对受害者提供一对一协助，同时排查是否存在个人信息泄露等衍生风险，防止侵害影响进一步扩大。

在施暴者处置方面，平台依据违规情节的严重程度，采取阶梯式管理措施：包括但不限于下架违规内容、限制互动功能直至永久封禁账号。对于组织化、跨账号持续骚扰等情节恶劣的行为，平台将启用更严厉的升级处置方案；如涉嫌违法犯罪，平台将依法积极配合公安机关调查，提供相关证据线索。网络生态的治理是一项长期工程。抖音相关负责人表示，平台将持续优化AI反网暴系统的技术能力，提升主动防护的覆盖率与精准度，同时不断迭代“抖音小安”等安全产品的服务功能，为用户提供更具人文关怀的守护。最后也呼吁广大网友：文明上网，理性发言，共同维护清朗的网络空间环境，这需要我们每一个人的努力。

来源：https://tech.huanqiu.com/article/4Rwr53hvgPN