你是否曾在评论区遇到过“到七天了吗”这类看似平常的询问?它表面是简单提问,背后却可能隐藏着一场针对特定网购用户的、有组织的无声围猎。如今的网络暴力早已改头换面,不再局限于直接的辱骂,而是演变为利用表情包进行阴阳怪气、借助谐音梗进行人身攻击、通过断章取义来带节奏——这种更具隐蔽性的恶意,往往让传统的审核机制难以有效识别。更为严峻的是,许多伤害来自长期、零散的持续性骚扰,这些看似微小的恶意累积起来,足以对当事人的心理与精神状态造成沉重打击。
正是为了应对这一日益复杂的挑战,抖音平台近期升级并推出了一套系统化的AI反网暴举措,其核心是一套名为“AI反网暴Agent”的智能系统。该系统让AI识别模型、研判模型与人工审核协同作业,并同步优化了外呼救助流程。从早期风险识别、事件综合研判,到主动干预治理、启动外呼援助,平台构建了一个完整的反网暴处置链条。这标志着平台治理思路的重要转变:从过去“被动等待用户举报”转向如今“主动发现并预警风险”。
成效数据颇为显著:系统升级后,平台日均识别出的潜在网暴风险用户数量提升了91.5%,每日有数千名收到风险预警的用户主动开启了评论过滤等防护功能;因风险等级较高而获得人工外呼主动援助的受害者数量,更是增长了147%。
变被动为主动:平台提前识别网暴风险信号
传统的“人工审核+用户举报”后处置模式,已难以匹配当下多变、隐蔽的网络暴力形态。其一,依赖举报往往意味着伤害已然发生,无法实现事前预警与防范;其二,常规审核通常只能覆盖短时间内的内容,容易遗漏那些持续时间长、跨越多个热点周期的持续性攻击,更难以根据不同用户群体的心理承受能力进行差异化判断——对成年网民可能无伤大雅的“玩梗”,对青少年群体而言可能就是巨大的心理负担。

升级后的AI反网暴Agent系统,通过让识别模型与研判模型协同运作,能够在网暴风险发酵的早期阶段就捕捉到异常信号。识别模型不再孤立地分析单条评论的关键词,而是综合评估用户的整体互动态势——当某用户的评论区突然涌入大量负面言论、其主页被频繁访问、或@该用户的异常信息激增时,系统便会启动计算,生成该用户的“网暴风险指数”。更为智能的是,系统具备持续学习能力,能全天候复盘误判案例,自主学习新兴的网暴话术与手段,即便是刚流行的新梗攻击也能快速识别,有效堵截恶意规避审核的行为。
研判模型则赋予平台更宏观的“事件视角”,进行全局分析。它整合用户近30天内的文字、图片、视频及音频等多模态互动数据,致力于还原事件的全貌与脉络,从而精准区分正常的观点交锋与恶意的攻击围猎,最大限度避免误伤,保障健康的讨论氛围。针对未成年人、老年人等需要特殊保护的群体,模型还设置了差异化的识别标准,适度提升风险敏感度。其最终输出的研判报告清晰包含事件经过、风险源头、关键证据链等信息,极大提升了人工审核专家介入处置的效率,为及时开展外呼救助争取了宝贵时间。
分层保护与精准响应:为受害者构建支持网络
基于AI反网暴Agent提供的精准识别与研判结论,平台已建立起一套更精细、更人性化的分层保护与响应机制。对于低风险用户,平台主要通过App站内信进行提醒,用户可一键启用“防网暴模式”,开启评论过滤、限制陌生人私信等功能;对于高风险用户,或经识别属于未成年人等特殊保护群体的,平台则会主动通过智能外呼电话联系用户,并安排专人对受害者提供一对一协助,同时排查是否存在个人信息泄露等衍生风险,防止侵害影响进一步扩大。

在施暴者处置方面,平台依据违规情节的严重程度,采取阶梯式管理措施:包括但不限于下架违规内容、限制互动功能直至永久封禁账号。对于组织化、跨账号持续骚扰等情节恶劣的行为,平台将启用更严厉的升级处置方案;如涉嫌违法犯罪,平台将依法积极配合公安机关调查,提供相关证据线索。网络生态的治理是一项长期工程。抖音相关负责人表示,平台将持续优化AI反网暴系统的技术能力,提升主动防护的覆盖率与精准度,同时不断迭代“抖音小安”等安全产品的服务功能,为用户提供更具人文关怀的守护。最后也呼吁广大网友:文明上网,理性发言,共同维护清朗的网络空间环境,这需要我们每一个人的努力。
