一周AI大事件速览:5分钟掌握最新动态

体验完Vidu划时代的新功能,我觉得可以正式抛弃3D渲染了
最近在社交媒体上,一款2D动漫风格的AI生成视频引起了广泛关注,其表现力让人印象深刻。这也引出了本周AI领域的一系列重要更新,从全民级应用到专业工具,进展频频。
微信公众平台:AI音色克隆功能灰度测试
11月18日,微信公众平台悄然上线了一项AI音色克隆功能。该功能旨在模仿公众号作者的音色,为读者提供更具个人特色的文章朗读体验。
这实际上是“听全文”功能的升级。此前,该功能一直使用通用的机械男声。目前,新功能仍处于灰度测试阶段,仅对部分公众号开放。
用户可尝试更新“订阅号助手”APP至2.29.1版本,在设置中查看是否出现“朗读音色”选项。若未出现,则表明暂未获得测试资格。因此,当前点击文章内的“听全文”,听到的仍是标准机械音。
在各大平台AI功能激烈竞争的背景下,微信的步调显得尤为谨慎。正如行业观察者所言,微信作为国民级应用,其AI功能的每一次普及,都意味着技术更深一步地融入普通人的日常生活,其带来的影响将是广泛而深远的。
Suno:V4模型发布,音质显著提升
11月20日,AI音乐生成平台Suno发布了其最新的V4模型。此次更新重点在于音质优化,生成的音乐在清晰度和细腻度上均有明显进步。
一个突出的新功能是“Remaster”,能够对旧版模型生成的音乐进行音质升级。通过对比可以直观感受到差异:
Rainy Funk(V3模型生成):
Rainy Funk(V4模型生成):
可以听出,V4模型生成的音乐穿透力更强,细节更清晰。目前,V4模型仅面向订阅会员开放。普通用户若想体验其效果,可前往Suno官网聆听其他用户创作的音乐。
Suno成立于2022年,是一款强大的文本生成音乐工具,支持包括中文在内的多种风格,被誉为音乐界的“ChatGPT”,目前在领域内优势明显。对于影视从业者而言,它是生成背景音乐和音效的利器,订阅用户还可将生成内容用于商业场景,规避版权风险。普通用户每日享有50积分,约可生成10首歌曲。
Glif:新功能实现Logo与产品的惊艳融合
同样是11月20日,创意工具Glif上线了一项新功能,能够将任何Logo自然地“贴”到各类周边产品上,效果相当惊艳。
例如,上传小米Logo后,输入提示词“Silver can with water droplets”(带有水滴的银罐),即可生成Logo印在易拉罐上的图像。上传霸王茶姬Logo,输入“White T-shirt”(白色T恤),也能准确生成对应效果,甚至对中文提示词也有良好识别。
尝试将微信Logo“戴”在帽子上,输入“Black baseball cap”(黑色棒球帽),效果同样出色。
该功能基于阿里巴巴通义实验室推出的In-Context LoRA模型。该模型使用Flux算法训练,能在图像生成中保持人物、场景和风格的一致性,适用场景广泛。目前官方已开源10个针对不同场景的LoRA模型,用户可下载并在ComfyUI的Flux工作流中使用。
黑森林实验室:发布FLUX.1 Tools套件
11月21日,Black Forest Labs团队发布了FLUX.1 Tools,这是一套旨在增强FLUX.1模型控制和操作性的新模型。本次发布包含三个核心功能模型:
1. FLUX.1 Fill:用于修复与扩展
该模型提供了先进的修复(inpainting)功能,允许对图像进行无缝编辑,并能自然融入现有画面。此外,它还支持图像扩展(outpainting),可将画布延伸到原始边界之外。
2. FLUX.1 Canny / Depth:用于结构控制
通过边缘检测(Canny)或深度图(Depth)进行结构调节,能在文本引导的图像转换过程中,精确保持原始图像的构图与结构。该模型提供完整版和基于FLUX.1 [dev]的LoRA版本供选择。
3. FLUX.1 Redux:用于图像变体与重设计
这是一个适用于所有FLUX.1基础模型的适配器,用于生成图像变体。给定输入图像,它可以生成具有细微变化的版本,便于图像细化。结合提示词,可实现图像风格的重新设计。最新型号FLUX1.1 [pro] Ultra已支持此功能。
与此同时,ComfyUI官方已宣布支持这套新工具,包括Redux Adapter、Fill Model、ControlNet Models及相关LoRA。
InstantX团队:开源Flux IPadapter模型
11月22日,InstantX团队训练的Flux IPadapter模型正式开源。IP-Adapter的主要功能是通过图像提示来生成新图像,能够有效复制参考图像的风格、构图或人物特征。这为基于Flux架构的图像风格迁移与一致性生成提供了新的工具选择。
可灵AI:1.5模型功能升级,商业化势头迅猛
11月22日,可灵(Kling)AI视频模型升级至1.5版本,新增多项实用功能。
运动笔刷:在图生视频的高品质模式下,用户可使用笔刷工具涂抹图片中的特定元素(最多6个),并指定静止区域,从而实现对视频运动的精细控制。该功能支持横屏、竖屏、方屏等多种图片比例,可生成5秒视频。
运镜控制:同样在图生视频的高品质模式下,用户可设置六种运镜方式,包括水平/垂直移动、拉远/推进、水平/垂直摇镜以及旋转,生成带专业运镜效果的5秒视频。
人脸定制模型:用户可上传多段高清视频素材,训练专属的人脸模型,进而生成保持该人物一致性的视频。该功能目前面向钻石和铂金会员开放。
自今年6月发布以来,可灵AI发展迅速,用户数已超500万,累计生成视频超5100万个、图片超1.5亿张。其商业化进程同样亮眼,单月流水已突破千万元,展现出强劲的增长势头,已成为AI视频生成领域不可忽视的竞争者。
结语
以上便是本周值得关注的AI行业动态精选。从基础设施到应用创新,从音视频生成到图像控制,整个生态正在以惊人的速度迭代。选择以精简且有深度的方式呈现这些资讯,是希望能帮助读者在有限时间内,高效把握行业发展的关键脉搏。未来,这种信息过载与高效获取之间的矛盾将愈发突出,而筛选与解读的价值也将随之凸显。
相关攻略
MasterBOT(BOT)是一个融合人工智能(AI)、Web3 和机器人技术的创新项目,旨在通过去中心化的方式训练下一代机器人智能。其核心机制是利用虚拟仿真环境进行 AI 模型训练,并通过社区参与的预测市场进行激励。 MasterBOT(BOT)简介 简单来说,MasterBOT 构建在 Sola
在人工智能技术深度赋能各行业的当下,智能写作工具正迎来关键性演进。作为一款前沿的AI写作助手,Compose AI凭借其独特的设计思路与技术架构,在众多工具中脱颖而出。它不仅仅提供基础的文本补全功能,更致力于深入理解每位用户的个人表达习惯,并结合上下文语义,为写作者提供从用词、句式到篇章结构的全方位
「今天天汽真不错。」 看到这条消息,你大概会笑作者打字太不走心,但绝不会怀疑这是AI写的。原因很简单,AI生成的文案或许越来越工整,却总缺了那么点“人味儿”;反倒是真正的人类输入,还保留着手滑、分心和没来得及检查的鲜活痕迹。 不知不觉间,错别字这种曾经的瑕疵,竟成了验明“人类正身”的防伪标签。 为了
近日,李飞飞团队发布的ESI-Bench(具身空间智能基准)在人工智能领域引发了广泛关注。这一基准被许多研究者视为具身智能发展的里程碑,它系统性地揭示了当前最先进的大语言模型在理解和交互物理空间时存在的核心瓶颈。 3 元认知缺陷:AI缺乏自知之明 这或许揭示了人类智能与当前人工智能之间最根本的差异
近期,职场社交平台领英(LinkedIn)展开了一项备受关注的专项治理行动:全面清理平台上由AI生成的低质“水文”。随着ChatGPT等生成式AI工具的广泛应用,不少用户开始批量生产内容,导致平台涌现大量观点雷同、缺乏深度洞察的“正确的废话”,这不仅严重影响了用户的阅读体验,也损害了社区的内容生态与
热门专题
热门推荐
个性化学习已进入“动作”定制时代,系统通过动态分析学生数据构建个人知识图谱,实时规划学习路径、讲解方式与复习节奏。例如针对错题追溯前置薄弱点并调整讲解方法,实现从结果纠错到过程归因的转变,使大规模因材施教成为可执行、可量化的科学实践。
2025年,河北信息通信行业交出了一份令人瞩目的高质量发展答卷。核心发展指标持续领跑全国,稳居第一梯队,行业竞争优势与领先地位得到全面巩固,为河北省经济社会数字化转型构筑了坚实可靠的数字基石。 这份优异成绩,首先得益于信息基础设施的跨越式升级。全年行业固定资产投资完成115 2亿元,规模位列全国第九
北京时间2026年5月25日凌晨,中国空间站迎来又一里程碑时刻。神舟二十三号载人飞船经过约3 5小时的快速交会对接,于2时45分精准对接于天和核心舱的径向对接口。 对接约2 5小时后,舱门顺利开启。已在轨长期驻留的神舟二十一号乘组航天员,热情迎接了新战友入驻。此次“天宫会师”具有双重重要意义:它不仅
竖屏SLG手游《三国计》近期开启限时测试。其竖屏设计降低了操作门槛,便于单手游玩,同时保持了紧凑的界面布局与策略深度。玩家扮演乱世诸侯,目标是从生存壮大到问鼎中原。新手期建议紧跟主线任务,以解锁武将、兵种、科技等核心系统,并获取关键资源平稳度过开荒阶段。
一场历时四年、牵动全球游戏与科技界目光的动视暴雪股东集体诉讼案,迎来关键性进展。微软同意支付高达2 5亿美元的和解金,与提起诉讼的股东达成和解,为这场旷日持久的法律纠纷画上了阶段性句号。 根据2026年5月下旬于美国特拉华州衡平法院披露的和解协议文件,这笔巨额资金将用于赔偿在特定时间段内持有动视暴雪





