贺年卡中的尖端AI技术应用与原理详解
农历新春将至,一年一度的“拜年文学大赛”又要拉开帷幕了。
每到这个时候,五花八门的拜年祝福就开始争奇斗艳。想要文辞优美、别出心裁,已经让不少人绞尽脑汁;如果再想配上一幅既原创又有新意的精美图片,那更是每年都让人头疼的难题。
不过,那些往年“卷”得飞起的拜年消息,如今只需要输入几句简单的话,就能轻松搞定。这背后,自然是AIGC技术带来的重大改变。
上面这张由智谱AI生成的贺年卡,不仅制作起来不费什么功夫,还包含了一段年味十足的祝福语和一张精美的图片。如果愿意,甚至还能附上一首贺岁诗词。乍一看或许平平无奇,但实际上,它可是集中体现了多项尖端的AIGC技术。
先说说每年最让人头疼的祝福语。在这张卡片上,仅仅通过几句简单的引导语,由清华大学KEG实验室和智谱AI研发的开放问答机器人“小呆”(XDAI),就能生成一段质量相当高的祝福文字,甚至还能做到押韵。
但这还远不是XDAI最厉害的地方。短短祝福语的背后,“小呆”具备的是能够进行有逻辑、有内容对话的硬实力。
大规模预训练语言模型(PLM)近年来的进展有目共睹,尤其是ChatGPT的横空出世,更是为PLM圈粉无数,吸引了海量关注。然而,也有学者注意到,基于大模型构建知识对话系统、实现知识资源整合并根据任务进行调优,对于个人开发者而言成本实在太高。这无疑抬高了技术落地的门槛,将一大批有兴趣的开发者挡在了门外。
XDAI的提出,正是为了解决上述困境。它的目标,是让开发人员无需进行复杂的微调,就能利用PLM快速创建一个开放域对话系统,并且可以通过设计不同的Prompt(引导语),来定制自己特定领域的系统。
这也是XDAI最核心的能力。它不仅能借此生成充满年味的文字,还能通过设计不同的Prompt,来调整“小呆”的“人设”甚至“性格”,从而打造出愤怒版、抑郁版、暖心版等不同风格的“小呆”。
说回这张贺年卡。如果你觉得“小呆”生成的文字还不够有诗意,可以呼叫“悟能”来帮忙写首诗。“悟能作诗”是智谱AI在PLM基础上开发的一个AI作诗平台。
在原始的PLM中,模型虽然已经能生成不错的文字内容,但往往缺乏对问题主题的专注。在对话场景下,这个弱点或许瑕不掩瑜;但在诗歌创作上,偏离主题可是相当致命的。
于是,开发者想到了使用“逆向提示”(Inverse Prompting)的方法来规避这个弱点——利用生成的文本来复原给定的标题,通过对生成语句进行打分,配合集束搜索(Beam Search)算法,每生成一个短句就进行一次评分,并保留分数最高的内容。
运用这个方法,“悟能”能够学习自己生成的内容,为自己打分,并以此进行微调,从而不断强化自身的作诗能力。在“悟能作诗”平台上,以“新年”为关键词,并限定“悲伤”的情绪,最终生成的结果如下:
新年
【悟道】 风格: 李白(唐)
圣历初开岁 云山半老时
七轮才偃月 九陌乱填丝
曙角分龙节 寒尘敛隼旗
元宵几处玩 禁火夜弥迟
最后,再来看看这张贺年卡背后的图片生成技术——CogView。
CogView的算法框架主要分为VQ-VAE和Transformer两部分,通过对图像和文本进行大规模生成式联合预训练来实现。具体来说,先使用VQ-VAE将图像压缩成离散的Token,再将其输入Transformer进行生成训练;反过来,也可以依据Transformer输出的Token来生成图像。
在文字、诗歌、图片生成这几个领域,AIGC都扮演了至关重要的角色。而无论是“小呆”、“悟能”还是CogView,其背后都有一个共同的身影——大规模语言预训练模型GLM-130B。
这个由清华大学计算机系KEG实验室和智谱AI开发的开源双语大模型,在此前的一些基准测试中,表现甚至超过了OpenAI的GPT-3和谷歌的PaLM。更重要的是,它以开源的形式发布,作为开源大模型领域的中国力量,正在普惠更广大的使用者。
一张小小的贺年卡,背后是一个开源大模型的支撑,以及三项AIGC尖端技术的融合。或许在未来,AIGC技术真的会给一年一度的“拜年文学大赛”画上一个句点。
相关攻略
2022年11月10日,在全球元宇宙大会“数字人技术与应用场景”分论坛上,一项重要的战略合作正式揭晓。长期深耕创作者经济的A股上市公司万兴科技,与数字人技术领先企业优链时代达成深度合作。双方将充分整合万兴科技在视频创意软件领域的优势与优链时代在3D数字人领域的核心技术,共同致力于构建一个开放、创新的
农历新春将至,一年一度的“拜年文学大赛”又要拉开帷幕了。 每到这个时候,五花八门的拜年祝福就开始争奇斗艳。想要文辞优美、别出心裁,已经让不少人绞尽脑汁;如果再想配上一幅既原创又有新意的精美图片,那更是每年都让人头疼的难题。 不过,那些往年“卷”得飞起的拜年消息,如今只需要输入几句简单的话,就能轻松搞
作者注:本文最早发表于2023年3月,当时AI大模型的发展远未及今日,因此文中部分观点在今天看来或许显得激进。如今,我们不得不承认,AIGC成为内容产业核心力量的可能性是真实存在的,不容忽视。 不过,文章的核心论点并未过时:AIGC的普及,很可能加剧内容产业分配的不平衡,让少数顶尖创作者拿走更大的蛋
中国AIGC产业峰会将于5月20日在北京举行。峰会汇聚商汤科技、MiniMax、京东等企业嘉宾,聚焦AI技术落地与商业价值,探讨Agent、AI内容创作等热门议题。现场将发布年度AIGC企业产品榜单及AI应用全景图谱报告,并提供线上直播。
2026年4月15日,一部名为《秦岭青铜诡事录》的短剧正式上线播出。这部剧集的独特之处在于,其两位主演并非真人演员,而是由耀客传媒自主研发的AI数字人演员。这标志着AIGC技术在国产影视剧制作中的应用,实现了从“辅助工具”到“内容主体”的关键跨越。 该剧剧情充满奇幻悬疑元素,核心故事围绕秦岭矿区一桩
热门专题
热门推荐
在麒麟操作系统上配置SSH公钥登录,不仅能免去每次输入密码的繁琐,更能显著增强远程连接的安全性。整个过程并不复杂,核心步骤围绕密钥生成、公钥部署和服务端配置展开。本文将详细介绍几种主流方法,涵盖从自动化部署到手动配置,助你轻松完成麒麟系统SSH密钥登录设置。 一、使用ssh-keygen与ssh-c
登录循环闪退应先删 Xauthority和 ICEauthority文件、修复 tmp权限为1777、重置ukui mate dconf配置、清理磁盘空间、重装lightdm并重新配置。 在银河麒麟操作系统中输入密码后,屏幕一闪又回到登录界面,这种“登录循环”问题确实令人困扰。这通常并非硬件故障,而
GUSD是一种与美元1:1锚定的合规稳定币,由Gemini交易所发行并受纽约州金融服务部监管。其核心价值在于为加密世界提供透明、受监管的美元等价物,主要应用于交易、支付和价值存储。投资者需关注其中心化托管风险、监管政策变化及智能合约潜在漏洞,理解其作为传统金融与加密市场桥梁的定位与局限。
在Windows 11系统中,确保系统音频稳定输出到指定设备(如已连接的耳机或已配对的蓝牙音箱),核心在于正确配置默认音频输出设备。您可以通过任务栏快速设置、系统设置应用、控制面板声音对话框、音量混合器下拉菜单或Win+Ctrl+V快捷键这五种主流方案,实现即时切换或永久性配置,彻底解决声音输出错乱
宏胜集团近期发生重要人事与业务调整。总裁办主任叶雅琼、销售总经理吴汀燕、法务部部长周卓盈及生产管理科科长吴潘潘等多位高管已离职,该消息已获接近集团人士证实。与此同时,集团启动了部分非生产业务的外包运作,显示出其正在优化内部结构与运营模式。这一系列变动可能意味着公司正处于战略调整期,旨在聚焦核心业务并





