游乐游手机版
首页/AI教程/文章详情

AI告别鬼画符:快手可图与Ideogram文字生成谁更强

时间:2026-07-03 15:14
快手可图大模型正式开源,支持中英文文字生成。与国外应用Ideogram进行对比测试,可图在中文生成和人物逼真度方面显著优于Ideogram,而Ideogram仅支持英文且每日免费次数有限。两者生成速度相近,可图的开源策略更具生态优势。

最近,快手在AI领域确实势头强劲,备受关注。

AI告别鬼画符!快手可图和国外写字小能手Ideogram打擂台,谁更牛?

这边OpenAI的Sora还在公测的路上走走停停,那边快手已经直接将可灵视频生成模型端上了桌。凭借逼真、高清且视觉效果丝毫不逊于Sora的出色表现,可灵迅速成为全球网友的新宠。据快手官方公布的数据,可灵申请用户数已接近70万,目前已有超过30万用户亲身体验过。

趁着这股热乎劲儿,可灵的网页版也紧接着上线了。

于是,网友们开始脑洞大开,各种花式整活:

让蒙娜丽莎戴上墨镜:

看着容嬷嬷给紫薇喂鸡腿:

大胖橘端着高脚杯、翘着兰花指品红酒:

甚至还有人给肯德基来了一波“植入广告”:

不过,今天的主角不是可灵,而是快手的另一款明星产品——可图

在不久前结束的2024世界人工智能大会上,快手宣布其自研的文生图大模型“可图”正式开源。目前,模型权重和完整代码已经在Huggingface和GitHub上发布,面向个人开发者免费开放。

对于技术小白来说,想尝鲜的话,直接登录可灵网页版,使用“AI图片”功能就行。

-1-

实测:能写汉字、英文,还能一键生成视频

别看大模型现在能说会道,但就在不久前,它们还是个“文盲”。不管是汉字还是英文,AI生成出来的文字,十有八九都是“鬼画符”。

比如这样:

或者这样:

而可图大模型,不仅能够驾驭丰富的细节、实现多种风格转换,它最大的亮点其实是——会写字

官方介绍,可图支持中英文双语输出,生成效果已经能和Midjourney-v6掰掰手腕了,并且真正具备中英文文字生成能力。为了理解中文语义,快手还专门用数十亿中文语料训练了一个强大的中文CLIP模型。

使用起来也很直观。

打开可灵网页版,进入操作界面后选择“AI图片”,输入提示词、调整尺寸或者上传参考图就行。值得一提的是,可图支持最长256个字符的文本输入。

文生图功能

比如,输入提示词:“复古摄影写真,80年代的MTV风格,多巴胺的色彩装饰,背景是室内复古电视,电视中写着中文‘机器之能’,一把绑着粉色蝴蝶结的叉子,一个草莓蛋糕,电视广告,80年代流行文化,柔光。”

提示词:“可爱的蜥蜴,穿着环卫工的衣服,一只手拿着拖把一只手拿着水桶。角色扮演游戏,色彩鲜艳,对比度高,印刷纹理。特写摄影,具有表现力的姿势,柔和的彩色背景。”

图生图功能

可图还能实现“图生图”,上传一张参考图,输入提示词即可。

最终生成效果如下:

因为搭载在可灵网页版上,可图还能直接把生成的图片拿来做图生图。

例如,输入提示词:“毛毡艺术,高清,毛毡材质,高级滤镜,可爱,卡通,羊毛毡娃娃,名画,梵高的自画像。”

十几秒就能得到下面这个效果:

接着点击生成的图片上的“垫图”,就能使用参考图功能。再输入提示词:“小羊抱着一束玫瑰花”,设置好参数,就能生成新图。

效果如下:

图生视频

图生视频功能的玩法也一样。

输入提示词:“武林高手故宫猫,几只故宫猫穿着白色、红色、黄色练功服,正在表演武术,美学造型,完美光影。”

然后在生成的图片上点击“生成视频”,就能进入图生视频界面。再输入提示词、负向提示词,设置好参数,等着系统生成就完了。

以下是生成的视频效果:

-2-

快手可图单挑Ideogram:狭路相逢谁更勇?

有意思的是,国外也有一款擅长写字的AI文生图应用——Ideogram。这款应用曾被称作Midjourney和Stable Diffusion的“劲敌”,由前谷歌工程师创立、硅谷AI大神投资,去年8月上线,今年2月底又发布了最新的模型。

Ideogram打出的招牌就是“能生成各式字体”,这一点恰好和快手可图的亮点撞了个满怀。

需要注意的是,无论是快手可图还是Ideogram,要想在图片里生成自定义文本,都得在提示词里加上一段“咒语”。

快手可图的咒语是:写着中文「xxxx」。

Ideogram的咒语:With the text 「xxxx」,风格选中「typography(排版)」。

这样,就能生成带指定文字的图片了。

接下来,双方同台PK,结果如何?

Round 1:写字能力

【写中文】提示词:一只卡通小狗,身上挂着一个木牌,上面写着“可爱”两个字。

快手可图:

Ideogram:

【写英文】提示词:一个生日蛋糕,上面插着生日蜡烛,写着“Happy Birthday”。

快手可图:

Ideogram:

Round 2:多样风格

提示词:摄影人像,写真,东方面孔的羊毛卷长发美女,穿着复古的服装,鲜花点缀在头发上面,高级滤镜,复古,蓝色背景。

快手可图:

Ideogram:

提示词:卡通插画,一个咖啡店内,一个东方面孔的女孩坐在窗边的位置写作,桌子上有咖啡、书本和花朵,c4d,oc渲染,逼真细节,超高清,8k,完美构图,电影灯光,浪漫温馨的画面,甜美。

快手可图:

Ideogram:

提示词:纯黄色背景上排列着一些夏堇和绿叶,菲尔・科赫风格,水滴,浪漫场景,颗粒感,重复。

快手可图:

Ideogram:

经过多轮测评,结论是两者各有千秋。

快手可图在中文生成上确实惊艳,基本告别了“鬼画符”,英文也能写,不过偶尔会写错字。而Ideogram只懂英文,对中文一窍不通。

从生成风格来看,Ideogram提供了18种风格可选,快手可图则只能根据提示词里的描述来生成。不过,作为中国人自己的绘图模型,可图在逼真度上更胜一筹,尤其是在人物特写上。Ideogram毕竟是国外产品,生成的东方女子要么带着外国人的影子,要么就是不太好看。

生成速度方面,两者相差不大,十几秒就能出图。快手可图每次可调整生成图片的数量,最多9张;Ideogram每次固定生成4张。

最关键的一点是,目前快手可图依然是免费的,而Ideogram每天只有10次免费生成机会。

-3-

「一战成名」的快手

这段时间,快手在AI上可以说是真金白银、闷声干大事。

别看此前不显山不露水,一出手就惊艳四座。先是对标Sora的AI视频生成应用可灵一战成名,接着AI生图模型可图广受好评,最近开源的那个擅长挤眉弄眼的LivePortrait模型,更是火遍了国内外。

其实,快手的AI布局远不止这些。

比如,在百模大战时,快手推出了自家的大模型——快意大模型;当Suno引领的AI音乐生成热潮席卷而来时,快手加码了旗下的K歌APP回森,推出了AI美音功能。此外,还有AI剪辑应用快剪、AI特效创作产品必扬、AI社交应用快崽,以及嵌在快手短视频APP里的AI玩评功能等。

不得不说,曾经带着“土味”标签的快手,在AI的加持下,如今显得高端了不少。

不过,考虑到AI圈这日新月异的迭代速度,快手的AI之路,还得步履不停地走下去。

来源:https://www.aiagiai.com/1689.html
上一篇从AIoT到GenAIoT 人工智能驱动消费物联网进入新阶段 下一篇三星折叠屏新机上手体验:更轻更薄,AI成杀手锏
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
批处理BAT入门教程第一篇
AI教程 · 2026-07-03

批处理BAT入门教程第一篇

提供13个批处理实战技巧,覆盖全盘查找并删除文件夹或文件、拷贝移动文件、创建畸形文件夹及设置隐藏属性等场景,可一键完成系统维护与文件管理工作,极大提升自动化操作效率和便捷性。

从零开始批处理命令For循环详解与实战案例
AI教程 · 2026-07-03

从零开始批处理命令For循环详解与实战案例

批处理For命令支持 d、 l、 r、 f四个参数。 d仅列出当前目录下的目录名; r递归搜索指定路径及其子目录中的文件; l生成数值序列; f可解析文件、字符串或命令输出,通过delims、tokens、skip、eol等选项灵活处理内容。

批评你的人是你生命中的贵人
AI教程 · 2026-07-03

批评你的人是你生命中的贵人

批评你的人往往最值得珍惜,因为他们关注你、助你成长。面对批评应包容反思,用行动改进而非辩解。接受批评是自我完善的过程,能让人少走弯路,避免重复犯错。这样的人正是生命中的贵人,值得感恩与珍惜。

测试人员角色定位与职责详解
AI教程 · 2026-07-03

测试人员角色定位与职责详解

测试人员角色经历了从找问题、保证质量到分析风险的转变,最终核心职责是提供关键信息,协助团队创造优秀产品。这包括识别问题、评估风险及帮助团队了解项目状态,而非单纯把关或追求完美。

经营成功测试生涯的实用方法与策略
AI教程 · 2026-07-03

经营成功测试生涯的实用方法与策略

一、测试生涯的起点 1989年,我在田纳西大学攻读研究生时,意外地从软件开发人员转行成为一名软件测试工程师。这并非我主动选择,说起来还有些戏剧性——某个早晨,教授质问我为何缺席那么多开发会议,我解释说这些会议总是安排在周末早上,对我这个第一次离家、刚入学的学生来说实在不便。结果呢?等待我的不是解聘通