最新AI文生图模型Flux1.1一经发布便迅速刷屏网络,引发广泛热议。
只需掌握一个简单技巧,即可有效去除图像中的“AI感”,无论是人物肖像还是自然风景,都能呈现出媲美真实照片的视觉效果。

网友在评论区纷纷感叹:“我分不清,真的分不清啊!”

该技巧的操作极为简便:只需在提示词中模仿单反相机的文件命名格式即可。
例如,“CR2”是佳能相机常用的原始图像文件格式。只需输入“IMG”后跟随机编号和“.CR2”,再搭配指定的描述内容,即可生成一张高度写实的图像。

随后,陆续有尝试过的网友反馈,换成索尼相机的“ARW”、尼康相机的“NEF”甚至苹果的“HEIC”格式,同样能获得令人满意的写实效果。

以至于有人开始怀疑:会不会是模型随机从训练数据中吐出了一张真实照片?

不过放大查看某些特定细节,仍能轻易判断出确实是AI生成的——例如车牌号上的文字都是乱码。

那么Flux1.1模型本身的能力究竟如何?这个技巧到底发挥了多大作用?一位资深修图师傅晒出了对比图:左边加了“IMG_1018.CR2”,右边没有加,他认为两者差异巨大。


实测结果也表明,加上这个技巧能显著提升画面的真实感。
现在想免费体验Flux1.1模型,可以前往together.ai平台,注册即送5美元积分。

随意生成一张长城上的游客自拍照,乍一看似乎像模像样,但仔细观察人物皮肤质感、背景山体和植物,一股AI感依然挥之不去。

换成“IMG_0314.cr2: selfie on The Great Wall”呢?效果是不是立刻大不一样?

01 代号蓝莓,最新SOTA文生图模型
随着FLUX1.1正式发布,此前在文生图模型排行榜上屡占榜首、但无人认领的两个“蓝莓”模型,神秘面纱也被揭开——正是它。

官方不再隐藏,直接亮出数据。在Artificial Analysis image arena上,FLUX1.1 [pro]以“blueberry”为代号,超越所有其他模型,获得了最高的整体Elo评分。

相比之下,FLUX1.1 [pro]价格更低、速度更快,各项指标全面超越Midjourney、SD3、Ideogram等一众竞品。


在生成速度上,FLUX1.1 [pro]在保持图像质量、指令响应和多样性提升的同时,速度达到前代FLUX.1 [pro]的6倍。
顺便一提,当前FLUX.1 [pro]也已更新,速度是原来的2倍;而FLUX1.1 [pro]的速度是目前可用FLUX.1 [pro]的3倍。
此外,官方表示即将推出快速高分辨率生成功能,FLUX1.1 [pro]可原生支持,在不牺牲任何指令响应的情况下生成2K图像。
FLUX1.1 [pro]将通过Together.ai、Replicate、fal.ai、Freepik等在线平台提供。
同时官方还推出了BFL API,供其他开发者集成到自己的应用程序中。API定价如下:
FLUX.1 [dev]:每张图2.5美分(约RMB 0.18元)
FLUX.1 [pro]:每张图5美分(约RMB 0.35元)
FLUX1.1 [pro]:每张图4美分(约RMB 0.28元)
02 Stable Diffusion原班人马打造
FLUX1.1 [pro]的背后,正是Stable Diffusion原团队,成员包括Robin Rombach、Andreas Blattmann、Dominik Lorenz等人。

实际上,Stable Diffusion最初是一个学术研究项目。由Björn Ommer教授领衔,Robin Rombach、Andreas Blattmann、Dominik Lorenz等几位慕尼黑大学机器视觉与学习研究小组成员,以及Runway的研究人员Patrick Esser共同完成。

研究论文发表七个月后,Stability AI开始介入并提供计算资源,以进一步开发文本到图像生成模型。2022年,上述几位论文作者加入Stability AI,团队一同创建了Stable Diffusion XL、Stable Video Diffusion等产品。
ICML 2024最佳论文之一——Stable Diffusion 3技术论文的Rectified Flow Transformers,以及SDXL-Turbo使用的对抗扩散蒸馏方法(Adversarial Diffusion Distillation),也出自这些人之手。
今年三月份,这些核心研究团队成员被曝集体辞职。随后,他们组成了新团队,名为Black Forest Labs(黑森林实验室),总部位于德国。

今年8月初,团队刚刚宣布成立,并发布了初代文生图模型FLUX.1。FLUX.1有三个变体:FLUX.1 [pro]、FLUX.1 [dev]和FLUX.1 [schnell],在性能与可访问性之间取得了平衡。

目前黑森林实验室已完成种子轮融资,共融资3100万美元,由Andreessen Horowitz领投,Brendan Iribe、Michael Ovitz、Garry Tan、Timo Aila和Vladlen Koltun等跟投。据称他们还已收到General Catalyst、MätchVC的后续投资。
黑森林实验室也与马斯克合作,将其图像生成模型引入xAI的Grok助手中。
接下来,团队透露将推出SOTA级文本到视频生成模型。消息称,他们正在以10亿美元估值筹集1亿美元资金,相比此前1.5亿美元的估值大幅上涨。
从Pika 1.5到Meta Movie Gen,今年下半场视频生成赛道爆火,黑森林实验室的加入,或将带来不一样的火花。
