Midjourney V5 在上周四终于上线了,而且一发布就引起了不小的轰动,因此这次 V5 模型的图像生成效果“太惊人了”,无限逼近真实照片,让人难辨真假。下面是我从 Midjourney 官方社区中收集的一些用 V5 模型生成的图像,大家可以先感受一下。
内容来源:Midjourney 官方社区 https://www.midjourney.com/app/
如果不事先告诉大家这些图像都是 V5 生成的,是不是很容易就认为它们就是摄影照片?从这些图像中我们很难看出之前 Midjourney 容易犯的错误,比如不自然的面部、错误的手部或四肢细节、头发衣物纠结吧不清、虚假不自然的光影细节等,一切都非常的自然和谐。
我特意用了同样的提示词和种子值在 V3/V4/V5 中各生成了一张图像,比较它们之间的不同,可以看出相比前面的版本,V5 无论是在人物形象、光影细节还是画面质量上都有明显进步,好像更能“理解”和“贴近”人们想要效果。
而且上面的对比图还体现了 V5 的一个重要的突破 —— Midjourney 好像会画手了。之前Controlnet 的出现让 Stable Diffusion 有了可以精准控制人体姿势和手部细节的能力,当时就有人说如果 Midjourney 不尽快跟进很可能会丧失竞争力,看来 Midjourney 也的确有意识到这一点。
内容来源: https://twitter.com/dreamingtulpa/status/1636123584174120960
但之所以加一个“好像”,是因为目前这个功能并不稳定。虽然不少网友都晒出自己用 V5 生成正常手部姿势的图像,但也仍然有一些不正常的结果,不知道是不是因为提示词使用不当的原因,不过总体来说还是比 V4 要好很多。
V5 在生成不同角度的手部姿势上有明显进步。图片来源: https://twitter.com
但是不稳定。图片来源: https://twitter.com/JoaoSan89/status/1636345950099718147/photo/1
除了上面两点,V5 对提示词的敏感度也比之前更高。生成的图像与提示词保持高度一致,减少了 AI 自由发挥的成分,让用户可以更好地控制画面细节。有网友发现 V5 可以非常逼真地表现出“玻璃上的反光”,这在之前是无法做到的。
V5 在后缀参数上也有一些调整,包括:
- 恢复了 V4 中被停用的 –tile 无缝纹理功能和 –iw 图片权重功能
- –ar 画面宽高比支持比1:2更大的数值,目前没有限制
- –s 风格化选项有了更好的表现,低风格化更接近摄影照片,高风格化有更强的艺术性,整体表现比 V4 更生动鲜明。
- V5 目前没有升频器 Upscaler,因为他默认的生成分辨率已经提升了2倍,和V4升频后是一样的,所以生成速度比之前慢了一些,点击 U 选项会立马发送给你已经生成的那张图片。
其中画面宽高比例的放宽让用户有了更自由的创意发挥空间,我们可以用它生成了一个突破天际的“千层汉堡”或,也可以用来生成和电影荧幕和全景图一样的超宽图片。
使用 midjourney V5 生成的全景图,图片来源: https://twitter.com/GuyP/status
使用 Midjourney V5 生成的超高图片,宽高比可以达到 1:5,图片来源:midjourney 官方社区
Midjourney V5 在生成质量和自由度上的全面提升,让我们看到了人类利用 AI 工具进行创意工作的更多可能性,官方在发布公告中表示 V5 目前只是一个 alpha 测试版本,在未来正式更新的时候会可能会有“完全不同”的表现,让人更加期待后续的更新了。
V5 模型的启用方式和之前一样,在提示词末尾加上 –v 5 参数,或者使用 /setting 命令开启 V5 模式,感兴趣的小伙伴赶快试一试吧~
Midjourney 官网: https://www.midjourney.com/ (需要魔法)
在 Midjourney V5 发布后没几天,Stable Diffusion 的开发公司 Stability AI 也宣布将推出一款名为 Stable Diffusion Reimagine 新功能。它是一个基于 Clipdrop 的新工具,可以让用户无限制地生成一张图片的多种变体。整个过程不需要复杂的提示,只需将一张上传图片,就可以创造外观相似但是构图和细节都不同的图像,此外还提供图像放大功能。Stable Diffusion Reimagine 已经加入 Clipdrop 全家桶,其模型将很快在 Stability AI 的 GitHub 上开源,
- Stable Diffusion Reimagine 主页: https://clipdrop.co/stable-diffusion-reimagine
- Stability AI Github 主页: https://github.com/Stability-AI/stablediffusion/
Stable Diffusion Reimagine 的官方示例
Clipdrop 是一家专注于用 AI 技术处理图像的公司,之前我也向大家介绍过该公司的产品,都非常实用,感兴趣的小伙伴可以点击下面的链接了解。Stability AI 在今年 3 月初收购了 Clipdrop,不到一个月的时间就推出了 Reimagine 新服务,可以看出 Stability AI 进一步扩充自己商业版图的野心。
以上就是近期两大最知名 AI 绘画工具 Midjourney 和 Stable Diffusion 的动态,不知道大家更看好谁的未来发展呢?