引语
V1、V2、V3、V4、V5我们都用相同的 Prompt 来看看各版本的差异,目前使用的是官方案例里的 prompt:vibrant California poppies
从上图里你就能看到 midjourney 的进化方向:
越来越丰富的细节:生成的内容也越来越真实。V1 和 V2 基本上就是简笔画,看看 V2 第四张图前景和背景的处理就很粗暴,到了 V3 背景和透视都变得更加合理,然后到了 V4 基本就是一个可用的状态。
分辨率越来越高。V1~V3 单张图是 256 x 256,到了 V5 单图已经默认是 1024*1024。
参数更多,Prompt 更加重要:这个在 V5 版本更加明显,感觉以前的版本,并不太能理解一些词,比如材料词 marble 之类的。但到了 V5 理解能力变强了。
艺术风格词变得更重要:这个结论暂时没有得到官方的认证,甚至有很多人认为 V5 版本是个更「通用」的版本,我的理解是 V5 提高了整个基准线,不需要太多描述词,就能生成一个「可以看」的图片,但如果要生成一张你跟你预期完全一致的图,其实变难了,你需要了解更多的 prompt。
然后我们再来看看更复杂的 prompt 看看版本的差异:21years chinese girl, in school, beauty, long black hair, sun light,insane detail, smooth light, real photography fujifilm superia, full HD, taken on a Canon EOS R5 F1.2 ISO100 35MM,看看生成的结果,是不是差距非常大,从 V1 到 V5 的进化,Midjourney 大约花了 1 年的时间,如果仅算研发时间,我觉得应该不到 1 年,非常了不起: